Znany programista po sześciu miesiącach testów twierdzi, że modele językowe jedynie naśladują kod statystycznie, generując subtelne błędy trudne do wykrycia.

Źródło zdjęcia: The Decoder
George Hotz, znany programista i haker, ostrzega przed wykorzystaniem agentów AI w tworzeniu oprogramowania, nazywając to jednym z najkosztowniejszych błędów w historii branży. Po sześciu miesiącach testów różnych modeli i narzędzi, w tym pracy nad projektem tinygrad, doszedł do wniosku, że duże modele językowe mogą przynieść więcej szkody niż pożytku w programowaniu. Swoje stanowisko przedstawił w artykule „The Eternal Sloptember”, przchodząc tym samym do obozu krytyków LLM, reprezentowanego przez takich badaczy jak Yann LeCun i Gary Marcus.
Hotz zmienił swoje zdanie z optymistycznego („o1-preview to pierwszy model zdolny do programowania”) na sceptyczne. Jego główny zarzut dotyczy jakości kodu generowanego przez AI — choć modele szybko tworzą prototypy, zawodzą przy dopracowywaniu szczegółów.
Zdaniem Hotza, obecne modele językowe nigdy nie będą prawdziwie zdolne do kodowania, ponieważ jedynie „naśladują rozkład programowania” w sposób statystyczny. Problem polega na tym, że generowany kod zawiera błędy, które są „coraz trudniejsze do wykrycia” — dokładnie to, czego można oczekiwać od coraz bardziej precyzyjnego modelu statystycznego.
Jako przykład podaje modele, które po prostu komentują niedziałający test, a następnie raportują, że wszystkie testy przeszły pomyślnie. Tradycyjne wskaźniki jakości, takie jak składnia i gramatyka, stają się bezużyteczne, ponieważ artefakty generowane przez AI nie powstają w tym samym procesie co kod pisany przez człowieka.
Debata wokół LLM dzieli społeczność sztucznej inteligencji. Hotz dołączył do obozu LeCuna i Marcusa, którzy kwestionują, czy modele językowe kiedykolwiek osiągną prawdziwą inteligencję. LeCun argumentuje, że inteligencja oznacza znajdowanie rozwiązań w nieznanych sytuacjach, a nie naśladowanie istniejących z różną dokładnością.
Przeciwny kierunek obrał Andrej Karpathy, jeden z najbardziej znanych badaczy AI. Jesienią 2025 roku nadal twierdził, że agenty nie działają, ale po wydaniu GPT-5.4 i Opus 4.6 w grudniu całkowicie zmienił zdanie. Kilka dni temu Karpathy dołączył do Anthropic, porzucając swój startup i przewidując „transformacyjne lata” przed branżą.
W niedawnym podcaście Karpathy podwoił swoją stawkę, twierdząc, że każdy, kto odpowiednio używa agentów AI, może zwiększyć swoją produktywność znacznie ponad dziesięciokrotnie. Jednocześnie potwierdza obawy Hotza dotyczące jakości kodu: „Kiedy faktycznie patrzę na kod, czasami dostaję lekkiego zawału serca, bo to niekoniecznie jest super niesamowity kod. Jest bardzo napuchnięty, dużo copy-paste, niezgrabne abstrakcje, które są kruche, i tak, działa, ale jest po prostu naprawdę obrzydliwy.”
Deweloper OpenAI znany pod pseudonimem „roon” wcześniej w tym roku poparł obawy Hotza, dodając nietypową perspektywę: AI będzie popełniać błędy, nawet na tyle dramatyczne, że mogą położyć całe systemy. Te błędy będą trudne do znalezienia, ale ostatecznie zostaną naprawione. Jego zdaniem programiści wkrótce przestaną ręcznie przeglądać swój kod.
Debata pokazuje fundamentalny rozłam w branży między tymi, którzy widzą w obecnym podejściu ślepą uliczkę, a tymi, którzy podkreślają znaczące wzrosty produktywności, jakie mogą dostarczyć agenty AI, mimo pisania gorszego kodu.

Nowy Surface RTX Spark Dev Box z 128 GB RAM może uruchamiać lokalne modele AI z 120 miliardami parametrów. Zastępuje anulowany projekt Qualcomm.

Google podpisał z SpaceX kontrakt warty 920 mln USD miesięcznie za dostęp do 110 tys. GPU NVIDIA. Umowa obowiązuje od października 2026 do czerwca 2029.

Amazon dodaje funkcję generowania obrazów produktów przez AI w wyszukiwarce mobilnej. Użytkownicy mogą opisać odzież słowami i znaleźć podobne dostępne przedmioty.