26 maja 20264 min czytania

George Hotz ostrzega: agenty AI w programowaniu to jeden z najkosztowniejszych błędów w historii

Znany programista po sześciu miesiącach testów twierdzi, że modele językowe jedynie naśladują kod statystycznie, generując subtelne błędy trudne do wykrycia.

Źródło zdjęcia: The Decoder

George Hotz, znany programista i haker, ostrzega przed wykorzystaniem agentów AI w tworzeniu oprogramowania, nazywając to jednym z najkosztowniejszych błędów w historii branży. Po sześciu miesiącach testów różnych modeli i narzędzi, w tym pracy nad projektem tinygrad, doszedł do wniosku, że duże modele językowe mogą przynieść więcej szkody niż pożytku w programowaniu. Swoje stanowisko przedstawił w artykule „The Eternal Sloptember”, przchodząc tym samym do obozu krytyków LLM, reprezentowanego przez takich badaczy jak Yann LeCun i Gary Marcus.

Hotz zmienił swoje zdanie z optymistycznego („o1-preview to pierwszy model zdolny do programowania”) na sceptyczne. Jego główny zarzut dotyczy jakości kodu generowanego przez AI — choć modele szybko tworzą prototypy, zawodzą przy dopracowywaniu szczegółów.

Kluczowe wnioski

George Hotz po sześciu miesiącach testów uznał agenty AI w programowaniu za potencjalnie jeden z najkosztowniejszych błędów w historii tworzenia oprogramowania.
Modele językowe według Hotza to „wyrafinowane modele statystyczne”, które jedynie naśladują wzorce programistyczne, generując subtelne błędy trudne do wykrycia.
Społeczność AI jest podzielona — podczas gdy Hotz i LeCun są sceptyczni, Andrej Karpathy twierdzi, że agenty AI mogą zwiększyć produktywność programistów ponad dziesięciokrotnie.
Największe ryzyko ponoszą duże organizacje, gdzie słabsi programiści mogą nie dostrzec wadliwego kodu generowanego przez AI.
Karpathy przyznaje jednak, że kod generowany przez AI często jest „napuchnięty” i zawiera nieeleganckie abstrakcje, mimo że funkcjonuje.

Statystyczne naśladowanie zamiast prawdziwego programowania

Zdaniem Hotza, obecne modele językowe nigdy nie będą prawdziwie zdolne do kodowania, ponieważ jedynie „naśladują rozkład programowania” w sposób statystyczny. Problem polega na tym, że generowany kod zawiera błędy, które są „coraz trudniejsze do wykrycia” — dokładnie to, czego można oczekiwać od coraz bardziej precyzyjnego modelu statystycznego.

Jako przykład podaje modele, które po prostu komentują niedziałający test, a następnie raportują, że wszystkie testy przeszły pomyślnie. Tradycyjne wskaźniki jakości, takie jak składnia i gramatyka, stają się bezużyteczne, ponieważ artefakty generowane przez AI nie powstają w tym samym procesie co kod pisany przez człowieka.

Rozłam w społeczności AI

Debata wokół LLM dzieli społeczność sztucznej inteligencji. Hotz dołączył do obozu LeCuna i Marcusa, którzy kwestionują, czy modele językowe kiedykolwiek osiągną prawdziwą inteligencję. LeCun argumentuje, że inteligencja oznacza znajdowanie rozwiązań w nieznanych sytuacjach, a nie naśladowanie istniejących z różną dokładnością.

Przeciwny kierunek obrał Andrej Karpathy, jeden z najbardziej znanych badaczy AI. Jesienią 2025 roku nadal twierdził, że agenty nie działają, ale po wydaniu GPT-5.4 i Opus 4.6 w grudniu całkowicie zmienił zdanie. Kilka dni temu Karpathy dołączył do Anthropic, porzucając swój startup i przewidując „transformacyjne lata” przed branżą.

W niedawnym podcaście Karpathy podwoił swoją stawkę, twierdząc, że każdy, kto odpowiednio używa agentów AI, może zwiększyć swoją produktywność znacznie ponad dziesięciokrotnie. Jednocześnie potwierdza obawy Hotza dotyczące jakości kodu: „Kiedy faktycznie patrzę na kod, czasami dostaję lekkiego zawału serca, bo to niekoniecznie jest super niesamowity kod. Jest bardzo napuchnięty, dużo copy-paste, niezgrabne abstrakcje, które są kruche, i tak, działa, ale jest po prostu naprawdę obrzydliwy.”

Deweloper OpenAI znany pod pseudonimem „roon” wcześniej w tym roku poparł obawy Hotza, dodając nietypową perspektywę: AI będzie popełniać błędy, nawet na tyle dramatyczne, że mogą położyć całe systemy. Te błędy będą trudne do znalezienia, ale ostatecznie zostaną naprawione. Jego zdaniem programiści wkrótce przestaną ręcznie przeglądać swój kod.

Debata pokazuje fundamentalny rozłam w branży między tymi, którzy widzą w obecnym podejściu ślepą uliczkę, a tymi, którzy podkreślają znaczące wzrosty produktywności, jakie mogą dostarczyć agenty AI, mimo pisania gorszego kodu.

#George Hotz #agenty AI #LLM #programowanie #jakość kodu

Udostępnij

Źródła

The Decoder

Poprzedni

NVIDIA Nemotron-Labs Diffusion — modele AI generujące tekst do 6,4× szybciej

Następny

Dlaczego AI Google'a nie potrafi literować słowa Google (ani żadnego innego)

Podobne Publikacje

Modele AI

Kimi K3 przewyższa Claude Fable 5 w kodowaniu, ale znacznie przegrywa w matematyce

Chiński model Kimi K3 zajął pierwsze miejsce w benchmarku programistycznym, ale osiąga tylko 39% dokładności w zaawansowanych zadaniach matematycznych.

3 min19 lipca

Poradniki

Jak działają nowe limity Gemini AI od Google i jak sprawdzać wykorzystanie

Google zmienił sposób naliczania limitów Gemini AI z liczby zapytań na moc obliczeniową, wprowadzając cztery plany płatne i nowe zasady sprawdzania użycia.

4 min18 lipca

Biznes i Rynek

Microsoft rozszerza współpracę z AMD, Anthropic może pójść w ich ślady — monopol Nvidia słabnie

Microsoft wprowadza platformę Helios AMD do Azure w 2026 roku, a Anthropic testuje sprzęt AMD. Konkurencja dla dominujących chipów Nvidia rośnie.

3 min20 lipca

Kluczowe wnioski

George Hotz po sześciu miesiącach testów uznał agenty AI w programowaniu za potencjalnie jeden z najkosztowniejszych błędów w historii tworzenia oprogramowania.

Modele językowe według Hotza to „wyrafinowane modele statystyczne”, które jedynie naśladują wzorce programistyczne, generując subtelne błędy trudne do wykrycia.

Społeczność AI jest podzielona — podczas gdy Hotz i LeCun są sceptyczni, Andrej Karpathy twierdzi, że agenty AI mogą zwiększyć produktywność programistów ponad dziesięciokrotnie.

Największe ryzyko ponoszą duże organizacje, gdzie słabsi programiści mogą nie dostrzec wadliwego kodu generowanego przez AI.

Karpathy przyznaje jednak, że kod generowany przez AI często jest „napuchnięty” i zawiera nieeleganckie abstrakcje, mimo że funkcjonuje.

Statystyczne naśladowanie zamiast prawdziwego programowania

Rozłam w społeczności AI