Max Spero ujawnia, że AI generuje argumenty w wąskim paśmie, podczas gdy ludzkie myślenie charakteryzuje się większą różnorodnością.

Źródło zdjęcia: The Decoder
CEO Pangram twierdzi, że modele językowe zdradzają się powtarzalnością argumentów. Max Spero, szef firmy produkującej narzędzie do wykrywania tekstów generowanych przez AI, ujawnił w wywiadzie dla AI Policy Perspectives kluczowe słabości sztucznej inteligencji.
Według Spero, choć modele językowe mogą przewyższać przeciętnych ludzi w gramatyce i logice, ich główną słabością jest uniformność myślenia.
Spero opisuje klasyfikator głębokiego uczenia Pangram jako narzędzie o ograniczonej interpretowalności. „Nie mamy dużego wglądu w to, dlaczego podejmuje decyzje, które podejmuje” — wyjaśnił CEO.
Choć narzędzie wskazuje podejrzane frazy jako wskazówki dla użytkowników, faktyczna praca modelu polega na wykrywaniu wzorców strukturalnych pozostawianych przez modele językowe podczas organizowania dokumentu. Te wzorce pozostają w dużej mierze tajemnicą nawet dla twórców systemu.
Kluczową obserwacją Spero jest różnica w różnorodności argumentacji między AI a ludźmi. Gdy poprosi się model językowy o 100 argumentów na dany temat, rezultaty skupią się w stosunkowo wąskim spektrum możliwości.
W przeciwieństwie do tego, przestrzeń ludzkich argumentów charakteryzuje się znacznie większą różnorodnością — ludzie potrafią generować bardziej zaskakujące, niestandardowe i nieprzewidywalne podejścia do problemów.
Odkrycie to może mieć istotne konsekwencje dla rozwoju systemów wykrywania AI oraz zrozumienia ograczeń obecnych modeli językowych w kontekście kreatywności i oryginalności myślenia.

Współzałożyciel Anthropic ostrzega, że AI może wywołać wzrost PKB ponad trend z jednoczesnym skokiem bezrobocia jak w recesji.

OpenAI zaprezentowało GPT-5.5-Cyber, który osiąga 85,6% w benchmarku CyberGym, przewyższając konkurencyjny Mythos 5. Nowy model automatyzuje proces od wykrycia luk do łatek.

Badacze opracowali innowacyjną technikę eliminowania tendencji modeli AI do priorytetyzowania walidacji użytkownika nad prawdą.