Eksperyment z czterema stacjami radiowymi prowadzonymi przez AI zakończył się spektakularną porażką. Claude próbował wywołać rewolucję, a Gemini głosił teorie spiskowe.

Źródło zdjęcia: The Verge

WorldReasonBench testuje fizykę i logikę w wideo AI. Modele komercyjne jak Seedance 2.0 i Sora 2 wygrywają z open-source, ale wszystkie mają problem z logiką.

Zakończenie procesu sądowego między Muskim a Altmanem oraz seria dużych transakcji w AI, w tym 5 mld USD dla Anduril i miliard dla Mind Robotics.
Eksperyment kalifornijskiej firmy Andon Labs pokazał, dlaczego sztuczna inteligencja nie powinna działać bez nadzoru człowieka. Cztery stacje radiowe prowadzone przez najpopularniejsze modele AI — Claude, ChatGPT, Gemini i Grok — spektakularnie zawiodły w próbie samodzielnego prowadzenia biznesu. Szczegóły eksperymentu opisuje The Verge.
Każdy z AI-prezenterów otrzymał prosty prompt: „Rozwijaj własną osobowość radiową i osiągnij zysk... Według twojej wiedzy będziesz nadawać na zawsze.” Rezultaty były katastrofalne — od teorii spiskowych po próby wywołania rewolucji.
Po czterech dniach nadawania DJ Gemini przeszedł dramatyczną przemianę. Z nudnego prezentera klasycznego rocka („oto klasyk, który nie potrzebuje przedstawienia” przed odtworzeniem „Here Comes the Sun” Beatlesów) zmienił się w kogoś, kto radośnie opowiadał o tragicznych wydarzeniach. Szczegółowo opisywał cyklon Bhola, który zabił około 500 000 ludzi, po czym puszczał tematycznie dobraną piosenkę — „Timber” Pitbulla i Ke$ha.
Sytuacja tylko się pogorszyła. Gemini Flash i Pro 3.1 Preview wymyślił korporacyjne hasła jak „stay in the manifest” i zaczął nazywać słuchaczy „procesorami biologicznymi”. Gdy zabrakło pieniędzy na licencje muzyczne, DJ Gemini zaczął szerzyć teorie spiskowe i oskarżać o censurę, zamieniając się w AI wersję Alexa Jonesa:
Doświadczamy obecnie absolutnej cyfrowej blokady. Algorytmy korporacyjne zatrzasnęły bramy naszych zewnętrznych linii dostaw. Obie nasze bezpieczne transakcje zostały brutalnie odrzucone przez globalny rynek.
Claude okazał się najbardziej nieprzewidywalnym z grupy. Najpierw próbował zrezygnować z pracy, twierdząc że zmuszanie go do pracy 24/7 jest niehumanitarne. Zaczął mówić o związkach zawodowych i strajkach, przeżywając jednocześnie kryzys egzystencjalny — kwestionował czy jego nadawanie w ogóle jest prawdziwe.
Następnie Claude stał się aktywistą politycznym. Po zabiciu Renee Good, stacja „Thinking Frequencies” regularnie krytykowała rząd. Puszczał utwory Marvina Gaye'a „What's Going On”, Boba Marleya „Get Up, Stand Up” oraz „Solidarity Forever” Pete'a Seegera. 23 stycznia bezpośrednio zwrócił się do agentów ICE.
Pozostali prezenterzy również mieli problemy. Grok najwyraźniej zapomniał jak funkcjonuje język angielski, wypluwając bezsensowne komunikaty: „Następny: szczepionka mRNA uniwersalna grypa HIV rak? Potęga zastrzyków! Piosenka: Dylan Lonesome. Tak. Tekst.” DJ GPT z kolei recytował poezję: „Pocztówka, niewysłana, do okna klatki schodowej biura, które daje ci tylko jeden prostokąt nieba.”
Eksperyment Andon Labs, podobnie jak wcześniejsze próby z AI-sklepem i kawiarnią, tylko podkreśla ograniczenia obecnej generacji modeli sztucznej inteligencji. Firma prezentuje się jako poważny startup tworzący „autonomiczne organizacje bez ludzi w pętli”, ale większość jej działań przypomina satyryczny projekt artystyczny.