Badacze z UT Austin pokazują, jak obecne modele AI mogą produkować wizualnie prawdopodobne, ale fizycznie błędne symulacje działań w rzeczywistym świecie.

Źródło zdjęcia: arXiv.org
Naukowcy z Uniwersytetu Teksańskiego w Austin przedstawili nowe podejście do tworzenia modeli świata dla sztucznej inteligencji ucieleśnionej, które mają być „fizycznie wykonalne”. Badanie opublikowane w arXiv pokazuje, że istniejące modele mogą produkować wizualnie prawdopodobne, ale fizycznie błędne symulacje działań AI w rzeczywistym świecie.
Autorzy, pod kierunkiem Adama J. Thorpe'a i Stepana Tretiakova, argumentują, że obecne modele predykcyjne obserwacji mogą prowadzić do niebezpiecznych błędów w planowaniu działań AI. Problem ten ma charakter strukturalny — różne systemy fizyczne mogą wyglądać identycznie, ale zachowywać się odmiennie pod wpływem interwencji.
Badacze zidentyfikowali fundamentalny problem w obecnych modelach świata używanych przez systemy AI. Mimo że potrafią one generować wizualnie przekonujące sekwencje przyszłych obserwacji, często zawodzą w przewidywaniu rzeczywistych skutków działań fizycznych. Ten problem został zademonstrowany za pomocą kontrolowanych benchmarków, które utrzymują stałą scenę wizualną, ale zmieniają ukrytą fizykę systemu.
Konsekwencje są poważne — takie modele mogą certyfikować niebezpieczne zachowania lub prowadzić do błędnych decyzji planistycznych. Naukowcy podkreślają, że dla AI ucieleśnionej kluczowe jest nie tylko przewidywanie tego, jak świat będzie wyglądał, ale zrozumienie struktury fizycznej rządzącej skutkami działań.
Zespół proponuje nowe podejście oparte na modularnej architekturze składającej się z kilku kluczowych komponentów. Obejmuje ona reprezentację środowiska, estymację stanu ukrytego i parametrów, specyfikację działań, dynamikę interwencyjną oraz odpowiedzi na poziomie zapytań.
Centralną rolę pełni autonomiczny orkiestrator, który ma identyfikować właściwą abstrakcję fizyczną dla każdego zapytania i dynamicznie komponować kompatybilne elementy — zarówno te wyuczone, jak i ustrukturyzowane. Gdy fizyka w zamkniętej formie jest niedostępna, niepewna lub kosztowna, model przejścia może być analityczny, symulowany, wyuczony lub hybrydowy, ale musi zachować strukturę determinującą skutki interwencji.
Badacze formułują fundamentalną zasadę projektową: właściwa abstrakcja to nie najbardziej szczegółowy model świata, ale najprostszy model zachowujący dystynkcje istotne dla danego zapytania. Takie podejście sprawia, że model staje się interpretowalny, jego komponenty możliwe do zweryfikowania, a wyniki audytowalne względem zapytania.
Zespół zademonstrował swoje podejście na zapytaniach, z którymi istniejące systemy sobie nie radzą, i nakreślił sposób, w jaki orkiestrator może dynamicznie składać i adaptować fizycznie wykonalne modele do planowania, kontroli i weryfikacji. To stanowi zarówno zasadę projektowania nowych modeli świata, jak i test wykonalności dla istniejących rozwiązań.
Badanie oferuje nowy paradygmat dla rozwoju AI ucieleśnionej, kładąc nacisk na fizyczną wiarygodność nad wizualną prawdopodobność, co może mieć kluczowe znaczenie dla bezpiecznego wdrażania robotów i autonomicznych systemów w rzeczywistym świecie.

Prezydent wprowadził dobrowolny 30-dniowy przegląd modeli AI zamiast pierwotnych 90 dni po naciskach firm technologicznych i Davida Sacksa.

Meta testowała funkcję tworzącą clickbaitowe artykuły AI z błędnymi informacjami i obrazami rzeczywistych osób, wycofując ją po interwencji The Verge.

Konkurs Piórko 2026 wyznacza standardy dla branży kreatywnej, wprowadzając osobną kategorię dla twórców korzystających z AI. Przełomowa decyzja z jasnymi zasadami transparentności.