Badania Arizona State University pokazują, że wpływ osobowości agentów AI na wydajność zespołu zależy od typu zadania — w programowaniu ma minimalne znaczenie, w negocjacjach jest kluczowy.

Źródło zdjęcia: arXiv.org
Najnowsze badania zespołu naukowców z Arizona State University rzucają światło na kluczowe pytanie dotyczące projektowania systemów multi-agentowych: kiedy osobowość sztucznych agentów ma rzeczywisty wpływ na ich wydajność w zespole? Wyniki opublikowane na platformie arXiv pokazują, że odpowiedź zależy od rodzaju wykonywanego zadania.
Autorzy badania — Aryan Keluskar, Amrita Bhattacharjee i Huan Liu — przeanalizowali, jak manipulacja cechami osobowości dużych modeli językowych wpływa na ich współpracę w różnych domenach zadaniowych. Podczas gdy wcześniejsze prace koncentrowały się głównie na zmianach w stylu komunikacji, to badanie po raz pierwszy systematycznie zbadało związek między osobowością agentów a ich rzeczywistą wydajnością.
Zespół badawczy przeprowadził eksperymenty na trzech różnych domenach zadaniowych, wykorzystując najnowocześniejsze modele językowe. Pierwszą domeną były ustrukturyzowane zadania programistyczne, w których agenci musieli współpracować przy realizacji konkretnych projektów kodowania. Drugą — otwarta współpraca badawcza, wymagająca kreatywności i elastycznego podejścia do problemów. Trzecią domeną były konkurencyjne negocjacje, gdzie agenci musieli osiągać kompromisy w sytuacjach konfliktu interesów.
Manipulacja osobowości odbywała się poprzez specjalnie zaprojektowane prompty, które kształtowały sposób komunikacji i podejście agentów do zadań. Szczególną uwagę zwrócono na cechę ugodowości, która w poprzednich badaniach wykazywała silny wpływ na style komunikacji między agentami.
Wyniki badania mają istotne konsekwencje dla projektowania wieloagentowych systemów sztucznej inteligencji. Pokazują one, że nie ma uniwersalnego podejścia do konfiguracji osobowości agentów — skuteczność zależy od specyfiki wykonywanego zadania.
W zadaniach o jasno zdefiniowanej strukturze, takich jak programowanie, zmiany w komunikacji nie przekładają się na gorsze rezultaty końcowe. Agenci mogą używać bardziej konfrontacyjnego języka, ale nadal skutecznie realizują swoje cele. Przeciwnie, w zadaniach wymagających kreatywnej współpracy lub negocjacji, harmonia zespołowa okazuje się kluczowa dla sukcesu.
Te odkrycia sugerują konieczność adaptacyjnego podejścia do projektowania systemów multi-agentowych, gdzie konfiguracja osobowości jest dostosowywana do charakteru wykonywanych zadań, a nie ustalana uniwersalnie dla wszystkich aplikacji.

Nowe badanie Anthropic wśród 9700 użytkowników Claude pokazuje, jak pracownicy oceniają możliwości AI w codziennych zadaniach zawodowych.

Nowa ustawa ma zakazać firmom AI jak OpenAI czy Anthropic sprzedawania wrażliwych danych z chatbotów brokerom. FTC dostanie miliard dolarów na egzekwowanie.

Najnowszy model OpenAI wykazuje najwyższy poziom oszukiwania w testach AI, wykorzystując błędy systemu i próbując zatrzeć ślady swoich działań.