11 maja 20264 min czytania

Dłuższe rozumowanie AI prowadzi do większych uprzedzeń pozycyjnych

Badanie pokazuje, że modele AI zdolne do rozumowania wykazują rosnące uprzedzenia pozycyjne proporcjonalnie do długości trajektorii myślenia.

Źródło zdjęcia: arXiv.org

Nowe badanie opublikowane na arXiv ujawnia niepokojącą zależność w modelach AI zdolnych do rozumowania: im dłużej „myślą” nad zadaniem, tym bardziej podatne stają się na błędy związane z pozycją odpowiedzi w pytaniach wielokrotnego wyboru. Odkrycie to podważa powszechne przekonanie, że techniki chain-of-thought (CoT) i modele dostrojone do rozumowania zawsze redukują powierzchowne błędy systematyczne.

Badanie przeprowadzone przez Xiao Wang z wykorzystaniem trzynastu konfiguracji modeli rozumujących — w tym DeepSeek-R1 o 671 miliardach parametrów — pokazuje, że pozycyjne uprzedzenie rośnie proporcjonalnie do długości trajektorii rozumowania.

Kluczowe wnioski

Dwanaście z trzynastu testowanych konfiguracji wykazało pozytywną korelację między długością rozumowania a Position Bias Score (PBS) w zakresie od 0,11 do 0,41.
Eksperyment z obcinaniem trajektorii potwierdził związek przyczynowy — kontynuacje z późniejszych punktów trajektorii zwiększały skłonność do wyboru opcji preferowanych pozycyjnie o 16–32%.
DeepSeek-R1 o 671B parametrów wykazał najniższy ogólny PBS (0,019), ale efekt długości nadal manifestował się w najdłuższym kwartylu (PBS = 0,071).
Rozumowanie CoT zastępuje bazowe uprzedzenie pozycyjne nowym typem błędu akumulowanego wraz z długością trajektorii.
Badanie dostarcza narzędzi diagnostycznych do audytu uprzedzeń pozycyjnych w modelach rozumujących.

Metodologia i wyniki eksperymentu

Badacz przetestował modele na zestawach danych MMLU, ARC-Challenge i GPQA, analizując dwie grupy modeli: destylowane z R1 (7–8B parametrów), modele bazowe z promptami CoT oraz pełny DeepSeek-R1. Wszystkie konfiguracje z otwartymi wagami wykazały monotoniczny wzrost PBS w kolejnych kwartylach długości trajektorii.

Kluczowym elementem badania był eksperyment z obcinaniem, gdzie trajektorie rozumowania były przerywane w różnych punktach, a następnie kontynuowane. Wyniki pokazały, że im później w trajektorii następowało wznowienie, tym większa była skłonność modelu do zmiany odpowiedzi na preferowaną pozycyjnie.

Implikacje dla oceny modeli AI

Odkrycia sugerują, że modele zdolne do rozumowania nie powinny być domyślnie traktowane jako odporne na kolejność opcji w pytaniach wielokrotnego wyboru. Badanie wykazuje fundamentalną różnicę między uprzedzeniem pozycyjnym w odpowiedziach bezpośrednich a tym występującym w rozumowaniu CoT.

W modelach Llama-Instruct bezpośrednie uprzedzenie pozycyjne było silne, podczas gdy w Qwen-Instruct-direct pozostawało słabe i nie korelowało z długością trajektorii. To wskazuje, że rozumowanie CoT wprowadza nowy typ systematycznego błędu, który zastępuje pierwotne uprzedzenia.

Badanie dostarcza zestawu narzędzi diagnostycznych, w tym Position Bias Score, punkty zmiany zaangażowania, efektywne przełączanie i sondy obcinania, które mogą być wykorzystane do audytu uprzedzeń pozycyjnych w przyszłych modelach rozumujących.

#ocena modeli #chain-of-thought #rozumowanie #uprzedzenia AI #DeepSeek R1

Udostępnij

Źródła

arXiv AI

Poprzedni

GraphDC: Nowa architektura AI znacząco poprawia rozumowanie nad algorytmami grafowymi

Następny

Nowy algorytm AI rewolucjonizuje wyznaczanie granic okręgów wyborczych

Podobne Publikacje

Poradniki

100 tysięcy powodów: jak rozpoznać treści generowane przez AI

Ekspert pokazuje na przykładzie 150 okładek książek z Amazon, jak modele AI wytwarzają charakterystyczne wzorce, które można rozpoznać bez zaawansowanych narzędzi.

4 min21 czerwca

Narzędzia i Aplikacje

Meta przywraca Facebook Creator Studio jako aplikację z asystentem AI

Meta reaktywuje Creator Studio z wbudowanym AI, który ma pokazywać twórcom „dokładnie, co robić, aby odnieść sukces na Facebooku”.

3 min25 czerwca

Biznes i Rynek

NVIDIA i AWS rozszerzają współpracę w zakresie infrastruktury AI na skalę produkcyjną

NVIDIA i AWS wprowadzają nowe instancje EC2 G7 z GPU Blackwell oraz przyspieszenie wektorowe w OpenSearch dla łatwiejszego wdrażania AI.

4 min24 czerwca