Nowy model Anthropic częściej sygnalizuje niepewność i jest 4x mniej skłonny do przemilczania wad w kodzie. Wprowadza kontrolę wysiłku i dynamiczne przepływy.

Źródło zdjęcia: The Verge
Anthropic wypuszcza nowy model Claude Opus 4.8, który ma być bardziej „uczciwy” w sytuacjach, gdy popełnia błędy. Firma twierdzi, że model częściej sygnalizuje niepewność co do swoich wyników i rzadziej wysuwwa nieuzasadnione twierdzenia. Szczegóły nowego modelu opisuje The Verge.
Model trafi do użytkowników w czwartek (28 maja 2026) wraz z nowymi funkcjami pozwalającymi na kontrolowanie poziomu „wysiłku” wkładanego przez AI w wykonanie zadania.
Według Anthropic, firma szkoli „wszystkie swoje modele, aby były uczciwe — na przykład, aby unikały wysuwania twierdzeń, których nie mogą uzasadnić”. Jednak jak zauważa firma, „powszechnym problemem z modelami AI jest to, że czasami wyciągają przedwczesne wnioski, pewnie prezentując swoją pracę jako przynoszącą postępy pomimo słabych dowodów”.
Laboratorium AI twierdzi, że wczesni testerzy odkryli, iż Opus 4.8 „częściej sygnalizuje niepewności dotyczące swojej pracy i rzadziej wysuwwa nieuzasadnione twierdzenia”. W ocenach firmy Opus 4.8 jest „około 4 razy mniej skłonny niż jego poprzednik do tego, by pozwolić, aby wady w pisanym przez niego kodzie przeszły bez komentarza”.
Oprócz ulepszeń w zakresie uczciwości, Opus 4.8 wprowadza możliwość kierowania ilością wysiłku, jaki Claude wkłada w zadanie. Odpowiedzi wymagające większego wysiłku będą zużywać więcej tokenów, co daje użytkownikom opcję wyboru odpowiedzi o mniejszym wysiłku, jeśli nie chcą szybko wyczerpać swoich limitów szybkości.
Anthropic wprowadza również funkcję o nazwie „dynamiczne przepływy pracy” w wersji preview badawczej. Firma twierdzi, że pozwoli to Claude'owi „podejmować się jeszcze większych zadań”. Dzięki dynamicznym przepływom pracy „Claude może zaplanować pracę, a następnie uruchomić setki równoległych podagentów w jednej sesji (a z Opus 4.8 agenci mogą działać jeszcze dłużej). Następnie weryfikuje swoje wyniki przed zgłoszeniem ich użytkownikowi”.
Nowy model Claude Opus 4.8 wraz z opisanymi funkcjami będzie dostępny od czwartku, stanowiąc kolejny krok Anthropic w kierunku tworzenia bardziej niezawodnych i transparentnych systemów AI.

xAI wykorzystywało przez miesiące odpowiedzi Claude do trenowania własnych modeli kodowania, zanim Anthropic odcięło dostęp w styczniu.

Podczas gdy AI bije rekordy funduszy, startupowcy tworzą produkty łączące ludzi offline. Board i cyberdecki to przykłady trendu 'together tech'.

Amazon będzie wyświetlać sztuczne zdjęcia produktów w wynikach wyszukiwania. Funkcja ma pomagać klientom, ale może wprowadzać w błąd.