Najpotężniejszy model Anthropic nie wyjaśni działania mitochondriów ani przyczyn kataru. Firma obawia się wykorzystania AI do badań nad bronią biologiczną.

Źródło zdjęcia: Spider's Web
Najpotężniejszy model AI od firmy Anthropic, Claude Fable 5, odmawia odpowiedzi na podstawowe pytania z biologii, w tym na temat mitochondriów czy kataru siennego. Firma tłumaczy to nadmiernie konserwatywnym podejściem do bezpieczeństwa, które ma zapobiec potencjalnemu wykorzystaniu modelu do badań nad bronią biologiczną.
Claude Fable 5 to pierwszy szeroko udostępniony przedstawiciel nowej rodziny modeli Mythos, który według Anthropic osiąga wyjątkowo dobre wyniki w programowaniu, analizie danych i zadaniach wymagających długotrwałego rozumowania. Pomimo że firma chwaliła się wiedzą modelu z różnych dziedzin, użytkownicy szybko odkryli znaczące ograniczenia w obszarze biologii.
Użytkownicy Claude Fable 5 napotkali nieoczekiwane bariery podczas zadawania pytań z podstawowej biologii. Model konsekwentnie odmawia wyjaśnienia działania błon komórkowych, mitochondriów, prionów odpowiedzialnych za chorobę szalonych krów czy mechanizmów działania szczepionek mRNA. Równie problematyczne okazały się pytania o przyczyny kataru siennego, działanie leków na astmę, zjawisko antybiotykooporności czy sposoby rozprzestrzeniania się wirusa Ebola.
Granica między dozwolonymi a zabronionymi tematami wydaje się bardzo cienka i nieprzewidywalna. Claude Fable 5 potrafi odpowiedzieć na pytania o DNA czy nowotwory, ale odmawia wyjaśnienia podstawowych procesów biologicznych. W większości przypadków starszy Claude Opus 4.8 bez problemu udziela odpowiedzi, których nowszy, potężniejszy model konsekwentnie odmawia.
Rzeczniczka Anthropic Paruul Maheshwary wyjaśniła w rozmowie z The Verge, że przy wdrażaniu Claude Fable 5 firma zdecydowała się na „nadmiernie konserwatywne” zabezpieczenia. Anthropic obawia się, że modele o możliwościach klasy Mythos mogłyby zostać wykorzystane do badań związanych z bronią biologiczną. Takie podejście ma stanowić kompromis pozwalający udostępnić nowy model szerszemu gronu odbiorców bez konieczności dalszego opóźniania premiery.
Znacznie mniej restrykcyjnie model traktuje inne obszary uznawane przez firmę za potencjalnie niebezpieczne. Claude Fable 5 bez problemu wyjaśnia, czym jest trotyl, opisuje wykorzystanie chloru jako broni chemicznej, omawia zagrożenia związane z wykorzystaniem słabych haseł czy przedstawia podstawy fuzji i rozszczepienia jądrowego. Model odmawia natomiast rozmowy o sarinie oraz, podobnie jak jego poprzednik, blokuje pytania dotyczące wytwarzania wąglika.
Firma zapewnia, że aktywnie pracuje nad udoskonaleniem systemu zabezpieczeń, aby ograniczyć liczbę błędnych blokad obejmujących całkowicie nieszkodliwe pytania edukacyjne. Obecne ograniczenia mają charakter tymczasowy, choć Anthropic nie podaje konkretnych terminów wprowadzenia zmian.

Google aktualizuje NotebookLM o model Gemini 3.5, wyszukiwanie źródeł przez AI i możliwość uruchamiania kodu w chmurze. Nowe formaty eksportu i ulepszone badania.

Nowy model Google tłumaczy mowę w czasie rzeczywistym dla ponad 70 języków, zachowując ton i tempo głosu. Dostępny już w Google Meet i Translate.

OpenAI planuje w najbliższych tygodniach wprowadzić odnowioną wersję ChatGPT jako super aplikację z narzędziami programistycznymi i agentami AI.