11 czerwca 20264 min czytania

Claude Fable 5 odmawia odpowiedzi na podstawowe pytania o biologię. Anthropic tłumaczy się bezpieczeństwem

Najpotężniejszy model Anthropic nie wyjaśni działania mitochondriów ani przyczyn kataru. Firma obawia się wykorzystania AI do badań nad bronią biologiczną.

Źródło zdjęcia: Spider's Web

Najpotężniejszy model AI od firmy Anthropic, Claude Fable 5, odmawia odpowiedzi na podstawowe pytania z biologii, w tym na temat mitochondriów czy kataru siennego. Firma tłumaczy to nadmiernie konserwatywnym podejściem do bezpieczeństwa, które ma zapobiec potencjalnemu wykorzystaniu modelu do badań nad bronią biologiczną.

Claude Fable 5 to pierwszy szeroko udostępniony przedstawiciel nowej rodziny modeli Mythos, który według Anthropic osiąga wyjątkowo dobre wyniki w programowaniu, analizie danych i zadaniach wymagających długotrwałego rozumowania. Pomimo że firma chwaliła się wiedzą modelu z różnych dziedzin, użytkownicy szybko odkryli znaczące ograniczenia w obszarze biologii.

Kluczowe wnioski

Claude Fable 5 odmawia odpowiedzi na podstawowe pytania z biologii, przekierowując rozmowy do starszego modelu Claude Opus 4.8
Model nie wyjaśnia działania mitochondriów, mechanizmów chorób czy szczepionek mRNA, ale odpowiada na pytania o DNA i nowotwory
Anthropic zastosowało „nadmiernie konserwatywne” zabezpieczenia z obawy przed wykorzystaniem modelu do badań nad bronią biologiczną
W innych obszarach model jest mniej restrykcyjny — wyjaśnia działanie trotylu czy fuzji jądrowej, ale blokuje pytania o sarin
Firma pracuje nad ograniczeniem błędnych blokad dotyczących nieszkodliwych pytań edukacyjnych

Drastyczne ograniczenia w biologii

Użytkownicy Claude Fable 5 napotkali nieoczekiwane bariery podczas zadawania pytań z podstawowej biologii. Model konsekwentnie odmawia wyjaśnienia działania błon komórkowych, mitochondriów, prionów odpowiedzialnych za chorobę szalonych krów czy mechanizmów działania szczepionek mRNA. Równie problematyczne okazały się pytania o przyczyny kataru siennego, działanie leków na astmę, zjawisko antybiotykooporności czy sposoby rozprzestrzeniania się wirusa Ebola.

Granica między dozwolonymi a zabronionymi tematami wydaje się bardzo cienka i nieprzewidywalna. Claude Fable 5 potrafi odpowiedzieć na pytania o DNA czy nowotwory, ale odmawia wyjaśnienia podstawowych procesów biologicznych. W większości przypadków starszy Claude Opus 4.8 bez problemu udziela odpowiedzi, których nowszy, potężniejszy model konsekwentnie odmawia.

Strategia bezpieczeństwa Anthropic

Rzeczniczka Anthropic Paruul Maheshwary wyjaśniła w rozmowie z The Verge, że przy wdrażaniu Claude Fable 5 firma zdecydowała się na „nadmiernie konserwatywne” zabezpieczenia. Anthropic obawia się, że modele o możliwościach klasy Mythos mogłyby zostać wykorzystane do badań związanych z bronią biologiczną. Takie podejście ma stanowić kompromis pozwalający udostępnić nowy model szerszemu gronu odbiorców bez konieczności dalszego opóźniania premiery.

Znacznie mniej restrykcyjnie model traktuje inne obszary uznawane przez firmę za potencjalnie niebezpieczne. Claude Fable 5 bez problemu wyjaśnia, czym jest trotyl, opisuje wykorzystanie chloru jako broni chemicznej, omawia zagrożenia związane z wykorzystaniem słabych haseł czy przedstawia podstawy fuzji i rozszczepienia jądrowego. Model odmawia natomiast rozmowy o sarinie oraz, podobnie jak jego poprzednik, blokuje pytania dotyczące wytwarzania wąglika.

Firma zapewnia, że aktywnie pracuje nad udoskonaleniem systemu zabezpieczeń, aby ograniczyć liczbę błędnych blokad obejmujących całkowicie nieszkodliwe pytania edukacyjne. Obecne ograniczenia mają charakter tymczasowy, choć Anthropic nie podaje konkretnych terminów wprowadzenia zmian.

#Anthropic #biologia #bezpieczeństwo AI #ograniczenia modeli #Claude Fable 5

Udostępnij

Źródła

Spider's Web

Poprzedni

NVIDIA przyspiesza DiffusionGemma od Google DeepMind dla lokalnej sztucznej inteligencji

Następny

Indyjski model AI Varya generuje wideo 20 razy taniej niż konkurenci

Podobne Publikacje

Modele AI

Calibrated Selective Fact-Checking via Evidence Chain Evaluation

Naukowcy z dziedziny sztucznej inteligencji opracowali nowy system fact-checkingu, który potrafi powstrzymać się od wydawania werdyktu, gdy dowody są zbyt słabe lub niejednoznaczne. Badanie przedstawi

3 min23 lipca

Biznes i Rynek

Anthropic podpisało umowę z AMD na 5 miliardów dolarów na procesory dla Claude

Anthropic zawarło z AMD umowę wartą do 5 miliardów dolarów na dostawę 2 gigawatów GPU do trenowania modeli Claude. Pierwsza faza w 2027 roku.

3 min22 lipca

Modele AI

Google wypuszcza model Gemini Spark, ale Europa musi czekać

Nowy model AI Gemini Spark trafia do pierwszych użytkowników, ale europejscy klienci nie mają do niego dostępu. Google wprowadza kolejne ograniczenia geograficzne.

2 min24 lipca

Kluczowe wnioski

Claude Fable 5 odmawia odpowiedzi na podstawowe pytania z biologii, przekierowując rozmowy do starszego modelu Claude Opus 4.8

Model nie wyjaśnia działania mitochondriów, mechanizmów chorób czy szczepionek mRNA, ale odpowiada na pytania o DNA i nowotwory

Anthropic zastosowało „nadmiernie konserwatywne” zabezpieczenia z obawy przed wykorzystaniem modelu do badań nad bronią biologiczną

W innych obszarach model jest mniej restrykcyjny — wyjaśnia działanie trotylu czy fuzji jądrowej, ale blokuje pytania o sarin

Firma pracuje nad ograniczeniem błędnych blokad dotyczących nieszkodliwych pytań edukacyjnych

Drastyczne ograniczenia w biologii

Strategia bezpieczeństwa Anthropic