9 czerwca 20264 min czytania

Anthropic udostępnia Claude Fable 5 z ograniczeniami bezpieczeństwa i Mythos 5 dla partnerów

Claude Fable 5 trafia do publicznego użytku z zabezpieczeniami blokującymi pytania o cyberbezpieczeństwo. Mythos 5 pozostaje dla wybranych partnerów.

Źródło zdjęcia: WIRED

Anthropic wprowadza dwa nowe modele AI — Claude Fable 5 z ograniczeniami bezpieczeństwa oraz Claude Mythos 5 z zaawansowanymi możliwościami hakowania, dostępny tylko dla wybranych partnerów. Firma współpracuje z amerykańskim rządem przy kontrolowanym wdrożeniu tych technologii, informuje WIRED.

Oba modele przekraczają możliwości wcześniejszego Mythos Preview z kwietnia, ale ze względu na obawy o wykorzystanie przez cyberprzestępców, firma przyjęła dwupoziomową strategię udostępniania.

Kluczowe wnioski

Claude Fable 5 trafia do publicznego użytku z „barierkami ochronnymi” blokującymi pytania o cyberbezpieczeństwo, biologię i chemię — takie zapytania przekierowuje do starszego modelu Claude Opus 4.8.
Claude Mythos 5 pozostaje ograniczony do wybranych partnerów z Project Glasswing, badaczy biologii i współpracy z amerykańskim rządem ze względu na zaawansowane możliwości znajdowania luk w oprogramowaniu.
Koszt obu modeli wynosi 10 dolarów za milion tokenów wejściowych i 50 dolarów za milion tokenów wyjściowych — dwukrotnie więcej niż publicznie dostępne modele Anthropic.
W ponad 1000 godzin testów bezpieczeństwa zespół nie znalazł uniwersalnych sposobów obejścia zabezpieczeń Claude Fable 5.
Anthropic planuje stopniowe rozszerzanie dostępu gdy rozwinie skuteczniejsze mechanizmy ochrony przed nadużyciami.

Strategia kontrolowanego wdrażania

Diane Penn, dyrektor zarządzania produktem w Anthropic, wyjaśnia, że firma od miesięcy zmaga się z dylematem bezpiecznego udostępnienia możliwości Mythos. — Próbujemy wprowadzać ulepszenia w sposób korzystny, nawet jeśli nie mamy idealnego rozwiązania dla każdego przypadku użycia na początku — mówi Penn w wywiadzie dla WIRED.

System ochronny w Claude Fable 5 działa według zasady „lepiej dmuchać na zimne” — niektóre niewinne zapytania mogą zostać przekierowane do słabszego modelu. Anthropic planuje z czasem zwiększyć precyzję klasyfikatorów, ale Penn podkreśla, że był to jedyny bezpieczny sposób na szerokie udostępnienie modelu w tym momencie.

Firma przyznaje dostęp do nieograniczonej wersji wybranym grupom klientów „do momentu udostępnienia programu zaufanego dostępu”, sugerując plany dalszego rozszerzania dostępności. Od kwietnia Anthropic wielokrotnie podkreślała, że konkurenci w przestrzeni prywatnej i open source nieuchronnie oferą modele na poziomie Mythos.

Wyścig na rynku AI i obawy bezpieczeństwa

Możliwość projektowania narzędzi hakerskich przez Claude Mythos i inne nowe modele AI zmusiła firmy technologiczne i rządy na całym świecie do wzmocnienia zabezpieczeń oprogramowania przed szerokim udostępnieniem takich możliwości atakującym. Anthropic w ramach konsorcjum Project Glasswing daje członkom przewagę w przygotowaniu systemów i ocenie globalnych rozwiązań zagrożenia.

W ubiegłotygodniowej aktualizacji o Project Glasswing firma napisała: „Pracujemy tak szybko, jak to możliwe, aby bezpiecznie udostępnić możliwości na poziomie Mythos w ogólnym dostępie. Aby to zrobić, będziemy potrzebować bardzo solidnych zabezpieczeń zapobiegających nadużywaniu możliwości cybernetycznych modelu — zabezpieczeń, których my (i wedle naszej wiedzy wszyscy inni deweloperzy AI) jeszcze nie opracowaliśmy.”

W kwietniu OpenAI również prywatnie uruchomiło model z zaawansowanymi możliwościami cyberbezpieczeństwa i powołało podobną grupę roboczą. Obie firmy złożyły poufne wnioski o IPO i ścigają się o zaimponowanie potencjalnym inwestorom przed wejściem na giełdę już w tym roku.

Okrojone wydanie Claude Fable 5 odzwierciedla napięcie biznesowe Anthropic między chęcią wydania modelu klasy Mythos do ogólnego użytku a nierozwiązanymi obawami cyberbezpieczeństwa. Pozostaje pytanie, jak odporne będą zabezpieczenia Claude Fable 5 w praktycznym użytkowaniu, mimo że firma nie znalazła uniwersalnych sposobów ich obejścia podczas intensywnych testów.

#Anthropic #Claude #cyberbezpieczeństwo #Project Glasswing

Udostępnij

Źródła

Wired AI

Poprzedni

Google udostępnia Gemini 3.5 Live Translate z tłumaczeniem głosowym w czasie rzeczywistym

Następny

Anthropic wydał Claude Fable 5 — pierwszy publicznie dostępny model z rodziny Mythos-class

Podobne Publikacje

Narzędzia i Aplikacje

OpenAI wprowadził pierwszą klawiaturę do ChatGPT za 230 dolarów. Programiści nie są zachwyceni

OpenAI Micro to pierwsza próba firmy w segmencie sprzętu. Klawiatura do ChatGPT za 230$ oferuje dyktowanie głosowe, ale programiści krytykują jej praktyczność.

4 min25 lipca

Biznes i Rynek

Korea Południowa wytycza przyszłość AI we współpracy z NVIDIA na AI Summit

NVIDIA i KAIST utworzą pierwsze wspólne laboratorium AI w Korei Południowej, skupiając się na agentowej sztucznej inteligencji.

3 min24 lipca

Etyka i Bezpieczeństwo

Biały Dom podzielony ws. reakcji na chińskie modele AI konkurujące z amerykańskimi

Administracja Trumpa szuka sposobów na ograniczenie rozwoju chińskiej AI po wydaniu modelu Kimi K3, który konkuruje z rozwiązaniami Anthropic i OpenAI.

4 min23 lipca

Kluczowe wnioski

Claude Fable 5 trafia do publicznego użytku z „barierkami ochronnymi” blokującymi pytania o cyberbezpieczeństwo, biologię i chemię — takie zapytania przekierowuje do starszego modelu Claude Opus 4.8.

Claude Mythos 5 pozostaje ograniczony do wybranych partnerów z Project Glasswing, badaczy biologii i współpracy z amerykańskim rządem ze względu na zaawansowane możliwości znajdowania luk w oprogramowaniu.

Koszt obu modeli wynosi 10 dolarów za milion tokenów wejściowych i 50 dolarów za milion tokenów wyjściowych — dwukrotnie więcej niż publicznie dostępne modele Anthropic.

W ponad 1000 godzin testów bezpieczeństwa zespół nie znalazł uniwersalnych sposobów obejścia zabezpieczeń Claude Fable 5.

Anthropic planuje stopniowe rozszerzanie dostępu gdy rozwinie skuteczniejsze mechanizmy ochrony przed nadużyciami.

Strategia kontrolowanego wdrażania

Wyścig na rynku AI i obawy bezpieczeństwa