Claude Fable 5 trafia do publicznego użytku z zabezpieczeniami blokującymi pytania o cyberbezpieczeństwo. Mythos 5 pozostaje dla wybranych partnerów.

Źródło zdjęcia: WIRED
Anthropic wprowadza dwa nowe modele AI — Claude Fable 5 z ograniczeniami bezpieczeństwa oraz Claude Mythos 5 z zaawansowanymi możliwościami hakowania, dostępny tylko dla wybranych partnerów. Firma współpracuje z amerykańskim rządem przy kontrolowanym wdrożeniu tych technologii, informuje WIRED.
Oba modele przekraczają możliwości wcześniejszego Mythos Preview z kwietnia, ale ze względu na obawy o wykorzystanie przez cyberprzestępców, firma przyjęła dwupoziomową strategię udostępniania.
Diane Penn, dyrektor zarządzania produktem w Anthropic, wyjaśnia, że firma od miesięcy zmaga się z dylematem bezpiecznego udostępnienia możliwości Mythos. — Próbujemy wprowadzać ulepszenia w sposób korzystny, nawet jeśli nie mamy idealnego rozwiązania dla każdego przypadku użycia na początku — mówi Penn w wywiadzie dla WIRED.
System ochronny w Claude Fable 5 działa według zasady „lepiej dmuchać na zimne” — niektóre niewinne zapytania mogą zostać przekierowane do słabszego modelu. Anthropic planuje z czasem zwiększyć precyzję klasyfikatorów, ale Penn podkreśla, że był to jedyny bezpieczny sposób na szerokie udostępnienie modelu w tym momencie.
Firma przyznaje dostęp do nieograniczonej wersji wybranym grupom klientów „do momentu udostępnienia programu zaufanego dostępu”, sugerując plany dalszego rozszerzania dostępności. Od kwietnia Anthropic wielokrotnie podkreślała, że konkurenci w przestrzeni prywatnej i open source nieuchronnie oferą modele na poziomie Mythos.
Możliwość projektowania narzędzi hakerskich przez Claude Mythos i inne nowe modele AI zmusiła firmy technologiczne i rządy na całym świecie do wzmocnienia zabezpieczeń oprogramowania przed szerokim udostępnieniem takich możliwości atakującym. Anthropic w ramach konsorcjum Project Glasswing daje członkom przewagę w przygotowaniu systemów i ocenie globalnych rozwiązań zagrożenia.
W ubiegłotygodniowej aktualizacji o Project Glasswing firma napisała: „Pracujemy tak szybko, jak to możliwe, aby bezpiecznie udostępnić możliwości na poziomie Mythos w ogólnym dostępie. Aby to zrobić, będziemy potrzebować bardzo solidnych zabezpieczeń zapobiegających nadużywaniu możliwości cybernetycznych modelu — zabezpieczeń, których my (i wedle naszej wiedzy wszyscy inni deweloperzy AI) jeszcze nie opracowaliśmy.”
W kwietniu OpenAI również prywatnie uruchomiło model z zaawansowanymi możliwościami cyberbezpieczeństwa i powołało podobną grupę roboczą. Obie firmy złożyły poufne wnioski o IPO i ścigają się o zaimponowanie potencjalnym inwestorom przed wejściem na giełdę już w tym roku.
Okrojone wydanie Claude Fable 5 odzwierciedla napięcie biznesowe Anthropic między chęcią wydania modelu klasy Mythos do ogólnego użytku a nierozwiązanymi obawami cyberbezpieczeństwa. Pozostaje pytanie, jak odporne będą zabezpieczenia Claude Fable 5 w praktycznym użytkowaniu, mimo że firma nie znalazła uniwersalnych sposobów ich obejścia podczas intensywnych testów.

Jensen Huang osobiście zaprezentował superchip RTX Spark w koreańskich PC bangach, współpracując z deweloperami KRAFTON i NC oraz mistrzami esportu.

Apple Intelligence umożliwi tworzenie rozszerzeń Safari poprzez opisanie ich działania. Nowa funkcja ma rozwiązać problem ograniczonej biblioteki dodatków.

Badania psycholożki Gloria Mark pokazują dramatyczny spadek zdolności koncentracji z 2,5 minuty do 47 sekund. Chatboty AI mogą ten proces przyspieszyć.