Administracja Trumpa blokuje model Claude Fable 5 do czasu wyeliminowania jailbreakingu. Eksperci twierdzą, że może to być niemożliwe.

Źródło zdjęcia: WIRED
Administracja Trumpa zwiększa presję na Anthropic w sprawie zabezpieczeń modelu Claude Fable 5, który został zdjęty z obiegu z powodu problemów z omijaniem zabezpieczeń. Jak informuje Wired, Biały Dom wymaga od firmy rozwiązania wszystkich luk pozwalających na „jailbreaking” — metodę obchodzenia zabezpieczeń modelu za pomocą specjalnie sformułowanych promptów.
Konflikt między rządem a jedną z najważniejszych firm AI może mieć daleko idące konsekwencje dla całej branży sztucznej inteligencji. Eksperci ostrzegają jednak, że żądania administracji mogą być po prostu niemożliwe do spełnienia.
Spór między Białym Domem a Anthropic nasila się z każdym dniem. Podczas poniedziałkowego spotkania technicznego z Departamentem Handlu i Biurem Narodowego Dyrektora ds. Cyberbezpieczeństwa, Sean Cairncross, przedstawiciele Anthropic ponownie przekonywali, że obawy administracji są przesadzone.
Urzędnicy federalni twierdzą jednak, że faza dyskusji o znaczeniu problemu już się skończyła. NSA jednoznacznie stwierdziła, że istnieją sposoby na wyłączenie zabezpieczeń w modelu Fable 5, które mają chronić przed dostępem do funkcji modelu Mythos związanych z cyberbezpieczeństwem, chemią i biologią.
Według trzech osób znających przebieg rozmów, administracja obecnie postrzega sytuację jako problem, który Anthropic musi rozwiązać samodzielnie. Ani Centrum ds. Standardów i Innowacji AI Departamentu Handlu, ani NSA nie mają personelu ani zasobów, aby ścigać każdy możliwy sposób omijania zabezpieczeń w każdym modelu trafiającym na rynek.
W rezultacie rząd oczekuje, że Anthropic będzie bardziej proaktywny w ciągłym testowaniu nie tylko Fable 5, ale wszystkich swoich najnowocześniejszych modeli AI, aby samodzielnie znajdować potencjalne luki i zgłaszać je władzom.
Na fundamentalnym poziomie pozostaje jednak niejasne, jak Anthropic ma zapobiec jailbreakingowi. Niezależni eksperci cyberbezpieczeństwa coraz częściej przyjmują stanowisko, że zabezpieczenia w modelach AI są jedynie tymczasowym rozwiązaniem. Wykwalifikowani użytkownicy i przyszłe modele AI zawsze znajdą sposoby na ominięcie ograniczeń — co oznacza, że to, czego chce Biały Dom, może być po prostu niewykonalne.
Rzecznik Białego Domu odmówił komentarza w tej sprawie.
Sytuacja pokazuje rosnące napięcie między rozwojem technologii AI a wymogami bezpieczeństwa narodowego, przy czym obie strony mają różne wizje tego, co jest technicznie możliwe do osiągnięcia w kwestii zabezpieczeń sztucznej inteligencji.

CEO Google opuściło około 200 studentów podczas ceremonii rozdania dyplomów na Stanfordzie. Protesty dotyczyły projektu Nimbus i współpracy z ICE.

SpaceX zadebiutował z rekordową ofertą publiczną, a OpenAI i Anthropic przygotowują własne IPO. Eksperci przewidują gorące lato debiutów giełdowych w sektorze AI.

Metoda DivInit zwiększa skuteczność agentów AI o 5–7 punktów przez dywersyfikację zapytań początkowych zamiast standardowego równoległego próbkowania.