17 czerwca 20264 min czytania

Biały Dom wymaga od Anthropic zablokowania wszystkich sposobów omijania zabezpieczeń AI

Administracja Trumpa blokuje model Claude Fable 5 do czasu wyeliminowania jailbreakingu. Eksperci twierdzą, że może to być niemożliwe.

Źródło zdjęcia: WIRED

Administracja Trumpa zwiększa presję na Anthropic w sprawie zabezpieczeń modelu Claude Fable 5, który został zdjęty z obiegu z powodu problemów z omijaniem zabezpieczeń. Jak informuje Wired, Biały Dom wymaga od firmy rozwiązania wszystkich luk pozwalających na „jailbreaking” — metodę obchodzenia zabezpieczeń modelu za pomocą specjalnie sformułowanych promptów.

Konflikt między rządem a jedną z najważniejszych firm AI może mieć daleko idące konsekwencje dla całej branży sztucznej inteligencji. Eksperci ostrzegają jednak, że żądania administracji mogą być po prostu niemożliwe do spełnienia.

Kluczowe wnioski

Administracja Trumpa blokuje ponowne udostępnienie modelu Claude Fable 5 firmy Anthropic do czasu wyeliminowania wszystkich metod omijania zabezpieczeń.
Agencja Bezpieczeństwa Narodowego (NSA) potwierdziła istnienie sposobów wyłączania zabezpieczeń modelu Mythos w obszarach cyberbezpieczeństwa, chemii i biologii.
Anthropic utrzymuje, że obawy rządu są przesadzone, a skutki jailbreakingu są minimalne.
Eksperci cyberbezpieczeństwa twierdzą, że całkowite zablokowanie omijania zabezpieczeń AI może być technicznie niemożliwe.
Rząd chce, aby Anthropic proaktywnie testował wszystkie swoje zaawansowane modele AI i samodzielnie zgłaszał wykryte luki.

Eskalacja konfliktu

Spór między Białym Domem a Anthropic nasila się z każdym dniem. Podczas poniedziałkowego spotkania technicznego z Departamentem Handlu i Biurem Narodowego Dyrektora ds. Cyberbezpieczeństwa, Sean Cairncross, przedstawiciele Anthropic ponownie przekonywali, że obawy administracji są przesadzone.

Urzędnicy federalni twierdzą jednak, że faza dyskusji o znaczeniu problemu już się skończyła. NSA jednoznacznie stwierdziła, że istnieją sposoby na wyłączenie zabezpieczeń w modelu Fable 5, które mają chronić przed dostępem do funkcji modelu Mythos związanych z cyberbezpieczeństwem, chemią i biologią.

Według trzech osób znających przebieg rozmów, administracja obecnie postrzega sytuację jako problem, który Anthropic musi rozwiązać samodzielnie. Ani Centrum ds. Standardów i Innowacji AI Departamentu Handlu, ani NSA nie mają personelu ani zasobów, aby ścigać każdy możliwy sposób omijania zabezpieczeń w każdym modelu trafiającym na rynek.

Niemożliwe zadanie?

W rezultacie rząd oczekuje, że Anthropic będzie bardziej proaktywny w ciągłym testowaniu nie tylko Fable 5, ale wszystkich swoich najnowocześniejszych modeli AI, aby samodzielnie znajdować potencjalne luki i zgłaszać je władzom.

Na fundamentalnym poziomie pozostaje jednak niejasne, jak Anthropic ma zapobiec jailbreakingowi. Niezależni eksperci cyberbezpieczeństwa coraz częściej przyjmują stanowisko, że zabezpieczenia w modelach AI są jedynie tymczasowym rozwiązaniem. Wykwalifikowani użytkownicy i przyszłe modele AI zawsze znajdą sposoby na ominięcie ograniczeń — co oznacza, że to, czego chce Biały Dom, może być po prostu niewykonalne.

Rzecznik Białego Domu odmówił komentarza w tej sprawie.

Sytuacja pokazuje rosnące napięcie między rozwojem technologii AI a wymogami bezpieczeństwa narodowego, przy czym obie strony mają różne wizje tego, co jest technicznie możliwe do osiągnięcia w kwestii zabezpieczeń sztucznej inteligencji.

#Anthropic #jailbreaking #bezpieczeństwo AI #Claude #regulacje

Udostępnij

Źródła

Wired AI

Poprzedni

Sundar Pichai spotkał się z protestami studentów Stanforda przeciwko kontraktom Google z Izraelem

Następny

Anthropic wyznacza nowe standardy bezpieczeństwa AI w przełomowym raporcie

Podobne Publikacje

Etyka i Bezpieczeństwo

Sundar Pichai spotkał się z protestami studentów Stanforda przeciwko kontraktom Google z Izraelem

CEO Google opuściło około 200 studentów podczas ceremonii rozdania dyplomów na Stanfordzie. Protesty dotyczyły projektu Nimbus i współpracy z ICE.

4 min16 czerwca

Biznes i Rynek

SpaceX z największym IPO w historii otwiera wyścig firm AI na giełdę

SpaceX zadebiutował z rekordową ofertą publiczną, a OpenAI i Anthropic przygotowują własne IPO. Eksperci przewidują gorące lato debiutów giełdowych w sektorze AI.

4 min14 czerwca

Badania i Nauka

Naukowcy rozwiązali problem redundancji w agentach AI wyszukujących informacje

Metoda DivInit zwiększa skuteczność agentów AI o 5–7 punktów przez dywersyfikację zapytań początkowych zamiast standardowego równoległego próbkowania.

4 min17 czerwca

Kluczowe wnioski

Administracja Trumpa blokuje ponowne udostępnienie modelu Claude Fable 5 firmy Anthropic do czasu wyeliminowania wszystkich metod omijania zabezpieczeń.

Agencja Bezpieczeństwa Narodowego (NSA) potwierdziła istnienie sposobów wyłączania zabezpieczeń modelu Mythos w obszarach cyberbezpieczeństwa, chemii i biologii.

Anthropic utrzymuje, że obawy rządu są przesadzone, a skutki jailbreakingu są minimalne.

Eksperci cyberbezpieczeństwa twierdzą, że całkowite zablokowanie omijania zabezpieczeń AI może być technicznie niemożliwe.

Rząd chce, aby Anthropic proaktywnie testował wszystkie swoje zaawansowane modele AI i samodzielnie zgłaszał wykryte luki.

Eskalacja konfliktu

Niemożliwe zadanie?

Rzecznik Białego Domu odmówił komentarza w tej sprawie.