Mythos Preview łączy małe podatności w działające exploity i tworzy proof-of-concept kod. Cloudflare przetestował model na 50+ repozytoriach.

Źródło zdjęcia: The Decoder
Cloudflare przeprowadziło testy bezpieczeństwa wykorzystując najnowszy model Anthropic o nazwie Mythos Preview w ramach projektu Glasswing. Firma przebadała ponad 50 swoich repozytoriów kodu, a wyniki pokazują znaczący postęp w wykrywaniu łańcuchów exploitów w porównaniu do wcześniejszych modeli AI. Szczegółowe informacje zostały opublikowane w raporcie Cloudflare.
Model Mythos Preview wyróżnia się zdolnością do łączenia małych podatności w działające exploity oraz tworzenia dowodów koncepcji poprzez samodzielne pisanie, kompilowanie i uruchamianie kodu. Jak podkreśla Grant Bourzikas, dyrektor ds. bezpieczeństwa Cloudflare, wcześniejsze modele graniczne znajdowały podobne pojedyncze błędy i czasami dostarczały solidnych analiz, ale nie radziły sobie z połączeniem elementów w całość.
Mythos Preview wprowadza istotną zmianę w podejściu do automatycznego wykrywania podatności. Podczas gdy poprzednie modele graniczne koncentrowały się na identyfikacji pojedynczych błędów, nowy model Anthropic potrafi myśleć holistycznie o bezpieczeństwie kodu. Kluczową różnicą jest zdolność do „zszywania” różnych elementów w kompleksowe łańcuchy ataków.
Bourzikas podkreśla, że wcześniejsze rozwiązania często pozostawiały łańcuchy niedokończone, co utrudniało ocenę rzeczywistej możliwości eksploitacji. Mythos Preview rozwiązuje ten problem poprzez automatyczne tworzenie i testowanie proof-of-concept exploitów, co znacząco przyspiesza proces oceny zagrożeń.
Cloudflare nie polega wyłącznie na pojedynczym agencie AI. Firma opracowała wieloetapową architekturę z możliwością uruchomienia do 50 równoległych agentów. System dodatkowo wykorzystuje mechanizm adversarial review, w którym drugi agent próbuje obalić każde znalezisko pierwszego, co zwiększa precyzję wykrywania.
Jednak firma przestrzega przed potencjalnymi konsekwencjami rozwoju takich technologii. Te same możliwości, które pomagają w obronie systemów, będą także dostępne dla atakujących. To podwójne zastosowanie AI w cyberbezpieczeństwie stanowi wyzwanie, które branża będzie musiała rozwiązać w nadchodzących latach.
Test Mythos Preview w projekcie Glasswing pokazuje, jak sztuczna inteligencja może zrewolucjonizować podejście do bezpieczeństwa kodu, jednocześnie stawiając nowe pytania o równowagę między obroną a potencjalnymi zagrożeniami.

Zespół 22 naukowców wykazał, że Gemini 3.0 Flash znacząco poprawia jakość odpowiedzi na pytania zdrowotne, gdy ma dostęp do elektronicznej dokumentacji.

Nowy model Google potrafi przekształcać zdjęcia i filmy w realistyczne deepfake'i. Test pokazał, że jakość jest na tyle wysoka, że oszukała męża dziennikarki.

AI w Glendale Community College źle wymówił i pominął nazwiska studentów podczas ceremonii. Uczelnia zorganizowała powtórną uroczystość z ludzkim lektorem.