23 czerwca 20264 min czytania

GPT-5.5-Cyber przewyższa model Mythos w cyberbezpieczeństwie

OpenAI zaprezentowało GPT-5.5-Cyber, który osiąga 85,6% w benchmarku CyberGym, przewyższając konkurencyjny Mythos 5. Nowy model automatyzuje proces od wykrycia luk do łatek.

Źródło zdjęcia: The Decoder

OpenAI rozszerza swoją inicjatywę cyberbezpieczeństwa Daybreak o nowe narzędzia, które nie tylko identyfikują luki w zabezpieczeniach, ale także automatycznie je naprawiają. Firma zaprezentowała zaktualizowaną wtyczkę Codex Security oraz pełną wersję modelu GPT-5.5-Cyber, który według oficjalnych danych przewyższa konkurencyjny model Mythos firmy Anthropic na benchmarkach cyberbezpieczeństwa.

Aktualizacja jest odpowiedzią na problem, który OpenAI identyfikuje jako główne wąskie gardło w cyberbezpieczeństwie — przejście od wykrywania luk do ich faktycznego łatania. Firma uruchomiła również program partnerski z ponad 25 firmami zabezpieczającymi i kilkoma rządami.

Kluczowe wnioski

GPT-5.5-Cyber osiąga 85,6% skuteczności w benchmarku CyberGym, przewyższając model Mythos 5 (83,8%) firmy Anthropic.
Zaktualizowana wtyczka Codex Security przeskanowała już ponad 30 milionów commitów w ponad 30 000 bazach kodu, automatycznie oznaczając ponad 500 000 naprawionych problemów.
Program partnerski obejmuje firmy takie jak Cisco, CrowdStrike, Cloudflare, Palo Alto Networks oraz współpracę z rządami Australii, Kanady, Francji, Niemiec, Japonii i innych krajów.
Inicjatywa „Patch the Planet” ma na celu przeniesienie narzędzi łatania na oprogramowanie open-source, z udziałem projektów takich jak cURL, Go, Python czy Sigstore.
Model GPT-5.5-Cyber jest dostępny wyłącznie dla zweryfikowanych obrońców cyberbezpieczeństwa, z dodatkowym monitoringiem i zabezpieczeniami.

Codex Security automatyzuje cały proces od wykrycia do łatki

Wtyczka Codex Security, która zadebiutowała jako podgląd badawczy w marcu, przeszła znaczącą aktualizację. Od momentu premiery przeskanowała ponad 30 milionów commitów w ponad 30 000 bazach kodu. System automatycznie oznaczył ponad 500 000 problemów jako naprawione, a recenzenci ręcznie potwierdzili kolejne 70 000.

OpenAI projektuje zaktualizowaną wtyczkę jako „inżyniera bezpieczeństwa siedzącego obok każdego developera”. Narzędzie analizuje kod wraz z modelem zagrożeń, wykrywa luki, sprawdza czy podatny kod jest rzeczywiście dostępny, buduje ukierunkowaną łatkę i weryfikuje rezultat.

Nowości w tej aktualizacji obejmują głębokie skanowanie całych baz kodu, analizę ścieżek ataku oraz eksport do istniejących systemów zarządzania lukami poprzez pliki SARIF lub zapytania CodeQL. Wtyczka może także segregować wyniki z innych skanerów lub raportów bug bounty oraz automatyzować generowanie łatek w trybie wsadowym.

GPT-5.5-Cyber ustanawia nowe standardy w benchmarkach

Pełna wersja GPT-5.5-Cyber zastępuje wcześniejszy podgląd, który głównie miał na celu zmniejszenie niepotrzebnych odmów w procesach bezpieczeństwa. OpenAI nazywa zaktualizowany model najbardziej wydajnym pojedynczym modelem do znajdowania i łatania luk w oprogramowaniu.

Model prowadzi we wszystkich kluczowych benchmarkach cyberbezpieczeństwa. W CyberGym, który mierzy czy agent może odtworzyć znane luki w środowiskach programowych, GPT-5.5-Cyber osiąga 85,6%, podczas gdy Mythos 5 uzyskuje 83,8%. W ExploitGym, testującym zdolność przekształcania luk w działające exploity, model osiąga 39,5%. W SEC-bench Pro, oceniającym długoterminowe wykrywanie luk, GPT-5.5-Cyber uzyskuje 69,8%.

Najnowsza wersja GPT-5.5-Cyber jest celowo bardziej permisywna niż standardowe modele i odmawia mniej żądań. Jednak tylko zweryfikowani obrońcy mogą uzyskać do niego dostęp, a OpenAI łączy ten dostęp z weryfikacją, monitoringiem i zabezpieczeniami.

Rozbudowa programu partnerskiego i współpracy międzynarodowej

Poprzez Daybreak Cyber Partner Program firmy zabezpieczające mogą zintegrować GPT-5.5 z Trusted Access for Cyber ze swoimi produktami. Partnerzy obejmują Cisco, CrowdStrike, Cloudflare, Palo Alto Networks, IBM, Fortinet, Wiz, SentinelOne, Darktrace, Palantir, Accenture, PwC i KPMG.

OpenAI rozszerza również pracę z rządami. Firma ma partnerstwa Trusted Access z Australią, Kanadą, Francją, Niemcami, Japonią, Koreą Południową, agencją UE ENISA oraz Wielką Brytanią. W USA OpenAI pracuje nad realizacją niedawno wydanego rozporządzenia wykonawczego dotyczącego bezpieczeństwa AI i planuje bezpośrednią współpracę z operatorami infrastruktury krytycznej.

Inicjatywa „Patch the Planet”, realizowana wspólnie z Trail of Bits, HackerOne i Calif, ma na celu przeniesienie tych samych narzędzi łatania na oprogramowanie open-source. Ponad 30 projektów open-source przyłączyło się do inicjatywy, w tym cURL, Go, Python, Sigstore i pyca/cryptography. Pierwszy pięciodniowy sprint wykazał setki problemów i doprowadził do dziesiątek scalonych łatek.

#Anthropic #GPT-5.5-Cyber #cyberbezpieczeństwo #Mythos #OpenAI

Udostępnij

Źródła

The Decoder

Poprzedni

Apertus Mini — 16 małych modeli językowych demonstrujących techniki destylacji i kwantyzacji

Następny

CEO Snowflake: chiński GLM-5.2 konkuruje z Opus 4.7 za ułamek ceny

Podobne Publikacje

Narzędzia i Aplikacje

Mundial 2026: FIFA wprowadza AI dla wszystkich reprezentacji

FIFA udostępni Football AI Pro wszystkim drużynom na mundialu 2026. Agent AI ma wyrównać szanse między bogatymi i biednymi federacjami.

4 min25 czerwca

Modele AI

OpenAI opóźnia wydanie GPT-5.6 na żądanie administracji Trumpa

OpenAI musi najpierw udostępnić nowe modele AI wybranym klientom zatwierdzonym przez rząd amerykański, zanim będą dostępne publicznie.

4 min26 czerwca

Badania i Nauka

Jakie tokeny lepiej przewidują modele hybrydowe? Badanie AllenAI porównuje Olmo Hybrid z transformerem

Badanie AllenAI ujawnia, że modele hybrydowe przewyższają transformery przy słowach znaczących, ale przegrywają przy powtórzeniach i zamykających nawiasach.

4 min25 czerwca

Kluczowe wnioski

GPT-5.5-Cyber osiąga 85,6% skuteczności w benchmarku CyberGym, przewyższając model Mythos 5 (83,8%) firmy Anthropic.

Zaktualizowana wtyczka Codex Security przeskanowała już ponad 30 milionów commitów w ponad 30 000 bazach kodu, automatycznie oznaczając ponad 500 000 naprawionych problemów.

Program partnerski obejmuje firmy takie jak Cisco, CrowdStrike, Cloudflare, Palo Alto Networks oraz współpracę z rządami Australii, Kanady, Francji, Niemiec, Japonii i innych krajów.

Inicjatywa „Patch the Planet” ma na celu przeniesienie narzędzi łatania na oprogramowanie open-source, z udziałem projektów takich jak cURL, Go, Python czy Sigstore.

Model GPT-5.5-Cyber jest dostępny wyłącznie dla zweryfikowanych obrońców cyberbezpieczeństwa, z dodatkowym monitoringiem i zabezpieczeniami.

Codex Security automatyzuje cały proces od wykrycia do łatki

GPT-5.5-Cyber ustanawia nowe standardy w benchmarkach

Rozbudowa programu partnerskiego i współpracy międzynarodowej