OpenAI zaprezentowało GPT-5.5-Cyber, który osiąga 85,6% w benchmarku CyberGym, przewyższając konkurencyjny Mythos 5. Nowy model automatyzuje proces od wykrycia luk do łatek.

Źródło zdjęcia: The Decoder
OpenAI rozszerza swoją inicjatywę cyberbezpieczeństwa Daybreak o nowe narzędzia, które nie tylko identyfikują luki w zabezpieczeniach, ale także automatycznie je naprawiają. Firma zaprezentowała zaktualizowaną wtyczkę Codex Security oraz pełną wersję modelu GPT-5.5-Cyber, który według oficjalnych danych przewyższa konkurencyjny model Mythos firmy Anthropic na benchmarkach cyberbezpieczeństwa.
Aktualizacja jest odpowiedzią na problem, który OpenAI identyfikuje jako główne wąskie gardło w cyberbezpieczeństwie — przejście od wykrywania luk do ich faktycznego łatania. Firma uruchomiła również program partnerski z ponad 25 firmami zabezpieczającymi i kilkoma rządami.
Wtyczka Codex Security, która zadebiutowała jako podgląd badawczy w marcu, przeszła znaczącą aktualizację. Od momentu premiery przeskanowała ponad 30 milionów commitów w ponad 30 000 bazach kodu. System automatycznie oznaczył ponad 500 000 problemów jako naprawione, a recenzenci ręcznie potwierdzili kolejne 70 000.
OpenAI projektuje zaktualizowaną wtyczkę jako „inżyniera bezpieczeństwa siedzącego obok każdego developera”. Narzędzie analizuje kod wraz z modelem zagrożeń, wykrywa luki, sprawdza czy podatny kod jest rzeczywiście dostępny, buduje ukierunkowaną łatkę i weryfikuje rezultat.
Nowości w tej aktualizacji obejmują głębokie skanowanie całych baz kodu, analizę ścieżek ataku oraz eksport do istniejących systemów zarządzania lukami poprzez pliki SARIF lub zapytania CodeQL. Wtyczka może także segregować wyniki z innych skanerów lub raportów bug bounty oraz automatyzować generowanie łatek w trybie wsadowym.
Pełna wersja GPT-5.5-Cyber zastępuje wcześniejszy podgląd, który głównie miał na celu zmniejszenie niepotrzebnych odmów w procesach bezpieczeństwa. OpenAI nazywa zaktualizowany model najbardziej wydajnym pojedynczym modelem do znajdowania i łatania luk w oprogramowaniu.
Model prowadzi we wszystkich kluczowych benchmarkach cyberbezpieczeństwa. W CyberGym, który mierzy czy agent może odtworzyć znane luki w środowiskach programowych, GPT-5.5-Cyber osiąga 85,6%, podczas gdy Mythos 5 uzyskuje 83,8%. W ExploitGym, testującym zdolność przekształcania luk w działające exploity, model osiąga 39,5%. W SEC-bench Pro, oceniającym długoterminowe wykrywanie luk, GPT-5.5-Cyber uzyskuje 69,8%.
Najnowsza wersja GPT-5.5-Cyber jest celowo bardziej permisywna niż standardowe modele i odmawia mniej żądań. Jednak tylko zweryfikowani obrońcy mogą uzyskać do niego dostęp, a OpenAI łączy ten dostęp z weryfikacją, monitoringiem i zabezpieczeniami.
Poprzez Daybreak Cyber Partner Program firmy zabezpieczające mogą zintegrować GPT-5.5 z Trusted Access for Cyber ze swoimi produktami. Partnerzy obejmują Cisco, CrowdStrike, Cloudflare, Palo Alto Networks, IBM, Fortinet, Wiz, SentinelOne, Darktrace, Palantir, Accenture, PwC i KPMG.
OpenAI rozszerza również pracę z rządami. Firma ma partnerstwa Trusted Access z Australią, Kanadą, Francją, Niemcami, Japonią, Koreą Południową, agencją UE ENISA oraz Wielką Brytanią. W USA OpenAI pracuje nad realizacją niedawno wydanego rozporządzenia wykonawczego dotyczącego bezpieczeństwa AI i planuje bezpośrednią współpracę z operatorami infrastruktury krytycznej.
Inicjatywa „Patch the Planet”, realizowana wspólnie z Trail of Bits, HackerOne i Calif, ma na celu przeniesienie tych samych narzędzi łatania na oprogramowanie open-source. Ponad 30 projektów open-source przyłączyło się do inicjatywy, w tym cURL, Go, Python, Sigstore i pyca/cryptography. Pierwszy pięciodniowy sprint wykazał setki problemów i doprowadził do dziesiątek scalonych łatek.

FIFA udostępni Football AI Pro wszystkim drużynom na mundialu 2026. Agent AI ma wyrównać szanse między bogatymi i biednymi federacjami.

OpenAI musi najpierw udostępnić nowe modele AI wybranym klientom zatwierdzonym przez rząd amerykański, zanim będą dostępne publicznie.

Badanie AllenAI ujawnia, że modele hybrydowe przewyższają transformery przy słowach znaczących, ale przegrywają przy powtórzeniach i zamykających nawiasach.