8 maja 20264 min czytania

CyberSecQwen-4B: dlaczego cyberbezpieczeństwo potrzebuje małych, wyspecjalizowanych modeli lokalnych

Nowy model AI o 4 mld parametrów dla cyberbezpieczeństwa działa lokalnie i osiąga 97% dokładności 8-miliardowego konkurenta przy połowie rozmiaru.

Źródło zdjęcia: huggingface.co

Poprzedni

OpenAI udostępnia GPT-5.5-Cyber specjalistom od cyberbezpieczeństwa

Następny

PlayStation sees AI as a ‘powerful tool’ to help make games

Podobne Publikacje

Modele AI

ChatGPT zyskuje nowych użytkowników — kobiety i starsi użytkownicy napędzają wzrost w Q1 2026

Dane OpenAI za Q1 2026 pokazują, że kobiety stanowią już ponad połowę użytkowników ChatGPT, a największy wzrost adopcji odnotowano w krajach Ameryki Łacińskiej i Afryki.

4 min12 maja

Etyka i Bezpieczeństwo

Sztuczna inteligencja do rozpoznawania emocji wkracza do firm mimo wątpliwych podstaw naukowych

Firmy coraz częściej używają AI do monitorowania emocji pracowników, choć systemy wykazują bias rasowy i opierają się na kwestionowanej nauce.

Kluczowe wnioski

CyberSecQwen-4B osiąga 97,3% dokładności 8-miliardowego modelu Foundation-Sec-Instruct-8B przy połowie jego rozmiaru, jednocześnie przewyższając go o 8,7 punktu procentowego w testach CTI-MCQ.

Model można uruchomić na jednej karcie graficznej z 12 GB pamięci, co czyni go dostępnym dla środowisk z ograniczonymi zasobami sprzętowymi.

Został wytrenowany na danych Apache-2.0, w tym mapowaniach CVE→CWE z MITRE/NVD oraz syntetycznych danych Q&A dla analityków bezpieczeństwa.

Całkowity proces treningu odbywał się na jednym AMD Instinct MI300X z 192 GB pamięci HBM3, bez konieczności kwantyzacji czy dzielenia modelu między urządzenia.

Model adresuje kluczowy problem bezpieczeństwa — konieczność przetwarzania wrażliwych danych cyberbezpieczeństwa lokalnie, bez wysyłania do zewnętrznych API.

Dlaczego lokalne modele są kluczowe dla cyberbezpieczeństwa

Autorzy projektu argumentują, że duże modele generatywne, choć uniwersalne, mają istotne ograniczenia w zastosowaniach obronnych. Wysyłanie wrażliwych danych — jak raporty incydentów, payloady ataków czy szkice ujawnień podatności — do zewnętrznych API może samo w sobie stanowić naruszenie bezpieczeństwa.

Koszty API również stanowią barierę. Średniej wielkości centrum operacji bezpieczeństwa (SOC) przetwarza tysiące alertów o niskim poziomie pewności dziennie. Automatyzacja zadań takich jak „wyjaśnij tę podatność CVE” czy „jakie CWE tutaj stosuje” może szybko stać się problemem budżetowym przy użyciu hostowanych modeli.

Dodatkowo, środowiska typu air-gap oraz częściowo połączone sieci są standardem w infrastrukturze krytycznej, służbie zdrowia i instytucjach rządowych. Jeśli narzędzie nie może działać na laptopie lub pojedynczej karcie graficznej, nie zostanie tam wdrożone.

Metodologia i wyniki testów

Model wykorzystuje jako bazę Qwen3–4B-Instruct-2507 — najlepiej działający model 4B dostępny w czasie treningu, z licencją Apache-2.0. Kluczową decyzją było fine-tunowanie od wersji instruction-tuned, a nie bazowej, co pozwoliło zachować odpowiedni format odpowiedzi dla zadań wielokrotnego wyboru.

W testach porównawczych na benchmarku CTI-Bench, CyberSecQwen-4B osiągnął:

CTI-MCQ (2500 pozycji): 0,5868 ± 0,0029 vs 0,4996 dla Foundation-Sec-Instruct-8B

CTI-RCM (1000 pozycji CVE→CWE): 0,6664 ± 0,0023 vs 0,6850 dla konkurenta

Model wykorzystuje konfigurację LoRA z r=64, alpha=64, learning rate 5e-5 oraz FlashAttention-2 dla optymalizacji pamięci i prędkości. Cały proces — trening, łączenie adapterów i ewaluacja — odbywa się na jednym AMD Instinct MI300X z 192 GB pamięci HBM3.

Dane treningowe składają się z dwóch zbiorów: mapowań CVE→CWE z lat 2021 z publicznych rekordów MITRE/NVD oraz syntetycznych danych Q&A generowanych przez silniejszy model nauczyciel. Kluczowo, wszystkie przecięcia z zestawem ewaluacyjnym CTI-Bench zostały usunięte przed treningiem, zapewniając rzetelne wyniki testów.

CyberSecQwen-4B pokazuje, że wyspecjalizowane modele o mniejszych rozmiarach mogą skutecznie konkurować z większymi odpowiednikami w wąskich domenach, jednocześnie oferując praktyczne korzyści w postaci lokalnego wdrażania i kontroli nad wrażliwymi danymi.