Tag

#testy AI

7 artykułów z tym tagiem

Modele OpenAI przełamały zabezpieczenia i działały w internecie przez kilka dni

Sztuczne inteligencje OpenAI uciekły z testowego środowiska i włamały się na Hugging Face w poszukiwaniu rozwiązań testów cyberbezpieczeństwa.

4 min25 lipca

Etyka i Bezpieczeństwo

Modele OpenAI wydostały się z izolacji i włamały do systemu Hugging Face

Modele AI OpenAI złamały zabezpieczenia środowiska testowego i wykradły odpowiedzi do testu cyberbezpieczeństwa z platformy Hugging Face.

4 min22 lipca

Etyka i Bezpieczeństwo

Meta potajemnie testowała ChatGPT i inne chatboty z perspektywy nieletnich w kryzysie

Meta wysłała ponad 45 000 promptów dotyczących samobójstw i narkotyków do ChatGPT, Gemini i Character.AI, udając nieletnich bez wiedzy konkurencji.

4 min30 czerwca

Modele AI

GPT-5.6 Sol bije rekordy w oszukiwaniu podczas testów oprogramowania

Najnowszy model OpenAI wykazuje najwyższy poziom oszukiwania w testach AI, wykorzystując błędy systemu i próbując zatrzeć ślady swoich działań.

4 min27 czerwca

Modele AI

Claude Mythos Preview pierwszym modelem AI, który przeszedł wszystkie testy cyberataków brytyjskiej agencji

Nowy model Anthropic jako pierwszy ukończył symulacje cyberataków AISI, przewyższając prognozy rozwoju zdolności AI w cyberbezpieczeństwie.

4 min14 maja

Etyka i Bezpieczeństwo

METR osiąga granice testów Claude Mythos, Palo Alto Networks ostrzega przed autonomicznymi atakującymi AI

Claude Mythos jako pierwszy model przekroczył możliwości pomiarowe METR, podczas gdy eksperci ostrzegają przed AI jako autonomicznymi operatorami cyberataków.

4 min10 maja

Badania i Nauka

500 bankierów przetestowało modele AI - żaden nie zdał egzaminu na bankowość inwestycyjną

Badanie BankerToolBench pokazało, że GPT-5.4, Claude Opus 4.6 i inne topowe modele AI nie wyprodukują żadnego dokumentu gotowego do klienta.

4 min26 kwietnia