3 artykuły z tym tagiem
Nowy model Anthropic jako pierwszy ukończył symulacje cyberataków AISI, przewyższając prognozy rozwoju zdolności AI w cyberbezpieczeństwie.
Claude Mythos jako pierwszy model przekroczył możliwości pomiarowe METR, podczas gdy eksperci ostrzegają przed AI jako autonomicznymi operatorami cyberataków.
Badanie BankerToolBench pokazało, że GPT-5.4, Claude Opus 4.6 i inne topowe modele AI nie wyprodukują żadnego dokumentu gotowego do klienta.