5 artykułów z tym tagiem
Naukowcy opracowali DeepER-Med — system AI zapewniający przejrzysty proces oceny dowodów naukowych w medycynie z 87,5% zgodnością z rekomendacjami klinicznymi.
Badacze opracowali sposób kwantyfikacji strategii podejmowania decyzji przez modele językowe bez dostępu do ich wewnętrznej architektury.
OpenAI wprowadza nowe funkcjonalności do SDK agentów, w tym piaskownicę i harness dla modeli frontier, mające zwiększyć bezpieczeństwo i możliwości automatyzacji.
Nowy benchmark IBM testuje agentów AI w środowisku z 8000+ API, pokazując znaczące luki w wieloetapowym rozumowaniu biznesowym.
Nowe rozwiązanie AI Protect umożliwia cofanie działań autonomicznych agentów sztucznej inteligencji w środowiskach chmurowych przedsiębiorstw.