Zespół 22 naukowców wykazał, że Gemini 3.0 Flash znacząco poprawia jakość odpowiedzi na pytania zdrowotne, gdy ma dostęp do elektronicznej dokumentacji.

Źródło zdjęcia: arXiv.org
Badanie opublikowane na arXiv pokazuje, jak duże modele językowe mogą wykorzystać dane z elektronicznych dokumentacji medycznych (PHR) do udzielania lepszych odpowiedzi na pytania zdrowotne pacjentów. Zespół badawczy złożony z 22 naukowców przeanalizował 2257 pytań użytkowników, testując możliwości modelu Gemini 3.0 Flash w kontekście spersonalizowanej opieki zdrowotnej.
Naukowcy przetestowali trzy różne scenariusze udostępniania informacji modelowi AI. Pierwszą opcją były odpowiedzi generowane bez kontekstu medycznego. Drugą — podstawowe podsumowanie zawierające dane demograficzne, schorzenia i leki pacjenta. Trzecią stanowiły pełne, szczegółowe notatki kliniczne z dokumentacji medycznej.
Pytania pochodziły z trzech źródeł reprezentujących różne sposoby komunikacji pacjentów z systemami zdrowotnymi. Krótsze zapytania naśladowały typowe wyszukiwania internetowe. Dłuższe pytania wywodzą się z szablonów rozmów z chatbotami medycznymi. Trzecia kategoria zawierała autentyczne pytania, które pacjenci kierowali do swoich zespołów medycznych podczas wizyt lub telefonów.
Badanie wykazało statystycznie istotną poprawę we wszystkich typach pytań, gdy model miał dostęp do danych medycznych pacjenta. Autorzy zaobserwowali także potencjalne korzyści w zakresie bezpieczeństwa, dokładności, trafności i personalizacji odpowiedzi.
Do oceny jakości odpowiedzi wykorzystano istniejące ramy SHARP oraz nowo opracowane kryteria specyficzne dla błędów w interpretacji dokumentacji medycznej. Oceny przeprowadzono zarówno automatycznie dla pełnego zestawu danych, jak i z udziałem klinicystów dla wybranej próby 95 przypadków.
Badacze zidentyfikowali konkretne ograniczenia modelu, szczególnie w zakresie orientacji czasowej w złożonych dokumentacjach oraz sporadyczne, ale znaczące przypadki generowania nieprawdziwych informacji. Te obserwacje wskazują na konieczność dalszych prac nad monitorowaniem i poprawą jakości odpowiedzi AI opartych na danych medycznych.
Wyniki sugerują znaczny potencjał wykorzystania elektronicznych dokumentacji medycznych do wspomagania pacjentów w lepszym zrozumieniu ich stanu zdrowia oraz tworzenia ram do systematycznego monitorowania luk w odpowiedziach modeli językowych opartych na danych medycznych.

Samsung uniknął strajku 48 tys. pracowników, oferując rekordowe premie sięgające 416 tys. dolarów dla specjalistów od pamięci flash.

xAI zbiera dane podatkowe pracowników, by poprawić możliwości chatbota Grok. Część osób nadal nie otrzymała obiecanych pieniędzy za przekazanie dokumentów.

AI w Glendale Community College źle wymówił i pominął nazwiska studentów podczas ceremonii. Uczelnia zorganizowała powtórną uroczystość z ludzkim lektorem.