23 kwietnia 20264 min czytania

ChatGPT for Clinicians przewyższa lekarzy w testach klinicznych — nowe narzędzie OpenAI dla medyków

OpenAI wprowadza ChatGPT for Clinicians dla lekarzy w USA. Model GPT-5.4 uzyskał 59 punktów w testach, przewyższając lekarzy z internetem (43,7 pkt).

Źródło zdjęcia: The Decoder

OpenAI wprowadził ChatGPT for Clinicians — bezpłatne narzędzie AI zaprojektowane specjalnie dla codziennej praktyki medycznej w USA. Zgodnie z nowym benchmarkiem HealthBench Professional, dostosowana wersja GPT-5.4 osiągnęła 59,0 punktów, przewyższając wyniki ludzkich lekarzy (43,7 punktów), którzy mieli nieograniczony czas i dostęp do internetu. Więcej szczegółów znajdziesz w raporcie The Decoder.

Kluczowe wnioski

• ChatGPT for Clinicians dostępny bezpłatnie — narzędzie skierowane do zweryfikowanych lekarzy, pielęgniarek z zaawansowanymi kwalifikacjami, asystentów lekarzy i farmaceutów w USA

• GPT-5.4 przewyższa lekarzy w testach — w benchmarku HealthBench Professional model osiągnął 59,0 punktów wobec 43,7 punktów uzyskanych przez lekarzy z nieograniczonym czasem i dostępem do internetu

• 99,6% odpowiedzi uznano za bezpieczne — podczas testów klinicznych z udziałem 6924 rozmów lekarze ocenili niemal wszystkie odpowiedzi jako bezpieczne i dokładne

• Zaawansowane funkcje medyczne — narzędzie oferuje wyszukiwanie w literaturze naukowej w czasie rzeczywistym, szablony dla powtarzających się procedur oraz możliwość zaliczania punktów CME

• Plany globalnej ekspansji — obecnie dostępne tylko w USA, OpenAI planuje międzynarodowe rozszerzenie współpracując z Better Evidence Network

Benchmark HealthBench Professional — nowy standard oceny AI

HealthBench Professional to nowy benchmark opracowany przez OpenAI do oceny wydajności AI w trzech obszarach klinicznych: konsultacje, pisanie i dokumentacja oraz badania medyczne. Benchmark został zaprojektowany tak, aby być szczególnie wymagającym — około jedna trzecia przykładów pochodziła z celowego "red teamingu", gdzie lekarze aktywnie szukali słabości w modelach.

W porównaniu z innymi modelami AI, GPT-5.4 w wersji klinicznej znacznie przewyższył konkurencję. Podstawowy GPT-5.4 osiągnął 48,1 punktów, Claude Opus 4.7 od Anthropic — 47,0 punktów, Google Gemini 3.1 Pro — 43,8 punktów, a Grok 4.2 od xAI tylko 36,1 punktów.

Istnieje jednak metodologiczna wątpliwość: OpenAI samo opracowało benchmark i testowało na nim własne modele. Firma wskazuje jednak na zewnętrzne oceny, takie jak Stanford MedHELM i MedMarks, gdzie modele OpenAI również zajmują czołowe pozycje.

Funkcje i możliwości narzędzia

ChatGPT for Clinicians został opracowany we współpracy z setkami doradców medycznych. Narzędzie oferuje bezpłatny dostęp do najnowszych modeli OpenAI oraz funkcję wyszukiwania klinicznego, która przeszukuje miliony recenzowanych źródeł z cytowaniami w czasie rzeczywistym.

Kluczową funkcjonalnością są "skills" — umożliwiają lekarzom przekształcenie powtarzających się procedur, takich jak listy skierowania, autoryzacje wstępne czy instrukcje dla pacjentów, w szablony do wielokrotnego użytku. Nietypową funkcją jest możliwość zaliczania badań klinicznych przeprowadzonych w ChatGPT jako punktów do kontynuacji edukacji medycznej (CME) w USA.

Karan Singhal z działu zdrowia OpenAI podkreśla, że w podzbiorze 355 przykładów, gdzie trzech niezależnych lekarzy wskazało właściwe źródła, ChatGPT for Clinicians cytował te źródła częściej niż ludzie lekarze. Do tej pory ponad 700 000 odpowiedzi modelu zostało przeanalizowanych przez lekarzy.

Prywatność i ekspansja globalna

Jeśli chodzi o prywatność, OpenAI zapewnia, że rozmowy nie będą wykorzystywane do trenowania modeli. Dla użytkowników przetwarzających chronione informacje zdrowotne dostępna jest opcjonalna zgodność z HIPAA poprzez Umowę o Współpracy Biznesowej.

Wprowadzenie narzędzia następuje w czasie przyspieszającej adopcji AI w medycynie. Badanie American Medical Association z 2026 roku wykazało, że 72% lekarzy w USA obecnie używa AI w praktyce klinicznej, w porównaniu z 48% rok wcześniej. OpenAI twierdzi, że miliony lekarzy na całym świecie już teraz używa ChatGPT co tydzień, a wykorzystanie wzrosło ponad dwukrotnie w ciągu ostatniego roku.

ChatGPT for Clinicians to kolejny krok OpenAI w kierunku zdominowania rynku medycznego AI, gdzie konkurują także Anthropic, Microsoft i Google — ten ostatni koncentruje się szczególnie na rozwoju leków poprzez Google DeepMind.

#GPT-5 #lekarze #OpenAI #medycyna #ChatGPT

Udostępnij

Źródła

The Decoder

Poprzedni

Gemma 4 VLA działa lokalnie na Jetson Orin Nano Super z 8 GB RAM

Następny

Claude integruje się z aplikacjami osobistymi - Spotify, Uber Eats i TurboTax już dostępne

Podobne Publikacje

Biznes i Rynek

Współzałożyciel Index Ventures przewiduje redystrybucję bogactwa z AI

Neil Rimer ostrzega przed nieuchronną redystrybucją majątków AI w czasie, gdy filantropia w tech słabnie, a władze rozważają podatki od bogactwa.

4 min18 lipca

Modele AI

Google Gemini otrzymał dużą aktualizację — nowe modele Flash są szybsze i tańsze

Google zaprezentował Gemini 3.6 Flash, Flash-Lite 3.5 i Flash Cyber 3.5. Nowe modele są bardziej efektywne kosztowo i zoptymalizowane pod agenty AI.

4 min21 lipca

Poradniki

Jak działają nowe limity Gemini AI od Google i jak sprawdzać wykorzystanie

Google zmienił sposób naliczania limitów Gemini AI z liczby zapytań na moc obliczeniową, wprowadzając cztery plany płatne i nowe zasady sprawdzania użycia.