OpenAI wprowadza ChatGPT for Clinicians dla lekarzy w USA. Model GPT-5.4 uzyskał 59 punktów w testach, przewyższając lekarzy z internetem (43,7 pkt).

Źródło zdjęcia: The Decoder
OpenAI wprowadził ChatGPT for Clinicians — bezpłatne narzędzie AI zaprojektowane specjalnie dla codziennej praktyki medycznej w USA. Zgodnie z nowym benchmarkiem HealthBench Professional, dostosowana wersja GPT-5.4 osiągnęła 59,0 punktów, przewyższając wyniki ludzkich lekarzy (43,7 punktów), którzy mieli nieograniczony czas i dostęp do internetu. Więcej szczegółów znajdziesz w raporcie The Decoder.
• ChatGPT for Clinicians dostępny bezpłatnie — narzędzie skierowane do zweryfikowanych lekarzy, pielęgniarek z zaawansowanymi kwalifikacjami, asystentów lekarzy i farmaceutów w USA
• GPT-5.4 przewyższa lekarzy w testach — w benchmarku HealthBench Professional model osiągnął 59,0 punktów wobec 43,7 punktów uzyskanych przez lekarzy z nieograniczonym czasem i dostępem do internetu
• 99,6% odpowiedzi uznano za bezpieczne — podczas testów klinicznych z udziałem 6924 rozmów lekarze ocenili niemal wszystkie odpowiedzi jako bezpieczne i dokładne
• Zaawansowane funkcje medyczne — narzędzie oferuje wyszukiwanie w literaturze naukowej w czasie rzeczywistym, szablony dla powtarzających się procedur oraz możliwość zaliczania punktów CME
• Plany globalnej ekspansji — obecnie dostępne tylko w USA, OpenAI planuje międzynarodowe rozszerzenie współpracując z Better Evidence Network
HealthBench Professional to nowy benchmark opracowany przez OpenAI do oceny wydajności AI w trzech obszarach klinicznych: konsultacje, pisanie i dokumentacja oraz badania medyczne. Benchmark został zaprojektowany tak, aby być szczególnie wymagającym — około jedna trzecia przykładów pochodziła z celowego "red teamingu", gdzie lekarze aktywnie szukali słabości w modelach.
W porównaniu z innymi modelami AI, GPT-5.4 w wersji klinicznej znacznie przewyższył konkurencję. Podstawowy GPT-5.4 osiągnął 48,1 punktów, Claude Opus 4.7 od Anthropic — 47,0 punktów, Google Gemini 3.1 Pro — 43,8 punktów, a Grok 4.2 od xAI tylko 36,1 punktów.
Istnieje jednak metodologiczna wątpliwość: OpenAI samo opracowało benchmark i testowało na nim własne modele. Firma wskazuje jednak na zewnętrzne oceny, takie jak Stanford MedHELM i MedMarks, gdzie modele OpenAI również zajmują czołowe pozycje.
ChatGPT for Clinicians został opracowany we współpracy z setkami doradców medycznych. Narzędzie oferuje bezpłatny dostęp do najnowszych modeli OpenAI oraz funkcję wyszukiwania klinicznego, która przeszukuje miliony recenzowanych źródeł z cytowaniami w czasie rzeczywistym.
Kluczową funkcjonalnością są "skills" — umożliwiają lekarzom przekształcenie powtarzających się procedur, takich jak listy skierowania, autoryzacje wstępne czy instrukcje dla pacjentów, w szablony do wielokrotnego użytku. Nietypową funkcją jest możliwość zaliczania badań klinicznych przeprowadzonych w ChatGPT jako punktów do kontynuacji edukacji medycznej (CME) w USA.
Karan Singhal z działu zdrowia OpenAI podkreśla, że w podzbiorze 355 przykładów, gdzie trzech niezależnych lekarzy wskazało właściwe źródła, ChatGPT for Clinicians cytował te źródła częściej niż ludzie lekarze. Do tej pory ponad 700 000 odpowiedzi modelu zostało przeanalizowanych przez lekarzy.
Jeśli chodzi o prywatność, OpenAI zapewnia, że rozmowy nie będą wykorzystywane do trenowania modeli. Dla użytkowników przetwarzających chronione informacje zdrowotne dostępna jest opcjonalna zgodność z HIPAA poprzez Umowę o Współpracy Biznesowej.
Wprowadzenie narzędzia następuje w czasie przyspieszającej adopcji AI w medycynie. Badanie American Medical Association z 2026 roku wykazało, że 72% lekarzy w USA obecnie używa AI w praktyce klinicznej, w porównaniu z 48% rok wcześniej. OpenAI twierdzi, że miliony lekarzy na całym świecie już teraz używa ChatGPT co tydzień, a wykorzystanie wzrosło ponad dwukrotnie w ciągu ostatniego roku.
ChatGPT for Clinicians to kolejny krok OpenAI w kierunku zdominowania rynku medycznego AI, gdzie konkurują także Anthropic, Microsoft i Google — ten ostatni koncentruje się szczególnie na rozwoju leków poprzez Google DeepMind.