A i když je to správné, agent AI nemůže doplnit informace, které poskytuje znalostí, které lékaři získají prostřednictvím zkušeností, říká lékař plodnosti Jaime Knopman. Když pacienti na její klinice v Midtown Manhattan přinášejí informace od AI chatbotů, nemusí to být nutně nesprávné, ale to, co navrhuje LLM, nemusí být nejlepším přístupem pro konkrétní případ pacienta.
Například při zvažování IVF obdrží páry známky za životaschopnost pro jejich embrya. Ale požádat Chatgpt, aby poskytl doporučení o dalších krocích na základě těchto skóre samotných, nebere v úvahu další důležité faktory, říká Knopman. „Nejde jen o třídu: jsou do toho další věci“ – jako když bylo embryo biopsováno, stav pacientovy dělohy a zda v minulosti měli úspěch s plodností. Kromě let školení a lékařského vzdělávání Knopman říká, že „se postarala o tisíce a tisíce žen“. To, jak říká, dává svému skutečnému pohledu na to, jaké další kroky k provedení, které LLM postrádá.
Ostatní pacienti přijdou s jistotou, jak chtějí, aby přenos embryí provedl, na základě reakce, kterou obdrželi od AI, říká Knopman. Přestože metoda, kterou byla navržena, však může být běžná, mohou být pro okolnosti konkrétního pacienta vhodnější jiné kroky, říká. „Je tu věda, kterou studujeme, a učíme se, jak to dělat, ale pak je tu umění, proč je jedna modalita nebo protokol léčby pro pacienta lepší než jiný,“ říká.
Některé ze společností za těmito chatboty AI vytvářejí nástroje k řešení obav o vydané lékařské informace. OpenAI, mateřská společnost společnosti Chatgpt, oznámila 12. května, že zahajuje systém HealthBench, navrhovaný k měření schopností AI při reakci na zdravotní otázky. OpenAI říká, že program byl postaven s pomocí více než 260 lékařů v 60 zemích a zahrnuje 5 000 simulovaných zdravotních rozhovorů mezi uživateli a modely AI, s průvodcem bodováním navrženým lékaři k vyhodnocení odpovědí. Společnost tvrdí, že zjistila, že u dřívějších verzí svých modelů AI by se lékaři mohli zlepšit odpovědi generované chatbotem, ale tvrdí, že nejnovější modely, které jsou k dispozici od dubna 2025, jako je GPT-4.1, byly stejně dobré nebo lepší než lidské lékaři.
„Naše zjištění ukazují, že velké jazykové modely se postupem času výrazně zlepšily a již překonávaly odborníky na psaní odpovědí na příklady testované v našem benchmarku,“ říká AI na svých webových stránkách. „Přesto i ty nejpokročilejší systémy stále mají značný prostor pro zlepšení, zejména při hledání nezbytného kontextu pro nedostatečně specifikované dotazy a spolehlivost nejhorších případů.“
Ostatní společnosti vytvářejí nástroje specifické pro zdraví, které jsou speciálně navrženy pro lékařské odborníky. Microsoft říká, že vytvořil nový systém AI-nazývaný diagnostický orchestra MAI (MAI-DXO)-který při testování diagnostikovaných pacientů čtyřikrát přesněji jako lidské lékaři. Systém pracuje tím, že dotazuje několik předních velkých jazykových modelů – včetně OpenAI’s GPT, Google Gemini, Claude Anthropic, Meta’s Llama a Xai’s Grok – způsobem, který volně napodobuje více lidských odborníků, kteří spolupracují.
Noví lékaři se budou muset naučit, jak používat tyto nástroje AI, tak i poradenství pacientům, kteří je používají, říká Bernard S. Chang, děkan lékařského vzdělávání na Harvardské lékařské fakultě. Proto byla jeho univerzita jednou z prvních, která nabídla studentům třídy, jak tuto technologii používat ve svých praktikách. „Je to jedna z nejzajímavějších věcí, která se právě teď děje v lékařském vzdělávání,“ říká Chang.
Situace připomíná Changovi, kdy se lidé začali obracet na internet za lékařské informace před 20 lety. Pacienti by k němu přišli a řekli: „Doufám, že nejste jedním z těch lékařů, kteří používají Google.“ Ale když se vyhledávač stal všudypřítomným, chtěl na tyto pacienty odpovědět: „Nechtěl byste jít k lékaři, který to neudělal.“ Vidí to samé, co se nyní děje s AI. „Jaký druh lékaře praktikuje v popředí medicíny a tento mocný nástroj nepoužívá?“
Čerpáme z těchto zdrojů: google.com, science.org, newatlas.com, wired.com, pixabay.com