Test: AI utklassade lÀkare att stÀlla diagnos

AI utklassade lÀkare genom att helt pÄ egen hand stÀlla diagnoser i en studie i USA.
–Naivt nog blev jag överraskad, sĂ€ger lĂ€karen och forskaren Adam Rodman.

En lÀkare kliver in i undersökningsrummet. Kommer AI att göra att lÀkarens roll förÀndras? Arkivbild.

En lÀkare kliver in i undersökningsrummet. Kommer AI att göra att lÀkarens roll förÀndras? Arkivbild.

Foto: Charlie Riedel/AP/TT

Forskning2024-12-22 15:53

I slutet pĂ„ förra Ă„ret satte sig 50 lĂ€kare för att stĂ€lla ett antal kluriga diagnoser. Halva gruppen fick ta hjĂ€lp av AI-verktyget Chat GPT, andra halvan inte.

– MĂ„nga vĂ„rdgivare i USA har börjat erbjuda chattrobotar till sina anstĂ€llda lĂ€kare, sĂ€ger Adam Rodman, som varit med och lagt upp studien, och fortsĂ€tter:

– Men vad gör det hĂ€r för lĂ€kares beslutsfattande – gör det dem bĂ€ttre?

"Utklassade dramatiskt"

Experimentet handlar inte frÀmst om sjÀlva diagnosen, utan hur lÀkaren kommer fram till den och om att fundera pÄ vad som talar för att lÀkaren kan ha fel.

NĂ„gon större skillnad i resultatet mellan grupperna mĂ€rktes inte. LĂ€karna som tog hjĂ€lp av sprĂ„kmodellen fick 76 procent rĂ€tt, kontrollgruppen 74 procent. Men den stora skrĂ€llen kom nĂ€r nĂ€r AI:n fick göra testet pĂ„ egen hand – den nĂ„dde 90 procent.

– AI-modellen utklassade dramatiskt bĂ„da grupperna. Den Ă€r fullt kapabel att göra en imponerande prestation pĂ„ egen hand – men den gjorde inte mĂ€nniskorna bĂ€ttre, sĂ€ger Rodman.

En förklaring till att lĂ€karna som anvĂ€nde Chat GPT inte lyckades bĂ€ttre Ă€r att de aldrig instruerades i hur den skulle anvĂ€ndas. MĂ„nga anvĂ€nde den som Google. En annan anledning Ă€r att mĂ€nniskor Ă€r dĂ„liga pĂ„ att argumentera mot sig sjĂ€lva.

– De Ă€r inte sĂ€rskilt bra pĂ„ att sĂ€ga "det hĂ€r Ă€r anledningarna till att jag kan ha fel". DĂ€r var AI-modellen jĂ€ttebra.

Ska inte ersÀtta

Resultatet Ă€r kontroversiellt och har gjort lĂ€kare i USA Ă€ngsliga, enligt Rodman. Han kan förstĂ„ det. Först lĂ€ser de medicin i fyra Ă„r, sedan specialisttjĂ€nstgöring (residency) i ytterligare tre–sju Ă„r.

– Allt för att lĂ€ra oss stĂ€lla diagnoser. DĂ„ Ă€r det nedslĂ„ende nĂ€r en sprĂ„kmodell, som trĂ€nats pĂ„ att skrapa internet och Gud vet vad, kan göra samma sak.

Svenska lÀkare upplever ocksÄ AI:ns intÄg.

– Vi ser att det finns en stor potential i AI till att förbĂ€ttra vĂ„rden. Och vi tror att alla lĂ€kare kommer att pĂ„verkas – eller pĂ„verkas redan – av utvecklingen, sĂ€ger Sofia Rydgren Stale, överlĂ€kare och ordförande för Sveriges lĂ€karförbund.

Var fjÀrde lÀkare anvÀnder redan AI i dag, framför allt för att hjÀlpa till att skriva journaler. Inom bilddiagnostiken, exempelvis i jakten pÄ cancertumörer, har ocksÄ stora framsteg gjorts. Samtidigt saknas i stort sett riktlinjer, vilket fackförbundet kritiserat.

NÀr det gÀller förmÄgan att stÀlla diagnos konstaterar Rydgren Stale att det kan finnas situationer dÀr AI gör bÀttre bedömningar.

– Jag tycker att man kan se det som att studien illustrerar pĂ„ ett bra sĂ€tt hur möjligheten att dra nytta av AI ser ut.

Samtidigt sÀger hon att AI gör sÀmre uppskattningar nÀr de fÄr andra typer av ingÄngsvÀrden. Hon betonar ocksÄ att sprÄkmodellerna Àr generella, och ofta inte trÀnade pÄ exempelvis vissa minoriteter, och problemen som finns med att patientdata kan lÀcka.

SÄ kommer AI:n att ta lÀkarnas jobb? Tekniken Àr billig och blir till skillnad frÄn mÀnniskor aldrig trött eller irriterad. Rydgren Stale tycker att det ibland finns en tendens frÄn politiskt hÄll att överskatta möjligheterna till besparingar.

– Det viktiga Ă€r att man anvĂ€nder potentialen men samtidigt hanterar de risker som finns. Det finns vissa saker som AI kommer att vara vĂ€ldigt duktig pĂ„, och annat dĂ€r mĂ€nniskan Ă€r mycket bĂ€ttre. Jag tror inte att AI kommer att kunna göra allting sjĂ€lv.

Diagnoser inte allt

Adam Rodman Ă€r tydlig med att pĂ„peka att studiens slutsats inte Ă€r att lĂ€kare ska ersĂ€ttas med AI. Att stĂ€lla diagnos Ă€r först och frĂ€mst en liten del av lĂ€karjobbet – och för att kunna göra det krĂ€vs det att lĂ€karen vet vilka frĂ„gor som ska stĂ€llas, och att tester görs – i det simulerade experimentet Ă€r information redan insamlad.

– Och den största delen av min arbetsdag gĂ„r inte Ă„t till att stĂ€lla komplexa diagnoser. Den gĂ„r Ă„t till att prata, koordinera, trösta och göra pappersarbete. Men det hĂ€r sĂ€tter fingret pĂ„ den Ă€ngslan som jag tror att mĂ„nga yrkesverksamma kĂ€nner för kraften i en del av de hĂ€r modellerna, sĂ€ger han.

I dag anvĂ€nder mĂ„nga lĂ€kare i USA AI för att spela in, skriva ut och sammanfatta patientsamtal. Om AI:n redan lyssnar – kan nĂ€sta steg vara att lĂ€gga sig i?

– Jag skulle vilja att AI:n var en tredje person i det samtalet som lyssnar och som ger rekommendationer och rĂ„d, eller till och med sĂ€ger till nĂ€r vi rĂ„kar ha förutfattade meningar, som vi vet Ă€r ett stort problem hos lĂ€kare, sĂ€ger Rodman.

Fakta: Chat GPT utklassade

Studien genomfördes i slutet av 2023 i USA, med 50 lÀkare. Deltagarna fick 60 minuter pÄ sig att gÄ igenom sex kliniska fall.

Fallen bygger pÄ riktiga patienter, dÀr medicinska experter stÀllt samman informationen.

LĂ€kare som slumpvis blev utvalda att fĂ„ anvĂ€nda Chat GPT4 fick 76 procent i genomsnittsbetyg i testet, kontrollgruppen som inte anvĂ€nde Chat GPT nĂ„dde 74 procent. Men nĂ€r Chat GPT sjĂ€lv fick försöka att lösa fallen uppnĂ„ddes 90 procent.

Rapporte presenteras i den vetenskapliga tidskriften Jama.


Fakta: LĂ€kare och AI

LĂ€kare vĂ€rlden över har – liksom andra yrkesgrupper – börjat anvĂ€nda sig av AI pĂ„ olika sĂ€tt. HĂ€r Ă€r nĂ„gra exempel:

Open Evidence: En sprÄkmodell som samlar medicinska studier och utifrÄn dem kan besvara medicinska frÄgor med ett naturligt sprÄk.

Transkribering av patientsamtal: LÀkaren kan anvÀnda en mikrofon (eller sin telefon) för att spela in patientsamtalen, som automatiskt skrivs ut och sammanfattar samtalet, och som Àven kan skriva ett första utkast till journalanteckning.

Patientportaler: Chattbottar kan vara ett första steg nÀr patienter söker lÀkarkontakt, som exempelvis kan stÀlla grundlÀggande frÄgor och sammanfatta svaren Ät lÀkaren.

BildigenkÀnning: Genom att trÀna AI pÄ bildmaterial frÄn patienter kan den lÀra sig att kÀnna igen sjukdomar och skador. Det kan handla om tumörer pÄ mammografibilder, eller att upptÀcka diabetes genom ögonbottenfotografering.

Forskning: MÄnga företag anvÀnder sig av AI för att hjÀlpa till att ta fram lÀkemedelskandidater. Den kan ocksÄ anvÀndas för att göra berÀkningar pÄ hur sjukdomsutbrott kan spridas.

SĂ„ jobbar vi med nyheter  LĂ€s mer hĂ€r!