Kan en enda modell för artificiell intelligens användas för allt inom medicin?

Dr. Marco V. Benavides Sánchez. Medmultilingua.com /

Tänk dig att ditt sjukhus behöver förutsäga om en patients tillstånd kommer att försämras under de kommande timmarna, hur många sängplatser som kommer att finnas tillgängliga imorgon, eller om vissa laboratorievärden kommer att öka kraftigt. Idag kräver vart och ett av dessa problem vanligtvis en annan artificiell intelligens-modell, specifikt tränad för den uppgiften. Men tänk om en enda modell kunde göra allt detta – och till och med fungera på ett annat sjukhus – utan att behöva börja om från början?

Det är den centrala frågan i en nyligen genomförd studie av Pucher och kollegor, publicerad i Artificial Intelligence in Medicine. Och svaret är ja, det är möjligt.

Problemet som ingen vill ignorera

Moderna sjukhus genererar en enorm mängd data över tid: vitala tecken som registreras varje timme, laboratorieresultat, patientflöden, sängbeläggning. Att analysera denna information i tid kan rädda liv eller förbättra resurshanteringen. Men att bygga en AI-modell för var och en av dessa användningsområden är dyrt, tidskrävande och svårt att underhålla. Eller så är det helt enkelt utom räckhåll för just det hälso- och sjukvårdssystemet.

Det är här grundmodellerna kommer in i bilden: artificiella intelligenssystem som är förtränade med stora mängder varierad data, och som kan anpassa sig till flera uppgifter utan att kräva omfattande träning från grunden. Inom datorterminologi är två av de mest kända exemplen på tidsserieanalys Chronos och TimesFM. Löftet är attraktivt, men hittills har det funnits få solida bevis för hur de presterar i verkliga kliniska miljöer.

Hur studien genomfördes

Forskarna arbetade med data från tre tyska universitetssjukhus, inklusive universitetssjukhuset i Essen, med hjälp av MIMIC IV, en allmänt använd nordamerikansk databas inom biomedicinsk forskning. De definierade sex specifika kliniska scenarier – förutsägelse av vitala tecken, laboratorievärden, sjukhuskapacitet, bland annat – och jämförde grundmodellerna med mer traditionella metoder som neurala nätverk, klassiska statistiska modeller och gradientförstärkning.

Utvärderingen genomfördes under två förhållanden. För det första, i noll-shot-läge: modellerna användes som de var, utan ytterligare träning med lokala data. För det andra, med finjustering: de justerades med en liten mängd data från själva sjukhuset. Dessutom analyserade forskarna något avgörande för klinisk praxis: vad händer när en numerisk förutsägelse (till exempel en sannolikhet) blir ett binärt beslut, såsom ”hög risk” eller ”låg risk”?

Vad de fann

Resultaten är slående i sin konsekvens. I noll-shot-läge uppnådde grundmodellerna prestanda nära de specialiserade modellernas, som hade optimerats specifikt för varje uppgift. Det betyder att modellen, utan att tidigare ha ”sett” data från det sjukhuset, redan var konkurrenskraftig. Den vann inte alltid, men den var inte heller långt efter.

När finjustering tillämpades förändrades situationen ännu mer till deras fördel. Chronos och TimesFM rankades bland de bästa modellerna i 19 respektive 18 av de utvärderade scenarierna. AutoML-ensemblerna (modeller som kombinerar flera AI-algoritmer för att producera en mer exakt och stabil förutsägelse än en enda modell), som anses vara guldstandarden, uppnådde detta i 21 fall. Med andra ord, med minimala justeringar blir grundmodellerna praktiskt taget likvärdiga med de bästa som finns tillgängliga idag.

Men kanske det mest relevanta fyndet för verklig praktik är ett annat: grundmodellerna generaliserar bättre mellan institutioner. Enkelt uttryckt presterar de bra på ett annat sjukhus än det som används för att utbilda dem. Detta är en långvarig utmaning inom medicinsk AI: en modell som tränats på ett tyskt sjukhus kan prestera dåligt på ett i Mexiko eller Colombia eftersom patienterna, protokollen och till och med mätutrustningen är olika. Grundmodellerna visade större stabilitet inför dessa variationer.

Vad man bör tänka på

Studien belyser också en viktig punkt: när kontinuerliga förutsägelser översätts till binära kliniska beslut – utlösa en varning, eskalera ett fall, modifiera en behandling – beror resultaten starkt på hur beslutströskeln kalibreras (den punkt där en modell omvandlar en förutsägelse till ett kategoriskt beslut). En modell kan generera många falsklarm eller, omvänt, förbise kritiska fall om den inte noggrant anpassas till det lokala sammanhanget.

Detta är inte en begränsning som är unik för grundmodeller, utan en allmän påminnelse: AI inom medicin är inte en knapp man trycker på och det är allt. Det kräver validering, klinisk tillsyn och kontinuerlig anpassning.

Vad förändras med detta?

Denna studie ger solida bevis för att grundmodeller är ett gångbart alternativ till tidsseriebaserad klinisk prognos (data som förändras över tid och som AI lär sig att förutsäga). De ersätter inte klinisk bedömning eller eliminerar behovet av handledning, men de öppnar dörren till mer tillgänglig, flexibel och lättförbättrad AI på sjukhus.

För hälso- och sjukvårdssystem med begränsade resurser, eller för sjukhus som saknar datateam som kan bygga modeller från grunden, är detta särskilt relevant: möjligheten att använda en universell modell, anpassa den med minimal lokal data och distribuera den över flera uppgifter skulle kunna påskynda införandet av klinisk AI avsevärt.

En enda modell som tjänar många syften inom medicin? Det är inte science fiction: det finns redan publicerade bevis.

Referens

Pucher, G., Dada, A., Agbodoyetin, A., Nensa, F., Schuler, M., Reinhardt, H. C., Kleesiek, J., & Sauer, C. M. (2026). Can one model fit all? Evaluating foundation models for time series forecasting across clinical medicine. Artificial Intelligence in Medicine, 103473. https://doi.org/10.1016/j.artmed.2026.103473

Rekommenderade hashtaggar

#AIinMedicine #TimeSeriesForecasting #FoundationModels #ClinicalAI #HealthcareData #MedicalInnovation #MachineLearning #Chronos #TimesFM #ClinicalForecasting #DigitalHealth #Medmultilingua

Biomedicinsk artificiell intelligens

Kan en enda modell för artificiell intelligens användas för allt inom medicin?

Lämna ett svar Avbryt svar