Pirmasis dokumentais užfiksuotas kasos vėžio atvejis datuojamas XVIII a. Nuo tada mokslininkai ėmėsi užsitęsusios ir sudėtingos odisėjos, kad suprastų sunkiai įveikiamą ir mirtiną ligą. Iki šiol nėra geresnio vėžio gydymo už ankstyvą intervenciją. Deja, kasa, esanti giliai pilve, yra ypač sunku anksti aptikti.
MIT kompiuterių mokslo ir dirbtinio intelekto laboratorijos (CSAIL) mokslininkai kartu su Limor Appelbaum, Beth Israel Deaconess medicinos centro (BIDMC) Radiacinės onkologijos skyriaus darbuotojais, norėjo geriau nustatyti galimus didelės rizikos pacientus. Jie nusprendė sukurti du mašininio mokymosi modelius, skirtus anksti nustatyti kasos latakų adenokarcinomą (PDAC), labiausiai paplitusią vėžio formą. Norėdama pasiekti plačią ir įvairią duomenų bazę, komanda sinchronizavosi su federacine tinklo įmone, naudodama elektroninius sveikatos įrašų duomenis iš įvairių JAV institucijų. Šis didžiulis duomenų rinkinys padėjo užtikrinti modelių patikimumą ir apibendrinimą, todėl jie buvo taikomi įvairiose populiacijose, geografinėse vietovėse ir demografinėse grupėse.
Du modeliai – „PRISM“ neuroninis tinklas ir logistinės regresijos modelis (statistinė tikimybės metodas) pranoko dabartinius metodus. Grupės palyginimas parodė, kad nors standartiniai atrankos kriterijai nustato apie 10 procentų PDAC atvejų, naudojant penkis kartus didesnę santykinę rizikos ribą, Prism gali aptikti 35 procentus PDAC atvejų esant tokiai pačiai ribai.
AI naudojimas vėžio rizikai aptikti nėra naujas reiškinys – algoritmai analizuoja mamogramas, kompiuterinę tomografiją plaučių vėžiui nustatyti ir padeda analizuoti Pap tepinėlio tyrimus ir ŽPV tyrimus. „PRISM modeliai išsiskiria savo kūrimu ir patvirtinimu didelėje daugiau nei 5 milijonų pacientų duomenų bazėje, pranokstančiu daugumos ankstesnių šios srities tyrimų mastą“, – sako Kai Jia, MIT elektros inžinerijos ir kompiuterių mokslo (EECS) doktorantas. , MIT CSAIL filialas ir pirmasis atvirosios prieigos dokumento autorius eBiomedicina apibrėžiant naująjį darbą. „Modelis naudoja įprastinius klinikinius ir laboratorinius duomenis, kad galėtų prognozuoti, o JAV gyventojų įvairovė yra reikšminga pažanga, palyginti su kitais PDAC modeliais, kurie paprastai apsiriboja tam tikrais geografiniais regionais, pavyzdžiui, kai kuriais JAV sveikatos priežiūros centrais. , naudojant unikalią įteisinimo techniką mokymo procese, padidėjo modelių apibendrinimas ir aiškinamumas.
„Šioje ataskaitoje aprašomas galingas būdas naudoti didelius duomenis ir dirbtinio intelekto algoritmus, siekiant patobulinti mūsų požiūrį į vėžio rizikos profilių nustatymą“, – sako Davidas Aviganas, Harvardo medicinos mokyklos profesorius ir vėžio centro direktorius bei BIDMC hematologijos ir hematologinių piktybinių navikų skyriaus vadovas. , kuris tyrime nedalyvavo. „Šis metodas gali paskatinti naujas strategijas, skirtas identifikuoti pacientus, kuriems yra didelė piktybinių navikų rizika, kuriems gali būti naudinga tikslinga atranka ir ankstyvos intervencijos galimybė.”
Prizminės perspektyvos
Kelionė link PRISM kūrimo prasidėjo daugiau nei prieš šešerius metus, paskatinta tiesioginės patirties, susijusios su dabartinės diagnostikos praktikos apribojimais. „Maždaug 80–85 procentai pacientų, sergančių kasos vėžiu, diagnozuojami pažengusiose stadijose, kai išgydyti nebėra galimybės“, – sako vyresnysis autorius Appelbaumas, kuris taip pat yra Harvardo medicinos mokyklos instruktorius ir radiologas onkologas. „Šis klinikinis nusivylimas sukėlė idėją pasigilinti į daugybę duomenų, turimų elektroniniuose sveikatos įrašuose (EHR).
Glaudus CSAIL grupės bendradarbiavimas su Appelbaum leido geriau suprasti bendrus medicininio ir mašininio mokymosi problemos aspektus, o tai galiausiai leido sukurti daug tikslesnį ir skaidresnį modelį. „Hipotezė buvo ta, kad šiuose įrašuose buvo paslėptų užuominų – subtilių požymių ir simptomų, galinčių veikti kaip ankstyvieji įspėjamieji kasos vėžio signalai“, – priduria ji. „Tai lėmė, kad kurdami šiuos modelius naudojome federacinius ESI tinklus, kad būtų galima pritaikyti rizikos prognozavimo įrankius sveikatos priežiūros srityje.”
Tiek PrismNN, tiek PrismLR modeliai analizuoja EHR duomenis, įskaitant pacientų demografinius duomenis, diagnozes, vaistus ir laboratorijos rezultatus, kad įvertintų PDAC riziką. „PrismNN“ naudoja dirbtinius neuroninius tinklus, kad nustatytų sudėtingus duomenų ypatybių, pvz., amžiaus, ligos istorijos ir laboratorijos rezultatų, modelius, todėl gaunamas PDAC tikimybės rizikos balas. PrismLR naudoja logistinę regresiją paprastesnei analizei, sugeneruodama PDAC tikimybės balą pagal šias savybes. Kartu šie modeliai siūlo nuodugnų skirtingų PDAC rizikos prognozavimo metodų įvertinimą pagal tuos pačius EHR duomenis.
Komanda pažymi, kad vienas iš svarbiausių aspektų siekiant įgyti gydytojų pasitikėjimą yra geresnis modelių veikimo supratimas, žinomas kaip aiškinamumas. Mokslininkai atkreipė dėmesį į tai, kad nors logistinės regresijos modelius iš esmės lengviau interpretuoti, dėl naujausių pasiekimų gilieji neuroniniai tinklai tapo šiek tiek skaidresni. Tai padėjo komandai patobulinti tūkstančius potencialiai nuspėjamų savybių, gautų iš vieno paciento EHR, iki maždaug 85 kritinių rodiklių. Šiuos rodiklius, įskaitant paciento amžių, diabeto diagnozę ir didesnį apsilankymų pas gydytojus dažnumą, modelis aptinka automatiškai, tačiau jie atitinka gydytojų supratimą apie rizikos veiksnius, susijusius su kasos vėžiu.
Kelias į priekį
Nepaisant PRISM modelių pažadų, kaip ir visi tyrimai, kai kurios dalys vis dar nebaigtos. Vien JAV duomenys yra dabartinė modelių dieta, kurią reikia išbandyti ir pritaikyti pasauliniam naudojimui. Komanda pažymi, kad kelias į priekį apima modelio pritaikymo tarptautiniams duomenų rinkiniams išplėtimą ir papildomų biologinių žymenų integravimą, kad būtų galima tiksliau įvertinti riziką.
„Tolimesnis mūsų tikslas yra palengvinti modelių diegimą įprastose sveikatos priežiūros įstaigose. Vizija yra, kad šie modeliai sklandžiai veiktų sveikatos priežiūros sistemų fone, automatiškai analizuodami pacientų duomenis ir įspėdami gydytojus apie didelės rizikos atvejus, nepadidindami jų darbo krūvio“, – sako Jia. „Mašininio mokymosi modelis, integruotas su ESI sistema, galėtų suteikti gydytojams ankstyvus įspėjimus apie didelės rizikos pacientus, o tai gali sudaryti sąlygas intervencijai gerokai anksčiau nei pasireiškia simptomai. Mes norime pritaikyti savo metodus realiame pasaulyje, kad padėtume visiems žmonėms gyventi ilgiau ir sveikiau.
Jia parašė straipsnį kartu su Applebaumu ir MIT EECS profesoriumi bei CSAIL vyriausiuoju tyrėju Martinu Rinardu, kurie abu yra vyresnieji šio straipsnio autoriai. Darbo MIT CSAIL metu tyrėjus iš dalies palaikė Gynybos pažangių tyrimų projektų agentūra, Boeing, Nacionalinis mokslo fondas ir Aarno Labs. „TriNetX“ suteikė išteklius projektui, o „Prevent Cancer Foundation“ taip pat palaikė komandą.