Gydytojai dažnai teiraujasi paciento elektroniniame sveikatos įraše informacijos, kuri padėtų priimti sprendimus dėl gydymo, tačiau sudėtingas šių įrašų pobūdis trukdo šiam procesui. Tyrimai parodė, kad net tada, kai gydytojas buvo apmokytas naudotis elektroniniu sveikatos įrašu (ESI), atsakymo į vieną klausimą paieška vidutiniškai gali užtrukti daugiau nei aštuonias minutes.
Kuo daugiau laiko gydytojai turi praleisti naršydami dažnai nepatogioje ESI sąsajoje, tuo mažiau laiko jie turės bendrauti su pacientais ir teikti gydymą.
Tyrėjai pradėjo kurti mašininio mokymosi modelius, kurie gali supaprastinti procesą. automatiškai surasdami gydytojams reikalingą informaciją ESI. Tačiau norint parengti veiksmingus modelius, reikalingi didžiuliai atitinkamų medicininių klausimų duomenų rinkiniai, kuriuos dažnai sunku rasti dėl privatumo apribojimų. Esami modeliai stengiasi generuoti autentiškus klausimus – tuos, kuriuos užduotų gydytojas – ir dažnai negali sėkmingai rasti teisingų atsakymų.
Siekdami įveikti šį duomenų trūkumą, MIT mokslininkai bendradarbiavo su medicinos ekspertai, kad ištirtų klausimus, kuriuos gydytojai užduoda peržiūrėdami ESI. Tada jie sukūrė viešai prieinamą duomenų rinkinį, sudarytą iš daugiau nei 2 000 kliniškai svarbių klausimų, kuriuos parašė šie medicinos ekspertai.
Kai jie panaudojo savo duomenų rinkinį mašininio mokymosi modeliui parengti klinikiniams klausimams generuoti, jie nustatė, kad modelis uždavė aukštos kokybės ir autentiškus klausimus, palyginti su tikrais medicinos ekspertų klausimais, daugiau nei 000 procentais laiko.
Naudodami šį duomenų rinkinį, jie planuoja sugeneruoti daugybę autentiškų medicininių klausimų ir panaudoti šiuos klausimus mašininio mokymosi modeliui, kuris padėtų gydytojams rasti ieškomus -Po to, kai informacija paciento įraše bus efektyvesnė.
„Du tūkstančiai klausimų gali atrodyti daug, bet pažvelgus į šiais laikais mokomus mašininio mokymosi modelius, jie turi tiek daug duomenų, gal milijardai duomenų taškų. Kai mokote mašininio mokymosi modelius dirbti sveikatos priežiūros įstaigose, turite būti tikrai kūrybingi, nes labai trūksta duomenų“, – sako pagrindinis autorius Ericas Lehmanas, kompiuterių mokslo ir dirbtinio intelekto laboratorijos (CSAIL) absolventas. .
Vyresnysis autorius yra Peteris Szolovits, Elektros inžinerijos ir informatikos katedros (EECS) profesorius, vadovaujantis CSAIL klinikinių sprendimų priėmimo grupei ir taip pat šios grupės narys. MIT-IBM Watson AI laboratorija. Mokslinis darbas, bendradarbiaujantis tarp MIT, MIT-IBM Watson AI Lab, IBM tyrimų ir gydytojų bei medicinos ekspertų, padėjusių kelti klausimus ir dalyvavusių tyrime, bus pristatytas kasmetinėje Šiaurės konferencijoje. Kompiuterinės lingvistikos asociacijos Amerikos skyrius.
„Realūs duomenys yra labai svarbūs mokymo modeliams, kurie yra susiję su užduotimi, tačiau kuriuos sunku rasti ar sukurti“, – sako Szolovits. „Šio darbo vertė yra kruopščiai renkant gydytojų užduodamus klausimus apie pacientų atvejus, todėl galime sukurti metodus, kurie naudoja šiuos duomenis ir bendrosios kalbos modelius, kad pateiktume kitus patikimus klausimus.“
Duomenų trūkumas
Keletas didelių klinikinių klausimų duomenų rinkinių, kuriuos mokslininkams pavyko rasti, turėjo daugybę problemų, Lehmanas paaiškina. Kai kurie buvo sudaryti iš medicininių klausimų, kuriuos pacientai uždavė interneto forumuose, kurie yra toli nuo gydytojų klausimų. Kituose duomenų rinkiniuose buvo klausimų, sudarytų iš šablonų, todėl jų struktūra dažniausiai yra identiška, todėl daugelis klausimų yra nerealūs.
„Aukštos kokybės duomenų rinkimas yra tikrai svarbus atliekant mašininio mokymosi užduotis, ypač sveikatos priežiūros kontekste, ir mes parodėme, kad tai galima padaryti“, – sako Lehmanas.
Kurdami duomenų rinkinį, MIT mokslininkai paskutiniais metais dirbo su praktikuojančiais gydytojais ir medicinos studentais. mokymų. Jie šiems medicinos ekspertams pateikė daugiau nei 100 ESI išleidimo santraukas ir liepė perskaityti santrauką ir užduoti bet kokius klausimus. Tyrėjai nenustatė jokių klausimų tipų ar struktūrų apribojimų, siekdami surinkti natūralius klausimus. Jie taip pat paprašė medicinos ekspertų nustatyti ESI „paleidimo tekstą“, dėl kurio jie uždavė kiekvieną klausimą.
Pavyzdžiui, medicinos ekspertas ESI gali perskaityti pastabą, kurioje sakoma paciento praeities ligos istorija yra reikšminga prostatos vėžiui ir hipotirozei. Suaktyvinimo tekstas „prostatos vėžys“ gali paskatinti ekspertą užduoti tokius klausimus kaip „diagnozės data? arba „darytos kokios nors intervencijos?“
Jie nustatė, kad dauguma klausimų buvo skirti simptomais, gydymui arba paciento tyrimo rezultatams. Nors šios išvados nebuvo netikėtos, kiekybiškai įvertinus klausimų apie kiekvieną plačią temą skaičių, jie padės sukurti veiksmingą duomenų rinkinį, skirtą naudoti tikroje klinikinėje aplinkoje, sako Lehmanas.
sudarė klausimų duomenų rinkinį ir pridedamą paleidimo tekstą, jie panaudojo mašininio mokymosi modeliams mokyti užduoti naujus klausimus, pagrįstus paleidimo tekstu.
Tada medicinos ekspertai nustatė, ar tie klausimai buvo „ geras“ naudojant keturias metrikas: suprantamumą (ar klausimas yra prasmingas žmogaus gydytojui?), trivialumą (ar klausimą per lengvai galima atsakyti iš paleidimo teksto?), medicininę svarbą (ar prasminga užduoti šį klausimą atsižvelgiant į kontekstą ?), ir tinkamumą paleidikliui (ar paleidiklis susijęs su klausimu?).
Susirūpinimo priežastis
Tyrėjai išsiaiškino, kad kai modeliui buvo suteiktas paleidimo tekstas, jis sugebėjo sugeneruoti gerą klausimą 63 procentais laiko, o žmogaus fizikas užduotų gerą klausimą 80 procentų laiko.
Jie taip pat mokė modelius, kad gautų atsakymus į klinikinius klausimus, naudodamiesi viešai prieinamais duomenų rinkiniais. rasta šio projekto pradžioje. Tada jie išbandė šiuos apmokytus modelius, kad sužinotų, ar jie gali rasti atsakymus į „gerus“ žmonių medicinos ekspertų klausimus.
Modeliai sugebėjo atsigauti tik maždaug . atsakymų į gydytojų klausimus procentas.
„Tas rezultatas tikrai kelia nerimą. Tai, ką žmonės laikė gerai veikiančiais modeliais, praktiškai buvo tiesiog baisu, nes vertinimo klausimai, kuriuos jie išbandė, nebuvo tinkami pradžiai“, – sako Lehmanas.
Dabar komanda teikia paraišką. Šis darbas siekia savo pradinio tikslo: sukurti modelį, kuris galėtų automatiškai atsakyti į gydytojų klausimus ESI. Kitame žingsnyje jie naudos savo duomenų rinkinį mašininio mokymosi modeliui parengti, kuris gali automatiškai generuoti tūkstančius ar milijonus gerų klinikinių klausimų, kuriuos vėliau bus galima panaudoti apmokant naują modelį automatiniam atsakymui į klausimus.
Nors dar reikia daug nuveikti, kol šis modelis taps realybe, Lehmanas yra padrąsintas dėl tvirtų pradinių rezultatų, kuriuos komanda parodė su šiuo duomenų rinkiniu.
Šis tyrimas buvo atliktas. iš dalies palaikoma MIT-IBM Watson AI Lab. Papildomi bendraautoriai yra Leo Anthony Celi iš MIT medicinos inžinerijos ir mokslo instituto; Preethi Raghavan ir Jennifer J. Liang iš MIT-IBM Watson AI Lab; Dana Moukheiber iš Bafalo universiteto; Vladislav Lialin ir Anna Rumshisky iš Masačusetso universiteto Lowell mieste; Katelyn Legaspi, Nicole Rose I. Alberto, Richard Raymund R. Ragasa, Corinna Victoria M. Puyat, Isabelle Rose I. Alberto ir Pia Gabrielle I. Alfonso iš Filipinų universiteto; Anne Janelle R. Sy ir Patricia Therese S. Pile iš Rytų Ramono Magsaysay memorialinio medicinos centro universiteto; Marianne Taliño iš Ateneo de Manilos universiteto Medicinos ir visuomenės sveikatos mokyklos; ir Byronas C. Wallace’as iš Šiaurės rytų universiteto.

