Kai mašininio mokymosi modeliai yra naudojami realiose situacijose, galbūt norint pažymėti galimas ligas rentgeno spinduliuose, kad radiologas galėtų juos peržiūrėti, naudotojai turi žinoti, kada pasitikėti modelio prognozėmis.
Tačiau mašininio mokymosi modeliai yra tokie dideli ir sudėtingi, kad net juos kuriantys mokslininkai tiksliai nesupranta, kaip modeliai prognozuoja. Taigi jie kuria metodus, žinomus kaip iškilumo metodai, kuriais siekiama paaiškinti modelio elgesį.
Visą laiką leidžiant naujus metodus, MIT ir IBM tyrimų mokslininkai sukūrė įrankį, padedantį vartotojams pasirinkti tinkamiausią jų konkrečiai užduočiai skirtą metodą. Jie sukūrė išskirtinumo korteles, kuriose pateikiama standartizuota metodo veikimo dokumentacija, įskaitant jo stipriąsias ir silpnąsias puses bei paaiškinimus, padedančius vartotojams teisingai jį interpretuoti.
Jie tikisi, kad, turėdami šią informaciją, vartotojai gali sąmoningai pasirinkti tinkamą matomumo metodą tiek naudojamo mašininio mokymosi modelio tipui, tiek modelio atliekamai užduočiai, aiškina bendraautorė Angie Boggust, elektros mokslų magistrantė. inžinerija ir kompiuterių mokslas MIT ir MIT kompiuterių mokslo ir dirbtinio intelekto laboratorijos (CSAIL) vizualizacijos grupės narys.
Pokalbiai su dirbtinio intelekto tyrėjais ir kitų sričių ekspertais atskleidė, kad kortelės padeda žmonėms greitai palyginti skirtingus metodus ir pasirinkti užduočiai tinkamą techniką. Pasirinkę tinkamą metodą, naudotojai gali gauti tikslesnį vaizdą apie tai, kaip elgiasi jų modelis, todėl jie yra geriau pasirengę teisingai interpretuoti jo prognozes.
„Pažymėjimo kortelės sukurtos taip, kad būtų galima greitai ir aiškiai apibendrinti reikšmingumo metodą ir suskirstyti jį į svarbiausius, į žmogų orientuotus požymius. Jie tikrai sukurti visiems – nuo mašininio mokymosi tyrinėtojų iki vartotojų, kurie bando suprasti, kurį metodą naudoti, ir pirmą kartą pasirenka jį“, – sako Boggust.
Prie Boggust prisijungia bendraautorė Harini Suresh, MIT postdoc; Hendrikas Strobeltas, IBM tyrimų vyresnysis mokslo darbuotojas; John Guttag, Dugald C. Jackson kompiuterių mokslo ir elektros inžinerijos profesorius MIT; ir vyresnysis autorius Arvindas Satyanarayanas, MIT kompiuterių mokslo docentas, vadovaujantis CSAIL vizualizacijos grupei. Tyrimas bus pristatytas ACM konferencijoje apie sąžiningumą, atskaitomybę ir skaidrumą.
Tinkamo metodo pasirinkimas
Tyrėjai anksčiau įvertino iškilumo metodus naudodami ištikimybės sąvoką. Šiame kontekste ištikimybė parodo, kaip tiksliai metodas atspindi modelio sprendimų priėmimo procesą.
Tačiau ištikimybė nėra juoda ir balta, aiškina Boggust. Metodas gali gerai pasirodyti vienu ištikimybės išbandymu, bet nepavykti kitam. Turėdami tiek daug reikšmingumo metodų ir tiek daug galimų vertinimų, vartotojai dažnai pasirenka metodą, nes jis yra populiarus arba jį panaudojo kolega.
Tačiau „netinkamo“ metodo pasirinkimas gali turėti rimtų pasekmių. Pavyzdžiui, vienas išryškinimo metodas, žinomas kaip integruoti gradientai, palygina vaizdo ypatybių svarbą su beprasmiška bazine linija. Ypatybės, turinčios didžiausią reikšmę, palyginti su pradine linija, yra reikšmingiausios modelio prognozei. Šis metodas paprastai naudoja visus 0 kaip bazinę liniją, bet jei taikomas vaizdams, visi 0 prilygsta juodai spalvai.
„Jis jums pasakys, kad bet kokie juodi vaizdo taškai nėra svarbūs, net jei jie yra svarbūs, nes jie yra identiški tai beprasmiškam pradiniam taškui. Tai gali būti didelis dalykas, jei žiūrite į rentgeno spindulius, nes juoda spalva gali būti reikšminga gydytojams“, – sako Boggust.
Pažymėjimo kortelės gali padėti vartotojams išvengti tokio pobūdžio problemų, apibendrindamos, kaip veikia išskirtinumo metodas pagal 10 į vartotoją orientuotų atributų. Atributai atspindi, kaip apskaičiuojamas pastebimumas, ryšys tarp reikšmingumo metodo ir modelio bei kaip vartotojas suvokia jo rezultatus.
Pavyzdžiui, vienas atributas yra priklausomybė nuo hiperparametrų, pagal kurį nustatomas, koks jautrumas yra tas paryškinimo metodas vartotojo nurodytiems parametrams. Integruotų gradientų tinkamumo kortelėje būtų aprašyti jos parametrai ir kaip jie veikia jo veikimą. Naudodamas kortelę vartotojas gali greitai pastebėti, kad numatytieji parametrai – visų 0 bazinė linija – gali sukelti klaidinančius rezultatus vertinant rentgeno spindulius.
Kortelės taip pat galėtų būti naudingos mokslininkams, atskleidžiančios spragas tyrimų erdvėje. Pavyzdžiui, MIT tyrėjai negalėjo nustatyti patikimumo metodo, kuris būtų efektyvus skaičiavimo požiūriu, bet taip pat galėtų būti pritaikytas bet kuriam mašininio mokymosi modeliui.
„Ar galime užpildyti šią spragą? Ar yra išryškinimo metodas, kuris gali atlikti abu dalykus? O gal šios dvi idėjos teoriškai prieštarauja viena kitai“, – sako Boggust.
Rodo savo korteles
Sukūrę keletą kortelių, komanda atliko vartotojų tyrimą su aštuoniais srities ekspertais – nuo kompiuterių mokslininkų iki radiologo, kuris nebuvo susipažinęs su mašininiu mokymusi. Interviu metu visi dalyviai teigė, kad glausti aprašymai padėjo jiems nustatyti prioritetus ir palyginti metodus. Ir nors jis nebuvo susipažinęs su mašininiu mokymusi, radiologas sugebėjo suprasti korteles ir panaudoti jas renkantis reikšmingumo metodą, sako Boggust.
Interviu atskleidė ir keletą netikėtumų. Tyrėjai dažnai tikisi, kad gydytojai nori ryškaus metodo, o tai reiškia, kad jis sutelkia dėmesį į konkretų objektą medicininiame vaizde. Tačiau šio tyrimo gydytojas iš tikrųjų pirmenybę teikė tam tikram medicininių vaizdų triukšmui, kad padėtų jiems sumažinti netikrumą.
„Kai mes suskirstėme jį į šiuos skirtingus požymius ir paklausėme žmonių, nė vienas asmuo neturėjo tų pačių prioritetų kaip bet kuris kitas tyrimo dalyvis, net kai jie atliko tą patį vaidmenį“, – sako ji.
Žvelgiant į priekį, mokslininkai nori ištirti kai kuriuos labiau neįvertintus požymius ir galbūt sukurti konkrečioms užduotims būdingus tinkamumo metodus. Jie taip pat nori geriau suprasti, kaip žmonės suvokia ryškumo metodo rezultatus, o tai gali lemti geresnes vizualizacijas. Be to, jie talpina savo darbus viešoje saugykloje, kad kiti galėtų pateikti atsiliepimų, kurie paskatins būsimą darbą, sako Boggust.
„Labai tikimės, kad tai bus gyvi dokumentai, kurie augs, kai bus kuriami nauji reikšmingumo metodai ir vertinimai. Galų gale, tai tik pradžia didesnio pokalbio apie tai, kokie yra išskirtinumo metodo požymiai ir kaip jie atlieka skirtingas užduotis“, – sako ji.
Tyrimą iš dalies palaikė MIT-IBM Watson AI Lab, JAV oro pajėgų tyrimų laboratorija ir JAV oro pajėgų dirbtinio intelekto greitintuvas.

