Žmonės gali būti viena didžiausių kliūčių, trukdančių visiškai autonominėms transporto priemonėms išvažiuoti į miesto gatves.
Jei robotas nori saugiai valdyti transporto priemonę Bostono centre, jis turi sugebėti nuspėti, ką toliau darys netoliese esantys vairuotojai, dviratininkai ir pėstieji.
Tačiau elgesio prognozavimas yra sudėtinga problema, o dabartiniai dirbtinio intelekto sprendimai yra arba pernelyg supaprastinti (jie gali daryti prielaidą, kad pėstieji visada eina tiesia linija), arba pernelyg konservatyvūs (norėdamas išvengti pėsčiųjų, robotas tiesiog palieka automobilį stovėjimo vietoje), arba gali prognozuoti tik vieno dalyvio tolesnius veiksmus (keliuose paprastai vienu metu važiuoja daug eismo dalyvių).
MIT mokslininkai sukūrė apgaulingai paprastą šio sudėtingo iššūkio sprendimą. Jie suskaido kelių agentų elgesio prognozavimo problemą į mažesnes dalis ir sprendžia kiekvieną iš jų atskirai, todėl kompiuteris gali spręsti šią sudėtingą užduotį realiuoju laiku.
Jų elgesio prognozavimo sistema pirmiausia numano dviejų eismo dalyvių tarpusavio santykius – kuris automobilis, dviratininkas ar pėsčiasis turi pirmumo teisę ir kuris agentas duos kelią – ir, naudodamasi šiais santykiais, prognozuoja būsimas kelių agentų trajektorijas.
Šios įvertintos trajektorijos buvo tikslesnės nei kitų mašininio mokymosi modelių trajektorijos, lyginant jas su realiu eismo srautu milžiniškame duomenų rinkinyje, kurį surinko autonominio vairavimo bendrovė „Waymo”. MIT metodas netgi pranoko neseniai paskelbtą „Waymo” modelį. Kadangi tyrėjai problemą suskaidė į paprastesnes dalis, jų metodas naudojo mažiau atminties.
„Tai labai intuityvi idėja, tačiau niekas jos iki galo neišnagrinėjo, ir ji veikia gana gerai. Paprastumas neabejotinai yra pliusas. Lyginame savo modelį su kitais pažangiausiais šios srities modeliais, įskaitant pirmaujančios šioje srityje bendrovės „Waymo” modelį, ir mūsų modelis pasiekia geriausius rezultatus šiame sudėtingame etalone. Tai turi daug potencialo ateityje”, – sako vienas iš pagrindinių autorių Xin „Cyrus” Huangas, Aeronautikos ir astronautikos katedros magistrantas ir mokslinis asistentas aeronautikos ir astronautikos profesoriaus, Kompiuterių mokslo ir dirbtinio intelekto laboratorijos (CSAIL) nario Briano Williamso laboratorijoje.
Kartu su Huangu ir Williamsu prie šio straipsnio prisidėjo trys tyrėjai iš Tsinghua universiteto Kinijoje: vienas iš pagrindinių autorių Qiao Sun, mokslinių tyrimų asistentas, Junru Gu, magistrantas, ir vyresnysis autorius Hang Zhao PhD „19, docentas. Tyrimas bus pristatytas kompiuterinės regos ir modelių atpažinimo konferencijoje.
Keli maži modeliai
Tyrėjų mašininio mokymosi metodas, pavadintas M2I, priima du įvesties duomenis: praeities automobilių, dviratininkų ir pėsčiųjų, sąveikaujančių eismo aplinkoje, pavyzdžiui, keturių krypčių sankryžoje, trajektorijas ir žemėlapį su gatvių išsidėstymu, eismo juostų konfigūracijomis ir kt.
Naudodamasis šia informacija, santykių prognozuotojas nustato, kuris iš dviejų agentų turi pirmumo teisę važiuoti pirmas, ir klasifikuoja vieną kaip pravažiuojantį, o kitą kaip duodantį kelią. Tada prognozavimo modelis, vadinamas ribiniu prognozuotoju, numato pravažiuojančio agento trajektoriją, nes šis agentas elgiasi nepriklausomai
Antrasis prognozavimo modelis, vadinamas sąlyginiu prognozuotoju, numato, ką darys duodantis kelią agentas, remdamasis pravažiuojančio agento veiksmais. Sistema numato kelias skirtingas duodančiojo ir praleidžiančiojo agentų trajektorijas, apskaičiuoja kiekvienos iš jų tikimybę atskirai ir tada išrenka šešis bendrus rezultatus, kurių tikimybė įvykti yra didžiausia
M2I išveda prognozę, kaip šie agentai judės eisme per kitas aštuonias sekundes. Viename iš pavyzdžių pagal jų metodą transporto priemonė sulėtino greitį, kad pėsčiasis galėtų pereiti gatvę, o paskui pagreitino greitį, kai išvažiavo iš sankryžos. Kitame pavyzdyje transporto priemonė, prieš sukdama iš šalutinės gatvės į judrų pagrindinį kelią, palaukė, kol pravažiavo keli automobiliai.
Nors šiame pradiniame tyrime daugiausia dėmesio skiriama dviejų agentų sąveikai, M2I galėtų nustatyti daugelio agentų tarpusavio ryšius ir tada atspėti jų trajektorijas, susiedamas daugybę ribinių ir sąlyginių prognozių.
Šie modeliavimai rodo, kaip tyrėjų sukurta sistema gali nuspėti būsimas mėlynos spalvos transporto priemonių trajektorijas (parodytas raudonomis linijomis) sudėtingose eismo situacijose, kuriose dalyvauja kiti automobiliai, dviratininkai ir pėstieji. Realaus pasaulio drivimo bandymai
Tyrėjai mokė modelius naudodami „Waymo Open Motion Dataset”, kuriame yra milijonai realių eismo scenų, kuriose dalyvauja transporto priemonės, pėstieji ir dviratininkai, užfiksuotų lidar (šviesos aptikimo ir nuotolio nustatymo) jutikliais ir kameromis, sumontuotomis bendrovės autonominėse transporto priemonėse.
Siekdami nustatyti tikslumą, jie palygino kiekvieno metodo šešis prognozavimo pavyzdžius, pasvertus pagal jų patikimumo lygį, su faktinėmis automobilių, dviratininkų ir pėsčiųjų trajektorijomis. Jų metodas buvo tiksliausias. Jis taip pat pranoko pagrindinius modelius pagal metriką, vadinamą sutapimo rodikliu; jei dvi trajektorijos sutampa, tai reiškia, kad įvyko susidūrimas. M2I buvo mažiausias persidengimo rodiklis.
„Užuot kūrę sudėtingesnį modelį šiai problemai spręsti, mes pasirinkome metodą, kuris labiau primena žmogaus mąstymą, kai jis samprotauja apie sąveiką su kitais žmonėmis. Žmogus nesprendžia apie visus šimtus būsimo elgesio kombinacijų. Mes priimame sprendimus gana greitai”, – sako Huangas.
Dar vienas M2I privalumas yra tas, kad dėl to, jog problema suskaidoma į mažesnes dalis, naudotojui lengviau suprasti, kaip modelis priima sprendimus. Ilgainiui tai gali padėti naudotojams labiau pasitikėti autonominėmis transporto priemonėmis, sako Huangas.
Tačiau sistema negali atsižvelgti į atvejus, kai du agentai daro vienas kitam abipusę įtaką, pavyzdžiui, kai dvi transporto priemonės, sustojusios keturšalėje stotelėje, stumia viena kitą į priekį, nes vairuotojai nėra tikri, kuri turėtų duoti kelią.
Šį trūkumą jie planuoja pašalinti būsimame darbe. Jie taip pat nori savo metodą panaudoti modeliuojant realią eismo dalyvių sąveiką, kuri galėtų būti naudojama tikrinant savavaldžių automobilių planavimo algoritmus arba kuriant didžiulius sintetinių vairavimo duomenų kiekius, kad būtų galima pagerinti modelio veikimą.
„Daugelio sąveikaujančių agentų būsimų trajektorijų numatymas yra nepakankamai ištirtas ir labai sudėtingas siekiant užtikrinti visišką autonomiją sudėtingose scenose. M2I pateikia labai perspektyvų prognozavimo metodą, kurio santykinis prognozuotojas leidžia atskirti agentus, prognozuojamus ribotai arba sąlyginai, o tai labai supaprastina problemą”, – rašė Masayoshi Tomizuka, Cheryl ir John Neerhout, Jr. Kalifornijos universiteto Berklyje nusipelnęs mechanikos inžinerijos profesorius ir Wei Zhan, profesionalaus tyrėjo asistentas, elektroniniame laiške. „Prognozavimo modelis gali atspindėti agentams būdingą ryšį ir sąveiką, kad būtų pasiektas moderniausias našumas.” Šie du kolegos tyrime nedalyvavo.”
Šį tyrimą iš dalies remia „Qualcomm Innovation Fellowship”. Šiam darbui paremti lėšų taip pat skyrė „Toyota” tyrimų institutas