Niekam nepatinka sėdėti prie raudono šviesoforo signalo. Tačiau signalizuotos sankryžos vairuotojams kelia ne tik nepatogumų; laukdamos, kol užsidegs žalias šviesoforo signalas, transporto priemonės naudoja degalus ir išskiria šiltnamio efektą sukeliančias dujas.
Kas būtų, jei vairuotojai galėtų planuoti savo keliones taip, kad į sankryžą atvyktų degant žaliam šviesoforo signalui? Nors žmogui vairuotojui tai gali būti tik laimingas atsitiktinumas, autonominė transporto priemonė, kuri, naudodama dirbtinį intelektą, kontroliuoja savo greitį, galėtų tai pasiekti nuosekliau
Naujame tyrime MIT mokslininkai demonstruoja mašininio mokymosi metodą, kuris gali išmokti kontroliuoti autonominių transporto priemonių parką, kai jos artėja prie signalizuotos sankryžos ir važiuoja per ją taip, kad eismas vyktų sklandžiai
Naudodami modeliavimą, jie nustatė, kad jų metodas sumažina degalų sąnaudas ir išmetamųjų teršalų kiekį, kartu padidindamas vidutinį transporto priemonių greitį. Šis metodas duoda geriausius rezultatus, jei visi kelyje važiuojantys automobiliai yra autonominiai, tačiau net jei tik 25 proc. automobilių naudoja jų valdymo algoritmą, jis vis tiek duoda didelę naudą degalų ir išmetamųjų teršalų atžvilgiu.
„Tai tikrai įdomi vieta įsikišti. Nė vieno žmogaus gyvenimas nepagerėjo dėl to, kad jis įstrigo sankryžoje. Taikant daugelį kitų klimato kaitos intervencijų, tikimasi gyvenimo kokybės skirtumo, todėl čia yra įėjimo į rinką barjeras. Čia šis barjeras yra daug mažesnis”, – sako vyresnioji autorė Cathy Wu, Civilinės ir aplinkos inžinerijos katedros profesoriaus asistentė Gilberto W. Winslow karjeros vystymo klausimais, Duomenų, sistemų ir visuomenės instituto (IDSS) ir Informacijos ir sprendimų sistemų laboratorijos (LIDS) narė.
Pagrindinė tyrimo autorė yra Vindula Jayawardana, LIDS ir Elektros inžinerijos ir informatikos katedros magistrantė. Tyrimas bus pristatytas Europos valdymo konferencijoje.
Sankryžų subtilybės
Nors žmonės gali važiuoti degant žaliam šviesoforo signalui daug negalvodami, sankryžose gali būti milijardai skirtingų scenarijų, priklausomai nuo eismo juostų skaičiaus, signalų veikimo, transporto priemonių skaičiaus ir jų greičio, pėsčiųjų ir dviratininkų buvimo ir t. t.
Paprastai sprendžiant sankryžų valdymo problemas naudojami matematiniai modeliai, kuriais sprendžiama viena paprasta, ideali sankryža. Tai gerai atrodo popieriuje, bet greičiausiai nepasiteisins realiame pasaulyje, kur eismo modeliai dažnai būna labai netvarkingi.
Wu ir Jayawardana perjungė pavarą ir problemą sprendė naudodami modelio neturintį metodą, vadinamą giliuoju pastiprinimo mokymusi. Stiprinamasis mokymasis yra bandymų ir klaidų metodas, kai valdymo algoritmas mokosi priimti sprendimų seką. Jis apdovanojamas, kai randa gerą seką. Taikant gilųjį pastiprinimo mokymą, algoritmas naudoja neuroninio tinklo išmoktas prielaidas, kad rastų trumpiausius kelius iki gerų sekų, net jei yra milijardai galimybių
Tai naudinga sprendžiant tokias ilgo laikotarpio problemas, kaip ši; valdymo algoritmas per ilgesnį laiką turi išduoti iki 500 pagreičio nurodymų transporto priemonei, aiškina Wu.
„Ir mes turime teisingai nustatyti seką, kad žinotume, jog gerai sumažinome išmetamųjų teršalų kiekį ir pasiekėme sankryžą tinkamu greičiu”, – priduria ji.”
Tačiau yra dar viena papildoma klaidelė. Tyrėjai nori, kad sistema išmoktų tokią strategiją, kuri sumažintų degalų sąnaudas ir apribotų poveikį kelionės laikui. Šie tikslai gali būti prieštaringi.
„Norėdami sutrumpinti kelionės laiką, norime, kad automobilis važiuotų greitai, tačiau norėdami sumažinti išmetamųjų teršalų kiekį, norime, kad automobilis sulėtėtų arba visai nevažiuotų. Šie konkuruojantys atlygiai gali labai supainioti besimokantį agentą”, – sako Wu.
Nors išspręsti šią problemą visu jos bendrumu yra sudėtinga, tyrėjai pritaikė apeinamąją priemonę, naudodami atlygio formavimo metodą. Naudodami atlygio formavimą, jie suteikia sistemai tam tikrų srities žinių, kurių ji negali išmokti savarankiškai. Šiuo atveju jie nubaudė sistemą kiekvieną kartą, kai transporto priemonė visiškai sustodavo, kad ji išmoktų vengti šio veiksmo.
Eismo bandymai
Sukūrę veiksmingą valdymo algoritmą, jie jį įvertino naudodami eismo modeliavimo platformą su viena sankryža. Valdymo algoritmas pritaikytas prijungtų autonominių transporto priemonių parkui, kurios gali bendrauti su artėjančiais šviesoforais, kad gautų informaciją apie signalo fazę ir laiką bei stebėtų savo artimiausią aplinką. Valdymo algoritmas nurodo kiekvienai transporto priemonei, kaip pagreitinti ir sulėtinti greitį.
Jų sistema nesukūrė jokio sustojimo ir sustojimo eismo, kai transporto priemonės artėjo prie sankryžos. (Eismas „sustok ir važiuok” vyksta tada, kai automobiliai priversti visiškai sustoti dėl priekyje sustojusio eismo). Modeliuojant daugiau automobilių pravažiavo per vieną žalią fazę, o tai pranoko modelį, imituojantį žmones vairuotojus. Lyginant su kitais optimizavimo metodais, kurie taip pat buvo sukurti siekiant išvengti „stop-and-go” eismo, jų metodas leido labiau sumažinti degalų sąnaudas ir išmetamųjų teršalų kiekį. Jei kiekviena kelyje važiuojanti transporto priemonė būtų autonominė, jų valdymo sistema galėtų sumažinti degalų sąnaudas 18 proc. ir anglies dioksido išmetimą 25 proc., o važiavimo greitį padidinti 20 proc.
„Vienkartinis įsikišimas, kai degalų ar išmetamųjų teršalų kiekis sumažėja nuo 20 iki 25 proc. Tačiau man įdomu tai, ką tikrai tikėjausi pamatyti, – tai netiesinis mastelio keitimas. Jei kontroliuojame tik 25 proc. transporto priemonių, tai duoda 50 proc. naudos, susijusios su degalų ir išmetamųjų teršalų kiekio sumažinimu. Tai reiškia, kad mums nereikia laukti, kol pasieksime 100 proc. autonominių transporto priemonių, kad gautume naudos iš šio metodo.”
Toliau mokslininkai nori ištirti kelių sankryžų sąveikos poveikį. Jie taip pat planuoja ištirti, kaip skirtinga sankryžų konfigūracija (eismo juostų skaičius, signalai, laikas ir t. t.) gali paveikti kelionės laiką, išmetamųjų teršalų kiekį ir degalų sąnaudas. Be to, jie ketina ištirti, kaip jų valdymo sistema galėtų paveikti saugumą, kai autonominės transporto priemonės ir žmonės vairuotojai dalijasi keliais. Pavyzdžiui, nors autonominės transporto priemonės gali važiuoti kitaip nei žmogiškieji vairuotojai, lėtesni keliai ir keliai su pastovesniu greičiu galėtų padidinti saugumą, sako Wu.
Nors šis darbas dar tik pradinėje stadijoje, Wu mano, kad šį metodą būtų galima įgyvendinti artimiausiu metu.
„Šio darbo tikslas – išjudinti darnaus judumo idėją. Mes taip pat norime svajoti, tačiau šios sistemos yra dideli inercijos monstrai. Nustatyti intervencijos taškus, kurie yra nedideli sistemos pokyčiai, bet daro didelį poveikį, yra tai, dėl ko aš atsikeliu rytais”, – sako ji.
„Naujausias profesorės Cathy Wu darbas rodo, kaip ekologiškas vairavimas suteikia vieningą sistemą, leidžiančią sumažinti degalų sąnaudas, taip sumažinant anglies dioksido išmetimą, ir kartu duoda gerų rezultatų, susijusių su vidutine kelionės trukme. Tiksliau tariant, C. Wu darbe taikytas pastiprinto mokymosi metodas, pasitelkiant prijungtų autonominių transporto priemonių technologijas, suteikia įgyvendinamą ir patrauklią sistemą kitiems toje pačioje srityje dirbantiems mokslininkams”, – sako Ozanas Tonguzas, Karnegio Mellono universiteto elektros ir kompiuterių inžinerijos profesorius, nedalyvavęs šiame tyrime. „Apskritai tai labai savalaikis indėlis šioje sparčiai augančioje ir svarbioje mokslinių tyrimų srityje.”
Šį darbą iš dalies parėmė MIT-IBM Watson AI Lab.