Vaikščioti į draugo namus ar naršyti bakalėjos parduotuvės praėjimus gali atrodyti kaip paprastos užduotys, tačiau iš tikrųjų joms reikia sudėtingų galimybių. Taip yra todėl, kad žmonės gali be vargo suprasti savo aplinką ir aptikti sudėtingą informaciją apie modelius, objektus ir savo vietą aplinkoje.
O kas, jei robotai galėtų suvokti savo aplinką panašiai? Šis klausimas kyla MIT informacijos ir sprendimų sistemų laboratorijos (LIDS) tyrinėtojams Luca Carlone ir Jonathan How. 2020 m. Carlone vadovaujama komanda išleido pirmąją „Kimera“ – atvirojo kodo bibliotekos – iteraciją, leidžiančią vienam robotui realiu laiku sukurti trimatį savo aplinkos žemėlapį, tuo pačiu pažymint skirtingus matomus objektus. Praėjusiais metais Carlone ir How tyrimų grupės (SPARK Lab ir Aerospace Controls Lab) pristatė atnaujintą sistemą „Kimera-Multi“, kurioje keli robotai bendrauja tarpusavyje, kad sukurtų vieningą žemėlapį. 2022 m. dokumentas, susijęs su projektu, neseniai gavo šių metų dokumentą IEEE operacijos dėl robotų King-Sun Fu memorialinis geriausio popieriaus apdovanojimas, skirtas geriausiam 2022 m. žurnale paskelbtam straipsniui.
Carlone, kuris yra Leonardo Career Development docentas aeronautikos ir astronautikos srityje, ir How, Richard Cockburn Maclaurin aeronautikos ir astronautikos profesorius, kalbėjo LIDS apie Kimera-Multi ir ateitį, kaip robotai gali suvokti ir sąveikauti su savo aplinka.
K: Šiuo metu jūsų laboratorijose pagrindinis dėmesys skiriamas robotų, galinčių dirbti kartu, kad būtų sukurti 3D aplinkos žemėlapiai, skaičiaus didinimas. Kokie galimi šios sistemos mastelio keitimo pranašumai?
Kaip: Pagrindinis pranašumas priklauso nuo nuoseklumo, ta prasme, kad robotas gali sukurti nepriklausomą žemėlapį, o tas žemėlapis yra savarankiškas, bet ne nuoseklus visame pasaulyje. Mes siekiame, kad komanda turėtų nuoseklų pasaulio žemėlapį; tai yra pagrindinis skirtumas bandant pasiekti sutarimą tarp robotų, o ne savarankiškai kurti žemėlapius.
Carlone: Daugeliu atvejų taip pat naudinga turėti šiek tiek pertekliaus. Pavyzdžiui, jei į paieškos ir gelbėjimo misiją panaudotume vieną robotą ir tam robotui kažkas atsitiktų, jam nepavyktų rasti išgyvenusiųjų. Jei tyrinėja keli robotai, sėkmės tikimybė yra daug didesnė. Robotų komandos padidinimas taip pat reiškia, kad bet kuri užduotis gali būti atlikta per trumpesnį laiką.
K: Kokias pamokas išmokote iš paskutinių eksperimentų ir iššūkius, kuriuos teko įveikti kurdami šias sistemas?
Carlone: Neseniai MIT miestelyje atlikome didelį žemėlapių sudarymo eksperimentą, kurio metu aštuoni robotai iš viso įveikė iki 8 kilometrų. Robotai neturi išankstinių žinių apie miestelį ir neturi GPS. Pagrindinės jų užduotys – įvertinti savo trajektoriją ir aplink ją sudaryti žemėlapį. Norite, kad robotai suprastų aplinką taip, kaip tai daro žmonės; žmonės ne tik supranta kliūčių formą, apeiti jas neatsitrenkdami, bet ir supranta, kad daiktas yra kėdė, stalas ir pan. Yra semantikos dalis.
Įdomu tai, kad susitikę vienas su kitu, robotai keičiasi informacija, kad pagerintų savo aplinkos žemėlapį. Pavyzdžiui, jei robotai prisijungia, jie gali panaudoti informaciją, kad pataisytų savo trajektoriją. Iššūkis yra tas, kad jei norite pasiekti sutarimą tarp robotų, neturite pakankamai pralaidumo keistis per daug duomenų. Vienas iš svarbiausių mūsų 2022 m. dokumento indėlių yra paskirstytojo protokolo įdiegimas, kuriame robotai keičiasi ribota informacija, bet vis tiek gali susitarti, kaip atrodo žemėlapis. Jie nesiunčia fotoaparato vaizdų pirmyn ir atgal, o tik keičiasi konkrečiomis 3D koordinatėmis ir įkalčiais, gautais iš jutiklio duomenų. Ir toliau keisdamiesi tokiais duomenimis, jie gali pasiekti bendrą sutarimą.
Šiuo metu kuriame spalvomis koduotus 3D tinklelius arba žemėlapius, kuriuose spalva turi tam tikros semantinės informacijos, pvz., „žalia“ atitinka žolę, o „rausvai raudona“ – pastatą. Tačiau mes, kaip žmonės, turime daug sudėtingesnį tikrovės supratimą ir turime daug išankstinių žinių apie santykius tarp objektų. Pavyzdžiui, jei ieškočiau lovos, eičiau į miegamąjį, o ne tyrinėčiau visą namą. Jei pradėsite suprasti sudėtingus ryšius tarp dalykų, galite daug protingiau suprasti, ką robotas gali padaryti aplinkoje. Mes stengiamės pereiti nuo tik vieno semantikos sluoksnio fiksavimo prie hierarchiškesnio vaizdavimo, kuriame robotai supranta kambarius, pastatus ir kitas sąvokas.
K: Kokias programas ateityje gali sukurti Kimera ir panašios technologijos?
Kaip: Autonominių transporto priemonių įmonės daug kuria pasaulio žemėlapius ir mokosi iš aplinkos, kurioje yra. Šventasis Gralis būtų, jei šios transporto priemonės galėtų bendrauti tarpusavyje ir dalytis informacija, tada jos galėtų daug greičiau patobulinti modelius ir žemėlapius. Dabartiniai sprendimai yra individualizuoti. Jei šalia tavęs privažiuoja sunkvežimis, tam tikra kryptimi nematai. Ar kita transporto priemonė galėtų suteikti matymo lauką, kurio jūsų transporto priemonė neturi? Tai futuristinė idėja, nes transporto priemonėms reikia bendrauti naujais būdais, be to, reikia išspręsti privatumo problemas. Bet jei pavyktų išspręsti šias problemas, galėtumėte įsivaizduoti žymiai pagerėjusią saugos situaciją, kai turite prieigą prie duomenų iš kelių perspektyvų, ne tik savo matymo lauko.
Carlone: Šios technologijos turės daug pritaikymų. Anksčiau minėjau paiešką ir gelbėjimą. Įsivaizduokite, kad norite tyrinėti mišką ir ieškoti išgyvenusiųjų arba nubrėžti pastatus po žemės drebėjimo taip, kad pirmiesiems gelbėtojams būtų lengviau pasiekti įstrigusius žmones. Kita aplinka, kurioje šios technologijos galėtų būti taikomos, yra gamyklose. Šiuo metu gamyklose dislokuoti robotai yra labai standūs. Jie seka šablonus ant grindų ir iš tikrųjų negali suprasti savo aplinkos. Tačiau jei ateityje galvojate apie daug lankstesnius gamyklas, robotai turės bendradarbiauti su žmonėmis ir egzistuoti daug mažiau struktūrizuotoje aplinkoje.