Elektroninės prekybos užsakymams plūstant, sandėlio robotas nuo lentynos renka puodelius ir deda juos į siuntimui skirtas dėžes. Viskas vyksta sklandžiai, kol sandėlyje įvyksta pokytis ir robotas turi paimti aukštesnius ir siauresnius puodelius, kurie laikomi aukštyn kojomis.
Perprogramuojant šį robotą, reikia rankomis žymėti tūkstančius vaizdų, rodančių, kaip paimti šiuos naujus puodelius, ir vėl iš naujo mokyti sistemą.
Tačiau naujuoju MIT mokslininkų sukurtu metodu robotui perprogramuoti prireiktų tik kelių žmogaus demonstracijų. Šis mašininio mokymosi metodas leidžia robotui paimti ir padėti niekada anksčiau nematytus objektus, esančius atsitiktinėse pozose, su kuriomis jis niekada nebuvo susidūręs. Per 10 – 15 minutes robotas būtų pasirengęs atlikti naują paėmimo ir padėjimo užduotį.
Metodas naudoja neuroninį tinklą, specialiai sukurtą 3D objektų formoms atkurti. Atlikus vos kelias demonstracijas, sistema naudoja tai, ką neuroninis tinklas sužinojo apie 3D geometriją, kad suimtų naujus objektus, kurie yra panašūs į tuos, kurie buvo demonstruoti
Imituodami ir naudodami tikrą roboto ranką, mokslininkai parodė, kad jų sistema gali veiksmingai manipuliuoti niekada anksčiau nematytais puodeliais, dubenėliais ir buteliais, išdėstytais atsitiktinėmis pozomis, naudodami tik 10 demonstracijas robotui mokyti.
„Pagrindinis mūsų indėlis – tai bendra galimybė daug efektyviau suteikti naujų įgūdžių robotams, kuriems reikia veikti labiau nestruktūruotoje aplinkoje, kur gali būti daug kintamumo. Apibendrinimo pagal konstrukciją koncepcija yra žavi galimybė, nes ši problema paprastai yra daug sunkesnė”, – sako Antonijus Simeonovas (Anthony Simeonov), elektros inžinerijos ir kompiuterių mokslo (EECS) magistrantas ir vienas iš pagrindinių straipsnio autorių
Simeonovas straipsnį parašė kartu su pagrindiniu autoriumi Yilunu Du (Yilun Du), EECS magistrantu, Andrea Tagliasacchi (Andrea Tagliasacchi), „Google Brain” personalo mokslininku, Joshua B. Tenenbaumu (Joshua B. Tenenbaum), Paul E. Newtono smegenų ir kognityvinių mokslų katedros kognityvinių mokslų ir skaičiavimo karjeros profesorius bei Kompiuterių mokslo ir dirbtinio intelekto laboratorijos (CSAIL) narys; Alberto Rodriguezas, Mechanikos inžinerijos katedros docentas 1957; ir vyresnieji autoriai Pulkitas Agrawalas, CSAIL profesorius, ir Vincentas Sitzmannas, būsimasis EECS docentas. Tyrimas bus pristatytas Tarptautinėje robotikos ir automatikos konferencijoje.
Suvokimo geometrija
Robotas gali būti išmokytas paimti tam tikrą daiktą, tačiau jei tas daiktas guli ant šono (galbūt jis nukrito), robotas tai laiko visiškai nauju scenarijumi. Tai viena iš priežasčių, kodėl mašininio mokymosi sistemoms taip sunku apibendrinti naujas objektų orientacijas
Siekdami įveikti šį iššūkį, tyrėjai sukūrė naujo tipo neuroninio tinklo modelį – neuroninį aprašymo lauką (angl. Neural Descriptor Field, NDF), kuris mokosi daiktų klasės 3D geometrijos. Modelis apskaičiuoja konkretaus daikto geometrinę reprezentaciją naudodamas 3D taškų debesį, kuris yra duomenų taškų arba koordinačių rinkinys trijuose matmenyse. Duomenų taškai gali būti gaunami iš gylio kameros, kuri teikia informaciją apie atstumą tarp objekto ir vaizdo taško. Nors tinklas buvo apmokytas modeliuojant didelį sintetinių 3D formų duomenų rinkinį, jį galima tiesiogiai taikyti objektams realiame pasaulyje
Komanda suprojektavo NDF, kurio savybė vadinama lygiavertiškumu. Jei modeliui parodomas vertikalaus puodelio atvaizdas, o paskui to paties puodelio atvaizdas ant šono, jis supranta, kad antrasis puodelis yra tas pats objektas, tik pasuktas.
„Šis lygiavertiškumas leidžia mums daug efektyviau tvarkyti atvejus, kai stebimas objektas yra tam tikros savavališkos orientacijos”, – sako Simeonovas.
Kadangi NDF mokosi atkurti panašių objektų formas, jis taip pat mokosi susieti susijusias tų objektų dalis. Pavyzdžiui, jis išmoksta, kad puodelių rankenos yra panašios, net jei vieni puodeliai yra aukštesni ar platesni už kitus arba turi mažesnes ar ilgesnes rankenas.
„Jei norėtumėte tai padaryti kitu metodu, tektų visas dalis žymėti ranka. Vietoj to, mūsų metodas automatiškai atranda šias dalis iš formos rekonstrukcijos”, – sako Du.
Tyrėjai naudoja šį apmokytą NDF modelį, kad išmokytų robotą naujų įgūdžių, turėdami tik keletą fizinių pavyzdžių. Jie perkelia roboto ranką ant objekto dalies, kurią norima, kad jis suimtų, pavyzdžiui, dubens kraštą ar puodelio rankeną, ir įrašo pirštų galų vietas.
Kadangi NDF išmoko tiek daug apie 3D geometriją ir kaip atkurti formas, ji gali daryti išvadą apie naujos formos struktūrą, o tai leidžia sistemai demonstracijas perkelti į naujus objektus, esančius bet kokia poza, aiškina Du.
Išrinkti nugalėtoją
Jie išbandė savo modelį imitaciniais modeliais ir su tikra roboto ranka, kaip objektus naudodami puodelius, dubenėlius ir butelius. Jų metodo sėkmės rodiklis buvo 85 procentų, kai buvo atliekamos „paimk ir padėk” užduotys su naujais objektais naujomis orientacijomis, o geriausias bazinis modelis pasiekė tik 45 procentų sėkmės rodiklį. Sėkmė reiškia naujo objekto paėmimą ir padėjimą į tikslinę vietą, pavyzdžiui, puodelių kabinimą ant stovo. Daugelis bazinių metodų naudoja 2D vaizdo informaciją, o ne 3D geometriją, todėl šiems metodams sunkiau integruoti lygiavertiškumą. Tai viena iš priežasčių, kodėl NDF metodas veikė daug geriau
Nors tyrėjai buvo patenkinti jo veikimu, jų metodas veikia tik tam tikrai objektų kategorijai, kuriai jis buvo apmokytas. Robotas, išmokytas paimti puodelius, negalės paimti dėžių ar ausinių, nes šių objektų geometrinės savybės pernelyg skiriasi nuo tų, pagal kurias buvo apmokytas tinklas.
„Ateityje būtų idealu jį išplėsti iki daugelio kategorijų arba visiškai atsisakyti kategorijos sąvokos”, – sako Simeonovas.
Jie taip pat planuoja pritaikyti sistemą nestandartiniams objektams, o ilgainiui suteikti sistemai galimybę atlikti „paimk ir padėk” užduotis, kai keičiasi tikslinė sritis.
„Tai, kaip efektyviai galime išmokyti robotus naujų manipuliavimo įgūdžių, priklauso nuo robotų gebėjimo apibendrinti vos iš kelių demonstracijų. Šis darbas rodo, kaip robotas gali patikimai perkelti demonstruojamus objekto paėmimo ar padėjimo veiksmus į anksčiau nematytus objektus”, – sako Vašingtono universiteto kompiuterių mokslo ir inžinerijos profesorius Dieteris Foksas (Dieter Fox), kuris nedalyvavo atliekant šį tyrimą. „Šiame tyrime pasinaudota naujausiais gilaus mokymosi pasiekimais neuroninių objektų reprezentacijų srityje ir įdiegtos kelios labai sumanios naujovės, dėl kurių jos puikiai tinka imitaciniam mokymuisi robotų manipuliacijoms. Realaus pasaulio eksperimentai yra labai įspūdingi ir tikiuosi, kad daugelis tyrėjų remsis šiais rezultatais.”
Šį darbą iš dalies remia Gynybos pažangiųjų mokslinių tyrimų projektų agentūra, Singapūro gynybos mokslo ir technologijų agentūra ir Nacionalinis mokslo fondas