Kai plūsta el. prekybos užsakymai, sandėlio robotas paima puodelius nuo lentynos ir sudeda į dėžes, kad būtų išsiųstas. Viskas dūzgia, kol sandėlis apdoroja pokyčius ir robotas turi sugriebti aukštesnius, siauresnius puodelius, kurie laikomi aukštyn kojomis.
Perprogramuojant tą robotą reikia ranka paženklinti tūkstančius vaizdų, kurie rodo tai, kaip suvokti šiuos naujus puodelius, tada iš naujo treniruoti sistemą.
Tačiau naujai MIT tyrėjų sukurtai technologijai robotui perprogramuoti reikėtų tik kelių žmonių demonstracijų. Šis mašininio mokymosi metodas leidžia robotui pasiimti ir sudėti niekad nematytus objektus, kurie yra atsitiktinėse pozose, su kuriomis jis niekada nebuvo susidūręs. Per 10–15 minutes robotas būtų pasirengęs atlikti naują „pasirink ir padėkite“ užduotį.
Ši technika naudoja neuroninį tinklą, specialiai sukurtą trimačių objektų formoms atkurti. Vos keliomis demonstracijomis sistema naudoja tai, ką neuroninis tinklas išmoko apie 3D geometriją, kad suvoktų naujus objektus, panašius į demonstracinėse versijose.
Modeliuojant ir naudojant tikrą roboto ranką. , tyrėjai įrodo, kad jų sistema gali veiksmingai manipuliuoti niekada anksčiau nematytais puodeliais, dubenėliais ir buteliais, išdėstytais atsitiktinėmis pozomis, naudodama tik 10 demonstracijas, kad išmokytų robotą. „Svarbiausias mūsų indėlis yra bendras gebėjimas daug efektyviau suteikti naujų įgūdžių robotams, kurie turi veikti labiau nestruktūrizuotose aplinkose, kur gali būti daug kintamumo. Konstravimo apibendrinimo koncepcija yra patraukli galimybė, nes ši problema paprastai yra daug sunkesnė“, – sako Anthony Simeonovas, elektros inžinerijos ir informatikos mokslų (EECS) absolventas ir vienas iš šio straipsnio autorių. ) Simeonovas parašė darbą su vienu iš pagrindinių autorių Yilun Du, EECS magistrantūros studentu; Andrea Tagliasacchi, „Google Brain“ personalo mokslininkė; Joshua B. Tenenbaum, Paul E. Newton, Smegenų ir pažinimo mokslų katedros kognityvinių mokslų ir skaičiavimo profesorius bei Kompiuterių mokslo ir dirbtinio intelekto laboratorijos (CSAIL) narys; Alberto Rodriguezas, 1957 Mechanikos inžinerijos katedros docentas; ir vyresnieji autoriai Pulkit Agrawal, CSAIL profesorius, ir Vincentas Sitzmannas, būsimasis EECS docentas. Tyrimas bus pristatytas Tarptautinėje robotikos ir automatizavimo konferencijoje.
Griebimo geometrija
Robotas gali būti išmokytas paimti konkretų daiktą, tačiau jei tas objektas guli ant šono (galbūt jis nuvirto), robotas tai mato kaip visiškai naują scenarijų. Tai yra viena iš priežasčių, kodėl mašininio mokymosi sistemoms taip sunku apibendrinti naujas objektų orientacijas.
Kad įveiktų šį iššūkį, mokslininkai sukūrė naujo tipo neuroninio tinklo modelį – Neuronų aprašą. Laukas (NDF), kuris mokosi elementų klasės 3D geometrijos. Modelis apskaičiuoja konkretaus elemento geometrinį vaizdą naudojant 3D taškų debesį, kuris yra trijų matmenų duomenų taškų arba koordinačių rinkinys. Duomenų taškus galima gauti iš gylio kameros, kuri pateikia informaciją apie atstumą tarp objekto ir apžvalgos taško. Nors tinklas buvo apmokytas modeliuoti dideliu sintetinių 3D formų duomenų rinkiniu, jis gali būti tiesiogiai pritaikytas objektams realiame pasaulyje.
Komanda sukūrė NDF su savybe, vadinama ekvivariacija. . Su šia savybe, jei modeliui rodomas vertikalaus puodelio vaizdas, o po to rodomas to paties puodelio vaizdas ant šono, jis supranta, kad antrasis puodelis yra tas pats objektas, tik pasuktas.
„Šis lygiavertiškumas leidžia mums daug veiksmingiau tvarkyti atvejus, kai stebimas objektas yra savavališkai orientuotas“, – sako Simeonovas.
Kai NDF mokosi atkurti formas panašių objektų, taip pat išmoksta susieti susijusias tų objektų dalis. Pavyzdžiui, ji sužino, kad puodelių rankenos yra panašios, net jei kai kurie puodeliai yra aukštesni ar platesni už kitus arba turi mažesnes ar ilgesnes rankenas.
„Jei norite tai padaryti su Kitas būdas, jūs turėtumėte ranka pažymėti visas dalis. Vietoj to, mūsų metodas automatiškai atranda šias dalis iš formos rekonstrukcijos“, – sako Du.
Tyrėjai naudoja šį apmokytą NDF modelį, norėdami išmokyti robotą naujų įgūdžių, pasitelkę tik kelis fizinius pavyzdžius. Jie perkelia roboto ranką ant norimos daikto dalies, pavyzdžiui, dubens krašto ar puodelio rankenos, ir užrašo pirštų galiukų vietas.
)Kadangi NDF išmoko tiek daug apie 3D geometriją ir kaip rekonstruoti figūras, jis gali daryti išvadą apie naujos formos struktūrą, kuri leidžia sistemai perkelti demonstracijas į naujus objektus savavališkomis pozomis, aiškina Du.
Nugalėtojo išrinkimas
Jie išbandė savo modelį modeliuodami ir ant tikros roboto rankos, naudodami puodelius, dubenys ir buteliai kaip daiktai. Jų metodo sėkmės rodiklis buvo 85 proc., kai buvo atliekamos užduočių pasirinkimo ir išdėstymo su naujais objektais naujose orientacijose, sėkmės rodiklis, o geriausiu pradiniu tašku pavyko pasiekti tik proc. Sėkmė reiškia sučiupti naują objektą ir padėti jį į tikslinę vietą, pavyzdžiui, pakabinti puodelius ant lentynos.
Daugelyje bazinių linijų naudojama 2D vaizdo informacija, o ne 3D geometrija, todėl jiems tai padaryti sunkiau. lygiavertiškumo integravimo metodai. Tai yra viena iš priežasčių, kodėl NDF technika veikė daug geriau.
Nors tyrėjai buvo patenkinti jos veikimu, jų metodas veikia tik tai konkrečiai objektų kategorijai, kurioje jis buvo apmokytas. Robotas, išmokytas paimti bokalus, negalės paimti dėžių ar ausinių, nes šie objektai turi geometrines ypatybes, kurios pernelyg skiriasi nuo to, prie kurios buvo apmokytas tinklas.
Ateityje būtų idealu išplėsti ją iki daugelio kategorijų arba visiškai atsisakyti kategorijos sąvokos“, – sako Simeonovas.
Jie taip pat planuoja pritaikyti sistemą nestandžiams objektams ir ilgesniu laikotarpiu, leisti sistemai atlikti pasirinkimo ir padėti užduotis, kai pasikeičia tikslinė sritis.
„Kaip efektyviai galime išmokyti robotus naujų manipuliavimo įgūdžių, priklauso nuo robotų gebėjimo apibendrinti tik iš kelių demonstracijų. Šis darbas parodo, kaip robotas gali tvirtai perkelti objekto paėmimo ar padėjimo demonstracijas į anksčiau nematytus objektus“, – sako Dieteris Foxas, Vašingtono universiteto kompiuterių mokslo ir inžinerijos profesorius, kuris nebuvo dalyvauja šiame tyrime. „Šiame tyrime panaudota naujausia neuroninių objektų vaizdavimo gilaus mokymosi pažanga ir pristatomos kelios labai sumanios naujovės, dėl kurių jie puikiai tinka manipuliuoti robotu. Realaus pasaulio eksperimentai yra nepaprastai įspūdingi ir tikiuosi, kad daugelis tyrėjų jais remsis. rezultatai.”
Šį darbą iš dalies remia Pažangių gynybos tyrimų projektų agentūra, Singapūro gynybos mokslo ir technologijų agentūra ir Nacionalinis mokslo fondas.

