Daugelio mūsų vidinis vaikas jaučia didžiulį džiaugsmą, kai pakliūva į krūvą fluorescencinio, guminio vandens, druskos ir miltų mišinio, dėl kurio „Goo“ tapo žinomas kaip žaidimų tešla. (Net jei suaugusiesiems tai nutinka retai.)
Nors dvimečiams vaikams manipuliuoti žaidybine tešla yra smagu ir lengva, robotams sunku suvaldyti beformį dumblą. Mašinos vis patikimiau valdo standžius objektus, tačiau manipuliuojant minkštais, deformuojamais objektais susiduriama su daugybe techninių iššūkių, o svarbiausia, kaip ir daugumos lanksčių struktūrų atveju, jei pajudinsi vieną dalį, greičiausiai paveiksi ir visas kitas.
MIT Kompiuterių mokslo ir dirbtinio intelekto laboratorijos (CSAIL) ir Stanfordo universiteto mokslininkai neseniai leido robotams žaisti su modeliavimo junginiais, tačiau ne dėl nostalgijos. Jų naujoji sistema mokosi tiesiogiai iš vizualinių įvesties duomenų, kad robotas su dviejų pirštų griebtuvu galėtų matyti, modeliuoti ir formuoti tešlos objektus. „RoboCraft“ galėjo patikimai suplanuoti roboto elgseną, kad jis galėtų suspausti ir paleisti žaislinę tešlą ir iš jos sukurti įvairias raides, įskaitant tas, kurių jis niekada nebuvo matęs. Turėdamas vos 10 minučių duomenų, dviejų pirštų griebtuvas varžėsi su žmogaus kolegomis, kurie teleoperavo mašiną, – atlikdamas bandomas užduotis jis dirbo vienodai, o kartais net geriau.
„Didelio laisvės laipsnio objektų modeliavimas ir manipuliavimas jais yra esminiai gebėjimai, kad robotai išmoktų atlikti sudėtingas pramoninės ir buitinės sąveikos užduotis, pavyzdžiui, kimšti koldūnus, sukti sušius ir gaminti keramikos dirbinius“, – sako Yunzhu Li, CSAIL doktorantūros studentas ir naujo straipsnio apie „RoboCraft“ autorius. „Nors pastaruoju metu pasiekta pažangos manipuliuojant drabužiais ir virvėmis, nustatėme, kad didelio plastiškumo objektai, tokie kaip tešla ar plastilinas, – nepaisant to, kad jie yra visur paplitę šiuose namų ūkio ir pramonės objektuose, – buvo iš esmės neištirta teritorija. Naudodami „RoboCraft“ dinamikos modelius mokomės tiesiogiai iš didelio matmens jutiminių duomenų, o tai suteikia perspektyvų duomenų pagrindu sukurtą būdą efektyviam planavimui atlikti.“
Esant neapibrėžtai, lygiai medžiagai, prieš atliekant bet kokį veiksmingą ir efektyvų modeliavimą ir planavimą reikia atsižvelgti į visą struktūrą. Paverčiant vaizdus mažų dalelių grafikais, kartu su algoritmais „RoboCraft“, kaip dinamikos modelį naudodamas grafų neuroninį tinklą, tiksliau prognozuoja medžiagos formų pokyčius.
Paprastai tyrėjai naudoja sudėtingus fizikos simuliatorius, kad modeliuotų ir suprastų objektus veikiančią jėgą ir dinamiką, tačiau „RoboCraft“ tiesiog naudoja vaizdinius duomenis. Vidinis sistemos veikimas remiasi trimis dalimis, kurios formuoja minkštą medžiagą į, tarkime, „R“
Pirmoji dalis – suvokimas – yra susijusi su mokymusi „matyti“ Ji naudoja kameras, kad iš aplinkos surinktų neapdorotus vaizdinius jutiklių duomenis, kurie vėliau paverčiami mažais dalelių debesėliais, atvaizduojančiais formas. Grafų pagrindu veikiantis neuroninis tinklas naudoja minėtų dalelių duomenis, kad išmoktų „imituoti“ objekto dinamiką, t. y. kaip jis juda. Tada algoritmai padeda planuoti roboto elgesį, kad jis išmoktų „formuoti“ tešlos gabalėlį, apsiginklavęs mokymo duomenimis, gautais iš daugybės prisilietimų. Nors raidės šiek tiek padrikos, jos neabejotinai reprezentatyvios.
Be mielų formų, komanda (iš tikrųjų) kuria koldūnus iš tešlos ir paruošto įdaro. Šiuo metu, turint tik dviejų pirštų griebtuvėlį, tai didelis uždavinys. RoboCraft reikėtų papildomų įrankių (kepėjui reikia kelių įrankių, kad galėtų gaminti maistą; taip pat ir robotams) – kočėlo, antspaudo ir formos.
Labiau tolimoje ateityje mokslininkai įsivaizduoja „RoboCraft“ panaudojimą padedant atlikti namų ruošos darbus ir namų ruošos darbus, kurie galėtų būti ypač naudingi pagyvenusiems žmonėms arba riboto judrumo žmonėms. Tam, atsižvelgiant į daugybę galimų kliūčių, prireiktų kur kas adaptyvesnio tešlos ar daikto atvaizdavimo, taip pat ištirti, kokios klasės modeliai galėtų būti tinkami pagrindinėms struktūrinėms sistemoms perteikti.
„RoboCraft“ iš esmės parodo, kad šį nuspėjamąjį modelį galima išmokti labai efektyviai naudojant duomenis, kad būtų galima planuoti judėjimą. Ilgalaikėje perspektyvoje galvojame apie įvairių įrankių panaudojimą medžiagoms manipuliuoti“, – sako Li. „Jei pagalvotumėte apie koldūnų ar tešlos gamybą, tik vienas griebtuvas to išspręsti negalėtų. Padėti modeliui suprasti ir atlikti ilgesnio laikotarpio planavimo uždavinius, pavyzdžiui, kaip tešla deformuosis atsižvelgiant į esamą įrankį, judesius ir veiksmus, yra kitas būsimo darbo žingsnis.“
Straipsnį Li parašė kartu su Haochen Shi, Stanfordo magistrantu, Huazhe Xu, Stanfordo podoktorantu, Zhiao Huang, Kalifornijos universiteto San Diege doktorantu, ir Jiajun Wu, Stanfordo docentu. Jie pristatys tyrimus konferencijoje „Robotika: Niujorke vyksiančioje konferencijoje „Robotika: mokslas ir sistemos“. Darbą iš dalies remia Stanfordo į žmogų orientuoto dirbtinio intelekto institutas (HAI), „Samsung Global Research Outreach“ (GRO) programa, „Toyota“ tyrimų institutas (TRI), „Amazon“, „Autodesk“, „Salesforce“ ir „Bosch“