Šuo robotas Morti. Kreditas: Felix Ruppert, MPI-IS Dinaminės lokomotyvacijos grupė Naujagimis žirafa arba kumeliukas turi išmokti kuo greičiau vaikščioti kojomis, kad išvengtų plėšrūnų. Gyvūnai gimsta su raumenų koordinacijos tinklais, esančiais nugaros smegenyse. Tačiau išmokti tiksliai koordinuoti kojų raumenis ir sausgysles užtrunka šiek tiek laiko. Iš pradžių gyvūnų jaunikliai labai pasikliauja sunkiai įsisavintais nugaros smegenų refleksais. Nors ir šiek tiek paprastesni, judesių kontrolės refleksai padeda gyvūnui išvengti kritimo ir susižalojimo per pirmuosius bandymus vaikščioti. Toliau reikia lavinti pažangesnę ir tikslesnę raumenų kontrolę, kol galiausiai nervų sistema gerai prisitaiko prie jauno gyvūno kojų raumenų ir sausgyslių. Daugiau jokių nekontroliuojamų klupinėjimų – jaunas gyvūnas dabar gali neatsilikti nuo suaugusiųjų.
Štutgarto Makso Planko intelektinių sistemų instituto (MPI-IS) mokslininkai atliko tyrimą, kuriuo siekė išsiaiškinti, kaip gyvūnai išmoksta vaikščioti ir išmoksta suklupti. Jie sukonstravo keturkojį, šuns dydžio robotą, kuris padėjo jiems išsiaiškinti detales.
„Kaip inžinieriai ir robotikai, atsakymo ieškojome kurdami robotą, kuris pasižymi refleksais kaip gyvūnas ir mokosi iš klaidų”, – sako Feliksas Ruppertas (Felix Ruppert), buvęs MPI-IS dinaminės lokomotyvacijos tyrimų grupės doktorantas. „Jei gyvūnas suklumpa, ar tai yra klaida? Ne, jei tai atsitinka vieną kartą. Bet jei jis suklumpa dažnai, tai mums parodo, kaip gerai vaikšto robotas.”
Felixas Ruppertas yra pirmasis straipsnio „Learning Plastic Matching of Robot Dynamics in Closed-loop Central Pattern Generators”, kuris bus paskelbtas liepos mėnesį 18, 2022 žurnale Nature Machine Intelligence, autorius.
Mokymosi algoritmas optimizuoja virtualias stuburo smegenis
Vos per valandą išmokęs vaikščioti, Rupperto robotas puikiai išnaudoja sudėtingą kojų mechaniką. Mokymuisi vadovauja Bajeso optimizavimo algoritmas: išmatuota pėdų jutiklių informacija derinama su tikslo duomenimis iš sumodeliuotų virtualių stuburo smegenų, veikiančių kaip programa roboto kompiuteryje. Robotas mokosi vaikščioti nuolat lygindamas siunčiamą ir laukiamą jutiklių informaciją, vykdydamas refleksų ciklus ir pritaikydamas variklio valdymo modelius
Mokymosi algoritmas pritaiko centrinio modelių generatoriaus (CPG) valdymo parametrus. Žmonėms ir gyvūnams šie centriniai modelių generatoriai yra neuronų tinklai nugaros smegenyse, kurie be įvesties iš galvos smegenų sukuria periodinius raumenų susitraukimus. Centrinių modelių generatorių tinklai padeda generuoti ritmines užduotis, tokias kaip vaikščiojimas, mirksėjimas ar virškinimas. Be to, refleksai – tai nevalingi judesių kontrolės veiksmai, kuriuos sukelia sunkiai užkoduoti nerviniai takai, jungiantys kojos jutiklius su nugaros smegenimis
Kol jaunas gyvūnas eina visiškai lygiu paviršiumi, CPG gali pakakti kontroliuoti judesių signalus iš nugaros smegenų. Tačiau nedidelis žemės nelygumas pakeičia ėjimą. Įsijungia refleksai ir pakoreguoja judėjimo modelius, kad gyvūnas nenukristų. Šie momentiniai judėjimo signalų pokyčiai yra grįžtami, arba „elastingi”, ir po sutrikimo judėjimo modeliai grįžta į pradinę konfigūraciją. Tačiau jei gyvūnas nenustoja klupti per daugelį judėjimo ciklų – nepaisant aktyvių refleksų – tuomet judėjimo modeliai turi būti iš naujo išmokti ir tapti „plastiški”, t. y. negrįžtami. Naujagimio gyvūno CPG iš pradžių dar nėra pakankamai gerai sureguliuoti, todėl gyvūnas klupinėja tiek lygioje, tiek nelygioje vietovėje. Tačiau gyvūnas greitai išmoksta, kaip jo CPG ir refleksai valdo kojų raumenis ir sausgysles.
Tas pats pasakytina ir apie Labradoro dydžio robotą-šunį, vardu Morti. Dar daugiau, robotas savo judėjimo modelius optimizuoja greičiau nei gyvūnas – maždaug per valandą. Morti CPG modeliuojama mažame ir lengvame kompiuteryje, kuris valdo roboto kojų judesius. Ši virtuali stuburo smegenų dalis yra keturkojo roboto nugaroje, kur būtų galva. Per valandą, kurios reikia, kad robotas sklandžiai eitų, roboto kojų jutiklių duomenys nuolat lyginami su tikėtinu prisilietimu, kurį prognozuoja roboto CPG. Jei robotas suklumpa, mokymosi algoritmas keičia kojų svyravimo pirmyn ir atgal atstumą, kojų svyravimo greitį ir kojų buvimo ant žemės trukmę. Pakoreguotas judesys taip pat turi įtakos tam, kaip gerai robotas gali panaudoti savo prisitaikančią kojų mechaniką. Mokymosi proceso metu CPG siunčia pritaikytus variklio signalus, kad robotas nuo šiol kluptų mažiau ir optimizuotų savo ėjimą. Šioje sistemoje virtualus stuburas neturi aiškių žinių apie roboto kojos konstrukciją, jos variklius ir spyruokles. Nieko nežinodamas apie mašinos fiziką, jis neturi roboto „modelio.”
„Mūsų robotas praktiškai „gimsta” nieko nežinodamas apie savo kojų anatomiją ir jų veikimą, – aiškina Ruppertas. „CPG primena gamtoje įdiegtą automatinio vaikščiojimo intelektą, kurį suteikia gamta ir kurį mes perkėlėme į robotą. Kompiuteris sukuria signalus, kurie valdo kojų variklius, ir robotas iš pradžių vaikšto ir klupinėja. Duomenys iš jutiklių grįžta atgal į virtualųjį stuburą, kur jutiklių ir CPG duomenys palyginami. Jei jutiklių duomenys nesutampa su laukiamais duomenimis, mokymosi algoritmas keičia vaikščiojimo elgseną, kol robotas vaikšto gerai ir nesuklupdamas. CPG išvesties keitimas išlaikant aktyvius refleksus ir stebint roboto klupinėjimą yra pagrindinė mokymosi proceso dalis.”
Šuo robotas Morti. Kreditas: Felix Ruppert, MPI-IS Dinaminės lokomotyvacijos grupė Energiją taupantis roboto šuns valdymas
Morti kompiuteris vaikščiodamas suvartoja tik penkis vatus energijos. Žymių gamintojų pramoniniai keturkojai robotai, kurie išmoko važiuoti naudodami sudėtingus valdiklius, naudoja daug daugiau energijos. Jų valdikliai koduojami žinant tikslią roboto masę ir kūno geometriją – naudojant roboto modelį. Jie paprastai suvartoja nuo kelių dešimčių iki kelių šimtų vatų energijos. Abiejų tipų robotai veikia dinamiškai ir efektyviai, tačiau Štutgarto modelio skaičiavimo energijos sąnaudos yra daug mažesnės. Be to, jis suteikia svarbių įžvalgų apie gyvūnų anatomiją
„Negalime lengvai ištirti gyvo gyvūno nugaros smegenų. Tačiau galime tokį sumodeliuoti robote”, – sako Alexanderis Badri-Spröwitzas, publikacijos bendraautorius kartu su Ruppertu ir Dinaminės lokomotyvacijos tyrimų grupės vadovas. „Žinome, kad tokių CPG yra daugelyje gyvūnų. Žinome, kad refleksai yra įsitvirtinę; tačiau kaip galime sujungti abu dalykus, kad gyvūnai išmoktų judesių su refleksais ir CPG? Tai fundamentalus tyrimas robotikos ir biologijos sankirtoje. Robotinis modelis suteikia mums atsakymus į klausimus, į kuriuos vien biologija negali atsakyti.”
Daugiau informacijos: Felix Ruppert, Learning plastic matching of robot dynamics in closed-loop central pattern generators, Nature Machine Intelligence (2022). DOI: 10.1038/s42256-022-00505-4. www.nature.com/articles/s42256-022-00505-4
Citavimas: Robotas šuo išmoksta vaikščioti per vieną valandą (2022, liepa 18), žiūrėta rugpjūčio 1 d. 2022 iš https://techxplore.com/news/2022-07-robot-dog-hour.html
Šiam dokumentui taikomos autorių teisės. Be raštiško leidimo negalima atgaminti jokios jo dalies, išskyrus sąžiningą naudojimą asmeninėms studijoms ar moksliniams tyrimams. Turinys pateikiamas tik informaciniais tikslais.

