Menininkai, kurie animaciniuose filmuose ir vaizdo žaidimuose atgaivina herojus ir piktadarius, dėl naujos MIT mokslininkų įdiegtos technikos gali labiau kontroliuoti savo animaciją.
Jų metodas generuoja matematines funkcijas, žinomas kaip baricentrinės koordinatės, kurios apibrėžia, kaip 2D ir 3D formos gali sulenkti, ištempti ir judėti erdvėje. Pavyzdžiui, menininkas, naudodamas savo įrankį, galėtų pasirinkti funkcijas, kurios priverstų 3D katės uodegos judesius pritaikyti jų vizijai ir animuoto katino „išvaizdai“.
Šis gifas parodo, kaip mokslininkai naudojo savo techniką, kad katės uodega judėtų sklandžiau. Vaizdas: tyrėjų sutikimas
Daugelis kitų šios problemos metodų yra nelankstūs, suteikiantys tik vieną baricentrinių koordinačių funkcijų parinktį tam tikram animaciniam veikėjui. Kiekviena funkcija gali būti pati geriausia tam tikrai animacijai. Menininkas turėtų pradėti nuo nulio su nauju požiūriu kiekvieną kartą, kai nori išbandyti šiek tiek kitokią išvaizdą.
„Kaip tyrinėtojai kartais galime įstrigti meninių problemų sprendimo kilpoje nepasitarę su menininkais. Menininkams rūpi lankstumas ir galutinio produkto „išvaizda“. Jiems nerūpi dalinės diferencialinės lygtys, kurias jūsų algoritmas išsprendžia užkulisiuose“, – sako Ana Dodik, pagrindinė šios technikos straipsnio autorė.
Be meninio pritaikymo, ši technika gali būti naudojama tokiose srityse kaip medicininis vaizdavimas, architektūra, virtuali realybė ir netgi kompiuterinė vizija, kaip įrankis, padedantis robotams išsiaiškinti, kaip objektai juda realiame pasaulyje.
Dodikas, elektros inžinerijos ir kompiuterių mokslų (EECS) magistrantūros studentas, parašė darbą su Odedu Steinu, Pietų Kalifornijos universiteto Viterbi inžinerijos mokyklos docentu; Vincentas Sitzmannas, EECS docentas, vadovaujantis MIT kompiuterių mokslo ir dirbtinio intelekto laboratorijos (CSAIL) scenos atstovavimo grupei; ir vyresnysis autorius Justinas Solomonas, EECS docentas ir CSAIL geometrinių duomenų apdorojimo grupės vadovas. Tyrimas neseniai buvo pristatytas SIGGRAPH Asia.
Apibendrintas požiūris
Kai menininkas animuoja 2D ar 3D personažą, vienas įprastas būdas yra apsupti sudėtingą personažo formą paprastesniu taškų rinkiniu, sujungtu linijų atkarpomis arba trikampiais, vadinamu narvu. Animatorius tempia šiuos taškus, kad judėtų ir deformuotų veikėją narve. Pagrindinė techninė problema yra nustatyti, kaip veikėjas juda, kai narvas modifikuojamas; šį judėjimą lemia tam tikros baricentrinės koordinačių funkcijos konstrukcija.
Tradiciniai metodai naudoja sudėtingas lygtis, kad surastų narvelyje pagrįstus judesius, kurie yra ypač sklandūs, vengiant vingių, kurie gali susidaryti formoje, kai ji yra ištempta arba sulenkta iki kraštutinumo. Tačiau yra daug sąvokų apie tai, kaip meninė „glotnumo“ idėja paverčiama matematika, ir kiekviena iš jų lemia skirtingą baricentrinių koordinačių funkcijų rinkinį.
MIT mokslininkai siekė bendro požiūrio, kuris leistų menininkams turėti įtakos kuriant arba pasirenkant bet kokios formos lygumo energiją. Tada menininkas galėjo apžiūrėti deformaciją ir pasirinkti glotnumo energiją, kuri geriausiai atrodo jų skoniui.
Nors lankstus baricentrinių koordinačių projektavimas yra šiuolaikinė idėja, pagrindinė matematinė baricentrinių koordinačių konstrukcija atsirado šimtmečius. Vokiečių matematiko Augusto Möbiuso 1827 m. pristatytos baricentrinės koordinatės nurodo, kaip kiekvienas formos kampas daro įtaką figūros interjerui.
Trikampyje, kurią Möbiusas naudojo savo skaičiavimuose, baricentrines koordinates lengva suprojektuoti, tačiau kai narvas nėra trikampis, skaičiavimai tampa netvarkingi. Sudaryti baricentrines koordinates sudėtingam narveliui yra ypač sunku, nes sudėtingų formų atveju kiekviena baricentrinė koordinatė turi atitikti apribojimus ir būti kuo sklandesnė.
Nukrypstant nuo ankstesnio darbo, komanda naudojo specialų neuroninį tinklą, kad modeliuotų nežinomas baricentrines koordinačių funkcijas. Neuroninis tinklas, laisvai pagrįstas žmogaus smegenimis, apdoroja įvestį naudodamas daugybę tarpusavyje sujungtų mazgų sluoksnių.
Nors neuroniniai tinklai dažnai taikomi dirbtinio intelekto programose, kurios imituoja žmogaus mintį, šiame projekte neuroniniai tinklai naudojami dėl matematinių priežasčių. Tyrėjų tinklo architektūra žino, kaip išvesti baricentrines koordinačių funkcijas, kurios tiksliai atitinka visus apribojimus. Jie sukuria apribojimus tiesiai į tinklą, todėl kai jis sukuria sprendimus, jie visada galioja. Ši konstrukcija padeda menininkams sukurti įdomias baricentrines koordinates, nesijaudinant dėl matematinių problemos aspektų.
„Sudėtinga dalis buvo kurti suvaržymus. Standartiniai įrankiai nepadėjo mūsų iki galo, todėl tikrai turėjome galvoti ne apie dėžutę“, – sako Dodikas.
Virtualūs trikampiai
Mokslininkai rėmėsi trikampėmis baricentrinėmis koordinatėmis, kurias Möbius pristatė beveik prieš 200 metų. Šias trikampes koordinates lengva apskaičiuoti ir tenkinti visus būtinus apribojimus, tačiau šiuolaikiniai narvai yra daug sudėtingesni nei trikampiai.
Norėdami užpildyti atotrūkį, tyrėjų metodas apima formą su persidengiančiais virtualiais trikampiais, jungiančiais taškų trejetus narvo išorėje.
„Kiekvienas virtualus trikampis apibrėžia galiojančią baricentrinių koordinačių funkciją. Mums tiesiog reikia būdo, kaip juos sujungti“, – sako ji.
Čia atsiranda neuroninis tinklas. Jis numato, kaip sujungti virtualių trikampių baricentrines koordinates, kad būtų sudėtingesnė, bet sklandesnė funkcija.
Naudodamas savo metodą, menininkas gali išbandyti vieną funkciją, pažvelgti į galutinę animaciją ir tada koreguoti koordinates, kad generuotų skirtingus judesius, kol pasieks animaciją, kuri atrodo taip, kaip nori.
„Žvelgiant iš praktinės perspektyvos, manau, kad didžiausias poveikis yra tai, kad neuroniniai tinklai suteikia jums daug lankstumo, kurio anksčiau neturėjote“, – sako Dodikas.
Tyrėjai pademonstravo, kaip jų metodas gali sukurti natūralesnę animaciją nei kiti metodai, pavyzdžiui, katės uodega, kuri judant sklandžiai lenkiasi, o ne standžiai susilanksto šalia narvo viršūnių.
Ateityje jie nori išbandyti skirtingas neuroninio tinklo paspartinimo strategijas. Jie taip pat nori sukurti šį metodą į interaktyvią sąsają, kuri leistų menininkui lengvai kartoti animacijas realiuoju laiku.
Šį tyrimą iš dalies finansavo JAV armijos tyrimų biuras, JAV oro pajėgų mokslinių tyrimų biuras, JAV nacionalinis mokslo fondas, programa CSAIL Systems that Learn, MIT-IBM Watson AI Lab, Toyota ir CSAIL bendra organizacija. Tyrimų centras, „Adobe Systems“, „Google“ tyrimų apdovanojimas, Singapūro gynybos mokslo ir technologijų agentūra ir „Amazon Science Hub“.