„ChatGPT“ ir kiti giliai generuojantys modeliai pasirodė esąs neįtikėtinos imitacijos. Šie dirbtinio intelekto supermodeliai gali spausdinti eilėraščius, užbaigti simfonijas ir kurti naujus vaizdo įrašus bei vaizdus, automatiškai mokydamiesi iš daugybės ankstesnių kūrinių pavyzdžių. Šie nepaprastai galingi ir universalūs įrankiai puikiai sukuria naują turinį, panašų į viską, ką jie matė anksčiau.
Tačiau, kaip sako MIT inžinieriai naujame tyrime, panašumo neužtenka, jei norite iš tikrųjų įdiegti naujovių atliekant inžinerines užduotis.
„Giulieji generaciniai modeliai (DGM) yra labai perspektyvūs, bet ir iš esmės ydingi“, – sako tyrimo autorius Lyle’as Regenwetteris, MIT mechanikos inžinerijos absolventas. „Šių modelių tikslas yra imituoti duomenų rinkinį. Tačiau kaip inžinieriai ir dizaineriai dažnai nenorime kurti tokio dizaino, kuris jau yra.
Jis ir jo kolegos teigia, kad jei mechanikos inžinieriai nori, kad dirbtinis intelektas padėtų kurti naujas idėjas ir projektus, pirmiausia jie turės perorientuoti tuos modelius, o ne „statistinio panašumo“.
„Daugelio šių modelių veikimas yra aiškiai susijęs su tuo, kiek statistiškai panašus sugeneruotas pavyzdys į tai, ką modelis jau matė“, – sako bendraautorius Faezas Ahmedas, MIT mechanikos inžinerijos docentas. „Tačiau dizaino srityje būti kitokiam gali būti svarbu, jei norite naujovių.”
Savo tyrime Ahmedas ir Regenwetteris atskleidžia gilių generuojamųjų modelių spąstus, kai jiems pavesta išspręsti inžinerinio projektavimo problemas. Atlikdama dviračių rėmo dizaino atvejo tyrimą, komanda parodė, kad šie modeliai sukuria naujus rėmus, kurie imituoja ankstesnius dizainus, tačiau neatitinka inžinerinių savybių ir reikalavimų.
Kai tyrėjai DGM pristatė tą pačią dviračių rėmo problemą, kurią jie specialiai sukūrė su inžineriniais tikslais, o ne tik su statistiniu panašumu, šie modeliai sukūrė novatoriškesnius, našesnius rėmus.
Grupės rezultatai rodo, kad į panašumą orientuoti AI modeliai nėra visiškai pritaikyti inžinerinėms problemoms spręsti. Tačiau, kaip savo tyrime pabrėžia ir mokslininkai, kruopščiai planuojant užduočiai tinkamas metrikas, dirbtinio intelekto modeliai gali būti efektyvus dizaino „antrasis pilotas“.
„Tai yra apie tai, kaip AI gali padėti inžinieriams geriau ir greičiau kurti naujoviškus produktus“, – sako Ahmedas. „Kad tai padarytume, pirmiausia turime suprasti reikalavimus. Tai yra vienas žingsnis ta kryptimi“.
Naujasis komandos tyrimas neseniai pasirodė internete ir bus gruodžio mėnesio spausdintame žurnalo leidime Dizainas padarytas kompiuterio pagalba. Tyrimas yra MIT-IBM Watson AI Lab kompiuterių mokslininkų ir MIT DeCoDe laboratorijos mechanikos inžinierių bendradarbiavimas. Tyrimo bendraautoriai yra Akash Srivastava ir Dan Gutreundas iš MIT-IBM Watson AI Lab.
Problemos įrėminimas
Kaip rašo Ahmedas ir Regenwetteris, DGM yra „galingi besimokantieji, galintys pasigirti neprilygstamu gebėjimu“ apdoroti didžiulius duomenų kiekius. DGM yra platus terminas, apibūdinantis bet kokį mašininio mokymosi modelį, kuris yra išmokytas išmokti paskirstyti duomenis ir naudoti tai naujam, statistiškai panašaus turinio generavimui. Labai populiarus „ChatGPT“ yra vienas iš gilaus generavimo modelių, žinomų kaip didelės kalbos modelis, arba LLM, į kurį įtrauktos natūralios kalbos apdorojimo galimybės, leidžiančios programai generuoti tikroviškus vaizdus ir kalbą atsakant į pokalbio užklausas. Kiti populiarūs vaizdo generavimo modeliai yra DALL-E ir Stable Diffusion.
Dėl gebėjimo mokytis iš duomenų ir generuoti tikroviškus pavyzdžius, DGM vis dažniau taikomi įvairiose inžinerijos srityse. Dizaineriai naudojo gilius generatyvius modelius, kad sukurtų naujus orlaivių rėmus, metamedžiagų dizainą ir optimalią tiltų ir automobilių geometriją. Tačiau dažniausiai modeliai imitavo esamą dizainą, nepagerindami esamų dizainų našumo.
„Dizaineriams, dirbantiems su DGM, tarsi trūksta šios vyšnios viršuje, o tai koreguoja modelio mokymo tikslą, kad sutelktų dėmesį į dizaino reikalavimus“, – sako Regenwetteris. „Taigi, žmonės galiausiai sukuria dizainą, kuris yra labai panašus į duomenų rinkinį.”
Naujajame tyrime jis apibūdina pagrindines DGM taikymo inžinerinėms užduotims spąstus ir parodo, kad pagrindinis standartinių DGM tikslas neatsižvelgia į konkrečius projektavimo reikalavimus. Norėdami tai iliustruoti, komanda pateikia paprastą dviračio rėmo dizaino atvejį ir parodo, kad problemos gali iškilti jau pradiniame mokymosi etape. Kadangi modelis mokosi iš tūkstančių esamų įvairių dydžių ir formų dviračių rėmų, jis gali manyti, kad dviejų panašių matmenų rėmų našumas yra panašus, nors iš tikrųjų nedidelis atsijungimas viename rėme – per mažas, kad būtų galima registruoti kaip reikšmingą statistinio panašumo skirtumą. metrika – kadras yra daug silpnesnis nei kitas, vizualiai panašus kadras.
Už „vanilės”
Animacija, vaizduojanti įprastų dviračių dizainų transformacijas. Kreditas: tyrėjų sutikimas
Tyrėjai perkėlė dviračio pavyzdį, kad sužinotų, kokius dizainus DGM iš tikrųjų sukurs, pasimokęs iš esamų dizainų. Pirmiausia jie išbandė įprastą „vanilinį“ generacinį priešininkų tinklą arba GAN – modelį, kuris buvo plačiai naudojamas vaizdų ir teksto sintezei ir yra pritaikytas paprasčiausiai generuoti statistiškai panašų turinį. Jie apmokė modelį, naudodami duomenų rinkinį, sudarytą iš tūkstančių dviračių rėmų, įskaitant komerciškai pagamintus dizainus ir mažiau įprastus, vienkartinius mėgėjų sukurtus rėmus.
Kai modelis išmoko iš duomenų, mokslininkai paprašė jo sukurti šimtus naujų dviračių rėmų. Modelis sukūrė tikrovišką dizainą, primenantį esamus rėmus. Tačiau nė vienas dizainas neparodė reikšmingo našumo pagerėjimo, o kai kurie netgi buvo šiek tiek prastesni, su sunkesniais, mažiau patikimais rėmeliais.
Tada komanda atliko tą patį testą su dviem kitais DGM, kurie buvo specialiai sukurti inžinerinėms užduotims. Pirmasis modelis yra tas, kurį Ahmedas anksčiau sukūrė, kad sukurtų aukštos kokybės aerodinaminio profilio dizainą. Jis sukūrė šį modelį, kad teiktų pirmenybę statistiniam panašumui ir funkciniam našumui. Pritaikius dviračio rėmo užduočiai, šis modelis sukūrė tikrovišką dizainą, kuris taip pat buvo lengvesnis ir tvirtesnis nei esami dizainai. Tačiau jis taip pat gamino fiziškai „negaliojančius“ kadrus su komponentais, kurie ne visai tiko arba sutampa fiziškai neįmanomu būdu.
„Matėme dizainą, kuris buvo žymiai geresnis nei duomenų rinkinys, bet ir geometriškai nesuderinamus dizainus, nes modelis nebuvo orientuotas į dizaino suvaržymų laikymąsi“, – sako Regenwetter.
Paskutinis modelis, kurį komanda išbandė, buvo tas, kurį Regenwetter sukūrė naujoms geometrinėms struktūroms sukurti. Šis modelis buvo sukurtas atsižvelgiant į tuos pačius prioritetus kaip ir ankstesni modeliai, pridedant dizaino apribojimus ir teikiant pirmenybę fiziškai gyvybingiems rėmams, pavyzdžiui, be jokių atjungimų ar persidengiančių juostų. Šis paskutinis modelis sukūrė našiausius dizainus, kurie taip pat buvo fiziškai įmanomi.
„Mes nustatėme, kad kai modelis viršija statistinį panašumą, jis gali sukurti geresnius dizainus nei jau esantys“, – sako Ahmedas. „Tai yra įrodymas, ką dirbtinis intelektas gali padaryti, jei jis yra aiškiai apmokytas atlikti projektavimo užduotį.
Pavyzdžiui, jei DGM galima sukurti atsižvelgiant į kitus prioritetus, tokius kaip našumas, dizaino apribojimai ir naujumas, Ahmedas numato, kad „daugelis inžinerijos sričių, tokių kaip molekulinis projektavimas ir civilinė infrastruktūra, būtų labai naudingi. Išsiaiškindami galimas kliūtis, susijusias su vien tik statistiniu panašumu, tikimės įkvėpti naujų būdų ir strategijų kuriant dirbtinio intelekto programas už daugialypės terpės ribų.