Tokiose srityse kaip fizika ir inžinerija, dalinės diferencialinės lygtys (PDE) naudojamos sudėtingiems fiziniams procesams modeliuoti, kad būtų galima suprasti, kaip veikia kai kurios sudėtingiausios fizinės ir gamtinės sistemos pasaulyje.
Norėdami išspręsti šias sudėtingas lygtis, mokslininkai naudoja didelio tikslumo skaitinius sprendiklius, kurių vykdymas gali būti labai daug laiko ir skaičiavimo požiūriu brangus. Dabartiniai supaprastinti alternatyvūs, duomenimis pagrįsti pakaitiniai modeliai, apskaičiuoja sprendimo tikslo savybę PDE, o ne visą sprendimą. Jie yra mokomi duomenų rinkinio, kurį sugeneravo didelio tikslumo tirpiklis, kad būtų galima numatyti PDE išvestį naujiems įvestims. Tai reikalauja daug duomenų ir brangu, nes sudėtingoms fizinėms sistemoms reikia daug modeliavimo, kad būtų sukurta pakankamai duomenų.
Gruodžio mėn. paskelbtame naujame dokumente „Fizika patobulinti gilūs dalinių diferencialinių lygčių pakaitalai“. Gamtos mašinos intelektassiūlomas naujas metodas kuriant duomenimis pagrįstus pakaitinius sudėtingų fizinių sistemų modelius tokiose srityse kaip mechanika, optika, šiluminis transportas, skysčių dinamika, fizikinė chemija ir klimato modeliai.
Straipsnį parašė MIT taikomosios matematikos profesorius Stevenas G. Johnsonas kartu su Payel Das ir Youssef Mroueh iš MIT-IBM Watson AI Lab ir IBM tyrimų; Chrisas Rackauckas iš „Julia Lab“; ir Raphaël Pestourie, buvęs MIT postdoc, kuris dabar dirba Georgia Tech. Autoriai savo metodą vadina „fizikos patobulintu giliu pakaitalu“ (PEDS), kuris sujungia žemo tikslumo, paaiškinamą fizikos simuliatorių su neuroninio tinklo generatoriumi. Neuroninio tinklo generatorius yra apmokytas nuo galo iki galo, kad atitiktų didelio tikslumo skaitmeninio sprendiklio išvestį.
„Mano siekis yra pakeisti neefektyvų bandymų ir klaidų procesą sistemingu, kompiuteriniu modeliavimu ir optimizavimu“, – sako Pestourie. „Naujausi DI proveržiai, tokie kaip didelės kalbos ChatGPT modelis, priklauso nuo šimtų milijardų parametrų ir reikalauja didžiulių išteklių apmokymui ir įvertinimui. Priešingai, PEDS yra prieinama visiems, nes ji yra neįtikėtinai efektyvi skaičiuojant išteklius ir turi labai mažą barjerą dėl infrastruktūros, reikalingos jai naudoti.
Straipsnyje jie parodo, kad PEDS pakaitalai gali būti iki trijų kartų tikslesni nei grįžtamojo ryšio neuroninių tinklų, turinčių ribotus duomenis (apie 1000 mokymo taškų), rinkinys ir sumažinti mokymo duomenų, reikalingų bent 100 kartų, kad būtų pasiektas tikslinė 5 procentų paklaida. Šis mokslinis mašininio mokymosi metodas, sukurtas naudojant MIT sukurtą Julia programavimo kalbą, yra efektyvus tiek kompiuteriams, tiek duomenims.
Autoriai taip pat praneša, kad PEDS pateikia bendrą, duomenimis pagrįstą strategiją, skirtą įveikti atotrūkį tarp daugybės supaprastintų fizinių modelių su atitinkamais brutalios jėgos skaitmeniniais sprendėjais, modeliuojančiais sudėtingas sistemas. Ši technika suteikia tikslumą, greitį, duomenų efektyvumą ir fizines įžvalgas apie procesą.
Pestourie sako: „Nuo 2000-ųjų, tobulėjant skaičiavimo galimybėms, mokslinių modelių tendencija buvo didinti parametrų skaičių, kad duomenys geriau atitiktų, kartais dėl mažesnio nuspėjamumo tikslumo. Išmaniai parinkdama parametrus PEDS daro priešingai. Jis naudoja automatinio diferencijavimo technologiją, kad išmokytų neuroninį tinklą, kad modelis su mažais parametrais būtų tikslus.
„Pagrindinis iššūkis, neleidžiantis pakaitinių modelių plačiau naudoti inžinerijoje, yra matmenų prakeiksmas – faktas, kad modeliui parengti reikalingi duomenys didėja eksponentiškai didėjant modelio kintamųjų skaičiui“, – sako Pestourie. „PEDS sumažina šį prakeiksmą įtraukdama informaciją iš duomenų ir iš lauko žinių žemo tikslumo modelių sprendime.
Tyrėjai teigia, kad PEDS gali atgaivinti visą iki 2000 m. sukurtą literatūrą, skirtą minimaliems modeliams – intuityviems modeliams, kuriuos PEDS galėtų padaryti tikslesnius, o taip pat nuspėti surogatinių modelių taikymą.
„PEDS sistemos taikymas yra didesnis nei mes parodėme šiame tyrime”, – sako Das. „Sudėtingos fizinės sistemos, valdomos PDE, yra visur, nuo klimato modeliavimo iki seisminio modeliavimo ir ne tik. Mūsų fizikos įkvėpti greiti ir paaiškinami pakaitiniai modeliai bus yra labai naudingi šiose programose ir papildo kitus naujus metodus, pavyzdžiui, pamatų modelius.
Tyrimą palaikė MIT-IBM Watson AI Lab ir JAV armijos tyrimų biuras per Kareivių nanotechnologijų institutą.

