Kad galėtume pereiti per pasaulį, mūsų smegenys turi intuityviai suprasti mus supantį fizinį pasaulį, kurį vėliau naudojame interpretuodami į smegenis patenkančią jutiminę informaciją.
Kaip smegenys ugdo tą intuityvų supratimą? Daugelis mokslininkų mano, kad jame gali būti naudojamas procesas, panašus į tai, kas žinoma kaip „savarankiškas mokymasis“. Šio tipo mašininis mokymasis, iš pradžių sukurtas kaip būdas sukurti efektyvesnius kompiuterinio matymo modelius, leidžia skaičiuojant modelius sužinoti apie vaizdines scenas, remiantis tik jų panašumais ir skirtumais, be etikečių ar kitos informacijos.
MIT K. Lisa Yang integracinio skaičiavimo neurologijos centro (ICoN) centro mokslininkų atlikta pora tyrimų pateikia naujų įrodymų, patvirtinančių šią hipotezę. Tyrėjai išsiaiškino, kad kai jie apmokė modelius, žinomus kaip neuroniniai tinklai, naudodami tam tikrą savarankiško mokymosi tipą, sukurti modeliai sukūrė veiklos modelius, labai panašius į gyvūnų, atliekančių tokias pačias užduotis kaip ir modeliai, smegenyse.
Išvados rodo, kad šie modeliai gali išmokti fizinio pasaulio vaizdų, kuriuos jie gali naudoti norėdami tiksliai prognozuoti, kas nutiks tame pasaulyje, ir kad žinduolių smegenys gali naudoti tą pačią strategiją, teigia mokslininkai.
„Mūsų darbo tema yra ta, kad dirbtinis intelektas, skirtas padėti kurti geresnius robotus, taip pat yra pagrindas geriau suprasti smegenis apskritai“, – sako Aranas Nayebi, ICoN centro postdoc. „Kol kas negalime pasakyti, ar tai visos smegenys, tačiau, atsižvelgiant į skales ir skirtingas smegenų sritis, mūsų rezultatai rodo organizavimo principą.
Nayebi yra pagrindinis vieno iš tyrimų autorius, kurį parašė Rishi Rajlingham, buvęs MIT postdoc, dabar dirbantis Meta Reality Labs, ir vyresnieji autoriai Mehrdad Jazayeri, smegenų ir pažinimo mokslų docentas bei McGovern instituto narys. Smegenų tyrimai; ir Robertas Yangas, smegenų ir pažinimo mokslų docentas bei McGovern instituto asocijuotas narys. Ila Fiete, ICoN centro direktorė, smegenų ir pažinimo mokslų profesorė bei McGovern instituto asocijuotoji narė, yra kito tyrimo, kuriam kartu vadovavo MIT magistrantūros studentas Mikail Khona, vyresnysis autorius. Rylanas Schaefferis, buvęs MIT vyresnysis mokslinis bendradarbis.
Abu tyrimai bus pristatyti gruodį vyksiančioje 2023 m. Neurinių informacijos apdorojimo sistemų konferencijoje (NeurIPS).
Fizinio pasaulio modeliavimas
Ankstyvieji kompiuterinio matymo modeliai daugiausia rėmėsi prižiūrimu mokymusi. Taikant šį metodą, modeliai mokomi klasifikuoti vaizdus, kurių kiekvienas yra pažymėtas pavadinimu – katė, automobilis ir kt. Gauti modeliai veikia gerai, tačiau tokiam mokymui reikia daug žmonių pažymėtų duomenų.
Siekdami sukurti veiksmingesnę alternatyvą, pastaraisiais metais mokslininkai kreipėsi į modelius, sukurtus naudojant techniką, žinomą kaip kontrastinis savarankiškai prižiūrimas mokymasis. Šio tipo mokymasis leidžia algoritmui išmokti klasifikuoti objektus pagal jų panašumą vienas į kitą, nepateikiant išorinių etikečių.
„Tai labai galingas metodas, nes dabar galite panaudoti labai didelius šiuolaikinius duomenų rinkinius, ypač vaizdo įrašus, ir iš tikrųjų atskleisti jų potencialą”, – sako Nayebi. „Daugelis šiuolaikinio dirbtinio intelekto, kurį matote dabar, ypač per pastaruosius kelerius metus su ChatGPT ir GPT-4, yra didelio masto duomenų rinkinio savarankiškai prižiūrimos objektyvios funkcijos mokymo rezultatas, kad būtų gautas labai lankstus vaizdas.
Šio tipo modeliai, dar vadinami neuroniniais tinklais, susideda iš tūkstančių ar milijonų vienas su kitu sujungtų procesorių. Kiekvienas mazgas turi skirtingo stiprumo ryšius su kitais tinklo mazgais. Tinklui analizuojant didžiulius duomenų kiekius, tų ryšių stipriosios pusės keičiasi, kai tinklas išmoksta atlikti norimą užduotį.
Kadangi modelis atlieka tam tikrą užduotį, galima išmatuoti skirtingų tinklo vienetų veiklos modelius. Kiekvieno vieneto veikla gali būti pavaizduota kaip šaudymo modelis, panašus į smegenų neuronų šaudymo modelius. Ankstesnis Nayebi ir kitų darbas parodė, kad savarankiškai prižiūrimi regėjimo modeliai sukuria veiklą, panašią į tą, kuri matoma žinduolių smegenų vizualinio apdorojimo sistemoje.
Abiejuose naujuose NeurIPS tyrimuose mokslininkai nusprendė ištirti, ar savarankiškai prižiūrimi kitų kognityvinių funkcijų skaičiavimo modeliai taip pat gali parodyti panašumų su žinduolių smegenimis. Nayebi vadovaujamame tyrime mokslininkai apmokė savarankiškai prižiūrimus modelius, kad galėtų numatyti būsimą savo aplinkos būklę šimtuose tūkstančių natūralistinių vaizdo įrašų, kuriuose vaizduojami kasdieniai scenarijai.
„Pastarąjį dešimtmetį dominuojantis būdas kurti neuroninių tinklų modelius kognityvinėje neurologijos srityje yra mokyti šiuos tinklus atlikti individualias pažinimo užduotis. Tačiau tokiu būdu apmokyti modeliai retai apibendrina kitas užduotis“, – sako Yang. „Čia mes išbandome, ar galime sukurti modelius tam tikram pažinimo aspektui, pirmiausia mokydami natūralistinius duomenis, naudodami savarankiškai prižiūrimą mokymąsi, tada įvertindami laboratorijos nustatymuose.”
Kai modelis buvo apmokytas, tyrėjai jį apibendrino iki užduoties, kurią jie vadina „Mental-Pong“. Tai panašu į vaizdo žaidimą „Pong“, kai žaidėjas judina irklą, kad pataikytų į kamuolį, keliaujantį per ekraną. Mental-Pong versijoje kamuolys dingsta prieš pat pataikant į irklą, todėl žaidėjas turi įvertinti jo trajektoriją, kad pataikytų į kamuolį.
Tyrėjai išsiaiškino, kad modelis galėjo sekti paslėpto kamuoliuko trajektoriją tikslumu, panašiu į žinduolių smegenų neuronų trajektoriją, kuri buvo įrodyta ankstesniame Rajalingham ir Jazayeri tyrime imituojant jo trajektoriją – pažintinį reiškinį, žinomą kaip „protinis reiškinys“. simuliacija“. Be to, modelyje matomi nervinio aktyvavimo modeliai buvo panašūs į tuos, kurie matomi gyvūnų smegenyse žaidžiant žaidimą – konkrečiai smegenų dalyje, vadinamoje dorsomedialine priekine žieve. Mokslininkai teigia, kad jokia kita skaičiavimo modelio klasė nesugebėjo taip tiksliai suderinti biologinių duomenų kaip ši.
„Mašinų mokymosi bendruomenė deda daug pastangų, kad būtų sukurtas dirbtinis intelektas“, – sako Jazayeri. „Šių modelių svarba neurobiologijai priklauso nuo jų gebėjimo papildomai užfiksuoti vidinį smegenų darbą. Tai, kad Arano modelis numato neuroninius duomenis, yra tikrai svarbus, nes tai rodo, kad galime priartėti prie dirbtinių sistemų, imituojančių natūralų intelektą, kūrimo.
Naršymas pasaulyje
Khona, Schaeffer ir Fiete vadovaujamas tyrimas buvo sutelktas į specializuotų neuronų, žinomų kaip tinklelio ląstelės, tipą. Šios ląstelės, esančios entorinalinėje žievėje, padeda gyvūnams naršyti, veikdamos kartu su vietinėmis ląstelėmis, esančiomis hipokampe.
Nors vietos ląstelės užsidega, kai gyvūnas yra konkrečioje vietoje, tinklelio ląstelės užsidega tik tada, kai gyvūnas yra vienoje iš trikampės gardelės viršūnių. Tinklelio langelių grupės sukuria persidengiančias įvairaus dydžio gardeles, kurios leidžia užkoduoti daug pozicijų naudojant palyginti nedidelį langelių skaičių.
Naujausiuose tyrimuose mokslininkai apmokė prižiūrimus neuroninius tinklus, kad jie imituotų tinklelio ląstelių funkciją, numatydami kitą gyvūno vietą pagal jo pradžios tašką ir greitį, o tai vadinama kelio integracija. Tačiau šie modeliai priklausė nuo prieigos prie privilegijuotos informacijos apie absoliučią erdvę bet kuriuo metu – informacijos, kurios gyvūnas neturi.
Įkvėpta įspūdingų daugiaperiodinio tinklelio elementų kodo, skirto kosmosui, kodavimo ypatybių, MIT komanda parengė kontrastinį savarankiškai prižiūrimą modelį, kad būtų galima atlikti tą pačią kelio integravimo užduotį ir efektyviai reprezentuoti erdvę. Treniruočių duomenims jie naudojo greičio įvesties sekas. Modelis išmoko atskirti pozicijas pagal tai, ar jos panašios, ar skirtingos – šalia esančios pozicijos generuodavo panašius kodus, tačiau tolimesnės pozicijos generuodavo daugiau skirtingų kodų.
„Tai panašu į modelių mokymą ant vaizdų, kai du vaizdai yra kačių galvos, jų kodai turėtų būti panašūs, bet jei vienas yra katės galva, o kitas yra sunkvežimis, tada jūs norite, kad jų kodai atstumtų“, – Khona. sako. „Mes laikomės tos pačios idėjos, bet pritaikome ją erdvinėms trajektorijoms.”
Kai modelis buvo apmokytas, mokslininkai nustatė, kad modelio mazgų aktyvavimo modeliai sudarė keletą skirtingų laikotarpių gardelės modelių, labai panašių į tuos, kuriuos formuoja tinklo ląstelės smegenyse.
„Šis darbas mane jaudina tai, kad jis sieja matematinį darbą, susijusį su įspūdingomis informacinėmis-teorinėmis tinklelio ląstelės kodo savybėmis, ir kelio integravimo skaičiavimo“, – sako Fiete. „Nors matematinis darbas buvo analitinis, kokias savybes turi tinklelio ląstelės kodas? – Kodavimo efektyvumo optimizavimo metodas savarankiškai prižiūrimas mokymasis ir tinklelio derinimas yra sintetinis: jis parodo, kokių savybių gali prireikti ir pakanka paaiškinti, kodėl smegenyse yra tinklelio ląstelės.
Tyrimą finansavo K. Lisa Yang Icon centras, Nacionaliniai sveikatos institutai, Simonso fondas, McKnight fondas, McGovern institutas ir Helen Hay Whitney fondas.