Padedami dirbtinės kalbos tinklo, MIT neuromokslininkai išsiaiškino, kokie sakiniai greičiausiai suaktyvins pagrindinius smegenų kalbos apdorojimo centrus.
Naujasis tyrimas atskleidžia, kad sudėtingesni sakiniai dėl neįprastos gramatikos ar netikėtos reikšmės sukelia stipresnius atsakymus šiuose kalbos apdorojimo centruose. Labai paprasti sakiniai beveik neįtraukia į šias sritis, o beprasmės žodžių sekos jiems taip pat neduoda daug naudos.
Pavyzdžiui, mokslininkai nustatė, kad šis smegenų tinklas buvo aktyviausias, kai skaito neįprastus sakinius, tokius kaip „Pirkti pardavimo signalai išlieka ypatingi“, paimti iš viešai prieinamo kalbos duomenų rinkinio, pavadinto C4. Tačiau perskaičius ką nors labai paprasto, pavyzdžiui, „Mes sėdėjome ant sofos“, jis nutilo.
„Įvestis turi būti pakankamai panaši į kalbą, kad įtrauktų sistemą“, – sako Evelina Fedorenko, MIT neurologijos docentė ir MIT McGovern smegenų tyrimų instituto narė. „Ir tada toje erdvėje, jei viską labai lengva apdoroti, tada jūs neturite didelio atsako. Bet jei viskas tampa sudėtinga ar stebina, jei yra neįprasta konstrukcija ar neįprastas žodžių rinkinys, su kuriuo galbūt nelabai gerai žinote, tinklas turi dirbti daugiau.
Fedorenko yra vyresnysis tyrimo, kuris šiandien pasirodo, autorius Gamta Žmogaus elgesys. MIT absolventė Greta Tuckute yra pagrindinė šio straipsnio autorė.
Apdorojimo kalba
Šiame tyrime mokslininkai daugiausia dėmesio skyrė kalbos apdorojimo regionams, esantiems kairiajame smegenų pusrutulyje, apimančiame Brokos sritį, taip pat kitas kairiosios priekinės ir laikinosios smegenų skilčių dalis.
„Šis kalbų tinklas yra labai selektyvus kalbai, tačiau buvo sunkiau suprasti, kas vyksta šiuose kalbų regionuose“, – sako Tuckutė. „Norėjome išsiaiškinti, kokie sakiniai, kokios kalbinės įvesties rūšys skatina kairiojo pusrutulio kalbų tinklą.
Tyrėjai pradėjo sudarydami 1000 sakinių rinkinį, paimtą iš įvairiausių šaltinių – grožinės literatūros, pasakytų žodžių transkripcijos, žiniatinklio teksto ir mokslinių straipsnių bei daugelio kitų.
Penki žmonės skaitė kiekvieną sakinį, o tyrėjai išmatavo savo kalbos tinklo aktyvumą naudodami funkcinį magnetinio rezonanso tomografiją (fMRI). Tada mokslininkai įvedė tuos pačius 1000 sakinių į didelį kalbos modelį – modelį, panašų į „ChatGPT“, kuris mokosi generuoti ir suprasti kalbą, numatydamas kitą žodį dideliame teksto kiekyje – ir išmatavo modelio aktyvinimo modelius, reaguodami į kiekvieną. sakinys.
Turėdami visus šiuos duomenis, mokslininkai parengė kartografavimo modelį, žinomą kaip „kodavimo modelis“, kuris susieja žmogaus smegenyse matomus aktyvacijos modelius su tais, kurie stebimi dirbtinės kalbos modelyje. Kai modelis buvo išmokytas, jis galėtų numatyti, kaip žmogaus kalbos tinklas reaguos į bet kurį naują sakinį, remiantis tuo, kaip dirbtinės kalbos tinklas reagavo į šiuos 1000 sakinių.
Tada mokslininkai naudojo kodavimo modelį, kad nustatytų 500 naujų sakinių, kurie sukeltų maksimalų žmogaus smegenų aktyvumą („varomieji” sakiniai), taip pat sakinius, kurie sukeltų minimalų smegenų kalbos tinklo aktyvumą („slopinami” sakiniai). .
Trijų naujų žmonių grupėje mokslininkai nustatė, kad šie nauji sakiniai iš tiesų paskatino ir slopina smegenų veiklą, kaip buvo prognozuota.
„Šis uždaro ciklo smegenų veiklos moduliavimas kalbos apdorojimo metu yra naujas“, – sako Tuckute. „Mūsų tyrimas rodo, kad mūsų naudojamas modelis (kuris sujungia kalbos modelio aktyvacijas ir smegenų reakcijas) yra pakankamai tikslus, kad tai padarytų. Tai pirmasis šio požiūrio demonstravimas smegenų srityse, susijusiose su aukštesnio lygio pažinimu, pavyzdžiui, kalbos tinkle.
Kalbinis sudėtingumas
Norėdami išsiaiškinti, dėl ko tam tikri sakiniai paskatino aktyvumą labiau nei kiti, tyrėjai analizavo sakinius remdamiesi 11 skirtingų kalbinių savybių, įskaitant gramatiškumą, tikimybę, emocinį valentingumą (teigiamą ar neigiamą) ir kaip lengva vizualizuoti sakinio turinį.
Kiekvienai iš šių savybių tyrėjai paprašė dalyvių iš minios tiekimo platformų įvertinti sakinius. Jie taip pat naudojo skaičiavimo metodą, norėdami kiekybiškai įvertinti kiekvieno sakinio „staigmeną“ arba tai, kaip jis neįprastas, palyginti su kitais sakiniais.
Ši analizė atskleidė, kad sakiniai su didesniu netikėtumu sukelia didesnį smegenų atsaką. Tai atitinka ankstesnius tyrimus, rodančius, kad žmonėms sunkiau apdoroti sakinius ir jie labiau nustebina, teigia mokslininkai.
Kita kalbinė savybė, susijusi su kalbos tinklo atsakymais, buvo kalbinis sudėtingumas, kuris matuojamas pagal tai, kiek sakinys atitinka anglų kalbos gramatikos taisykles ir kiek jis patikimas, ty kiek prasmės turi turinys, neskaitant gramatikos.
Sakiniai bet kuriame spektro gale – arba labai paprasti, arba tokie sudėtingi, kad jie visai neturi prasmės – kalbos tinkle suaktyvino labai mažai. Daugiausia atsakymų gauta iš sakinių, kurie turi tam tikrą prasmę, tačiau jiems reikia padirbėti, pvz., „Jiffy Lube of – of therapies, yes“, kurie buvo gauti iš šiuolaikinės Amerikos anglų kalbos duomenų rinkinio.
„Mes nustatėme, kad sakiniai, sukeliantys didžiausią smegenų reakciją, turi keistą gramatinį dalyką ir (arba) keistą prasmę“, – sako Fedorenko. „Šiuose sakiniuose yra kažkas šiek tiek neįprasto.”
Tyrėjai dabar planuoja išsiaiškinti, ar jie gali išplėsti šias išvadas kalbantiems ne anglų kalba. Jie taip pat tikisi ištirti, kokio tipo dirgikliai gali suaktyvinti kalbos apdorojimo sritis dešiniajame smegenų pusrutulyje.
Tyrimą finansavo Amazon stipendija iš Mokslo centro, Tarptautinė doktorantūros stipendija iš Amerikos universitetų moterų asociacijos, MIT-IBM Watson AI Lab, Nacionaliniai sveikatos institutai, McGovern institutas, Simonso socialinių smegenų centras. ir MIT Smegenų ir pažinimo mokslų katedra.