Kadangi mašininio mokymosi modeliai tampa didesni ir sudėtingesni, jiems reikia greitesnės ir energiją taupančios aparatinės įrangos, kad būtų galima atlikti skaičiavimus. Įprasti skaitmeniniai kompiuteriai sunkiai neatsilieka.
Analoginis optinis neuroninis tinklas galėtų atlikti tokias pačias užduotis kaip ir skaitmeninis, pavyzdžiui, vaizdų klasifikavimas ar kalbos atpažinimas, tačiau kadangi skaičiavimai atliekami naudojant šviesą, o ne elektrinius signalus, optiniai neuroniniai tinklai gali veikti daug kartų greičiau ir sunaudoti mažiau energijos.
Tačiau šie analoginiai įrenginiai yra linkę į aparatūros klaidas, dėl kurių skaičiavimai gali būti ne tokie tikslūs. Viena iš šių klaidų priežasčių yra mikroskopiniai techninės įrangos komponentų trūkumai. Optiniame neuroniniame tinkle, kuriame yra daug sujungtų komponentų, gali greitai kauptis klaidos.
Net naudojant klaidų taisymo metodus, dėl pagrindinių optinį neuroninį tinklą sudarančių įrenginių savybių tam tikros klaidos neišvengiamos. Tinklas, kuris yra pakankamai didelis, kad būtų įdiegtas realiame pasaulyje, būtų pernelyg netikslus, kad būtų veiksmingas.
MIT mokslininkai įveikė šią kliūtį ir rado būdą, kaip efektyviai išplėsti optinį neuroninį tinklą. Pridėjus nedidelį aparatūros komponentą prie optinių jungiklių, sudarančių tinklo architektūrą, jie gali sumažinti net nepataisomas klaidas, kurios kitu atveju kauptųsi įrenginyje.
Jų darbas galėtų sukurti itin greitą, energiją taupantį, analoginį neuroninį tinklą, kuris gali veikti tokiu pat tikslumu kaip ir skaitmeninis. Naudojant šią techniką, kai optinė grandinė tampa didesnė, jos skaičiavimų klaidų kiekis iš tikrųjų sumažėja.
„Tai nuostabu, nes tai prieštarauja analoginių sistemų intuicijai, kai didesnėse grandinėse turėtų būti didesnės klaidos, todėl klaidos nustato mastelio ribą. Šis dokumentas leidžia mums atsakyti į šių sistemų mastelio keitimo klausimą vienareikšmiškai „taip“, – sako pagrindinis autorius Ryanas Hamerly, kviestinis mokslininkas iš MIT Elektronikos tyrimų laboratorijos (RLE) ir Kvantinės fotonikos laboratorijos bei NTT tyrimų vyresnysis mokslininkas. .
Hamerly bendraautoriai yra absolventas Saumil Bandyopadhyay ir vyresnysis autorius Dirkas Englundas, MIT Elektros inžinerijos ir kompiuterių mokslo (EECS) katedros docentas, Kvantinės fotonikos laboratorijos vadovas ir RLE narys. Tyrimas paskelbtas šiandien Gamtos komunikacijos.
Dauginimasis su šviesa
Optinis neuroninis tinklas susideda iš daugelio sujungtų komponentų, kurie veikia kaip perprogramuojami, derinami veidrodžiai. Šie derinami veidrodžiai vadinami Mach-Zehnder inferometrais (MZI). Neuroninio tinklo duomenys užkoduojami į šviesą, kuri iš lazerio paleidžiama į optinį neuroninį tinklą.
Tipiškame MZI yra du veidrodžiai ir du spindulio skirstytuvai. Šviesa patenka į MZI viršų, kur ji padalijama į dvi dalis, kurios trukdo viena kitai, prieš ją sujungiant antruoju spindulio skirstytuvu, o tada iš apačios atsispindi kitam masyvo MZI. Tyrėjai gali panaudoti šių optinių signalų trukdžius, kad atliktų sudėtingas linijinės algebros operacijas, žinomas kaip matricos daugyba, o tai yra būdas, kaip neuroniniai tinklai apdoroja duomenis.
Tačiau klaidos, kurios gali atsirasti kiekviename MZI, greitai kaupiasi, kai šviesa juda iš vieno įrenginio į kitą. Kai kurių klaidų galima išvengti iš anksto identifikavus jas ir sureguliavus MZI, kad ankstesnes klaidas panaikintų vėlesni masyvo įrenginiai.
„Tai labai paprastas algoritmas, jei žinai, kokios yra klaidos. Tačiau šias klaidas labai sunku nustatyti, nes jūs turite prieigą tik prie savo lusto įvesties ir išvesties“, – sako Hamerly. „Tai paskatino mus panagrinėti, ar įmanoma sukurti klaidų taisymą be kalibravimo.
Hamerly ir jo bendradarbiai anksčiau demonstravo matematinę techniką, kuri žengė žingsnį toliau. Jie galėjo sėkmingai nustatyti klaidas ir atitinkamai tinkamai sureguliuoti MZI, tačiau net ir tai nepašalino visos klaidos.
Dėl esminio MZI pobūdžio yra atvejų, kai neįmanoma sureguliuoti įrenginio, kad visa šviesa iš apatinio prievado ištekėtų į kitą MZI. Jei prietaisas kiekviename žingsnyje praranda dalį šviesos, o masyvas yra labai didelis, pabaigoje liks tik mažytė galios.
„Net ir taisant klaidas yra esminė riba, kiek geras gali būti lustas. MZI fiziškai negali realizuoti tam tikrų nustatymų, kuriuos reikia sukonfigūruoti“, – sako jis.
Taigi komanda sukūrė naujo tipo MZI. Tyrėjai prie prietaiso galo pridėjo papildomą pluošto skirstytuvą, pavadinę jį 3-MZI, nes jame yra trys spindulio skirstytuvai, o ne du. Dėl to, kaip šis papildomas pluošto skirstytuvas sumaišo šviesą, MZI tampa daug lengviau pasiekti reikiamą nustatymą, kad visa šviesa būtų siunčiama iš išorės per apatinį prievadą.
Svarbu tai, kad papildomas pluošto skirstytuvas yra vos kelių mikrometrų dydžio ir yra pasyvus komponentas, todėl jam nereikia jokių papildomų laidų. Pridėjus papildomų spindulių skirstytuvų lusto dydis reikšmingai nepasikeičia.
Didesnis lustas, mažiau klaidų
Kai tyrėjai atliko modeliavimą, kad išbandytų savo architektūrą, jie nustatė, kad tai gali pašalinti daug nepataisomų klaidų, kurios trukdo tikslumui. Didėjant optiniam neuroniniam tinklui, klaidų skaičius įrenginyje iš tikrųjų sumažėja – priešingai nei nutinka įrenginyje su standartiniais MZI.
Naudodami 3-MZI, jie gali sukurti pakankamai didelį įrenginį komerciniam naudojimui su klaida, kuri sumažėjo 20 kartų, sako Hamerly.
Mokslininkai taip pat sukūrė MZI dizaino variantą, skirtą koreliuojamoms klaidoms. Tai atsiranda dėl gamybos trūkumų – jei lusto storis yra šiek tiek neteisingas, MZI gali būti maždaug tiek pat, todėl klaidos yra maždaug vienodos. Jie rado būdą pakeisti MZI konfigūraciją, kad ji būtų atspari tokio tipo klaidoms. Šis metodas taip pat padidino optinio neuroninio tinklo pralaidumą, todėl jis gali veikti tris kartus greičiau.
Dabar, kai jie demonstravo šiuos metodus naudodami modeliavimą, Hamerly ir jo bendradarbiai planuoja išbandyti šiuos metodus fizinėje aparatinėje įrangoje ir toliau važiuoti link optinio neuroninio tinklo, kurį jie gali veiksmingai įdiegti realiame pasaulyje.
Šį tyrimą iš dalies finansuoja Nacionalinio mokslo fondo absolventų mokslinių tyrimų stipendija ir JAV oro pajėgų mokslinių tyrimų biuras.

