Farmacijos bendrovės naudoja dirbtinį intelektą, kad supaprastintų naujų vaistų atradimo procesą. Mašininio mokymosi modeliai gali pasiūlyti naujas molekules, pasižyminčias specifinėmis savybėmis, kurios galėtų kovoti su tam tikromis ligomis, ir per kelias minutes atlikti tai, ką žmonėms rankiniu būdu gali prireikti mėnesių
Tačiau yra didelė kliūtis, kuri stabdo šias sistemas: Modeliai dažnai siūlo naujas molekulines struktūras, kurias sunku arba neįmanoma pagaminti laboratorijoje. Jei chemikas negali iš tikrųjų pagaminti molekulės, negalima išbandyti jos savybių, padedančių kovoti su ligomis.
Naujas MIT mokslininkų metodas apriboja mašininio mokymosi modelį taip, kad jis siūlytų tik tas molekulines struktūras, kurias galima susintetinti. Šis metodas garantuoja, kad molekulės yra sudarytos iš medžiagų, kurias galima įsigyti, ir kad tarp tų medžiagų vykstančios cheminės reakcijos atitinka chemijos dėsnius
Palyginus su kitais metodais, jų modelis pasiūlė molekulines struktūras, kurios, naudojant populiarius vertinimus, surinko tiek pat, o kartais ir daugiau balų, tačiau buvo garantuota, kad jas galima susintetinti. Be to, jų sistemai pasiūlyti sintetinimo kelią užtrunka mažiau nei vieną sekundę, tuo tarpu kiti metodai, pagal kuriuos atskirai siūlomos molekulės, o paskui vertinamas jų sintetinamumas, gali užtrukti kelias minutes. Paieškos erdvėje, kurioje gali būti milijardai potencialių molekulių, šis sutaupytas laikas yra labai didelis.
„Šis procesas keičia tai, kaip mes prašome šių modelių generuoti naujas molekulines struktūras. Daugelis šių modelių mano, kad reikia kurti naujas molekulines struktūras atomas po atomo arba ryšys po ryšio. Vietoj to mes kuriame naujas molekules blokas po bloko ir reakcija po reakcijos”, – sako MIT Chemijos inžinerijos ir Elektros inžinerijos ir informatikos fakultetų docentas, Henrio Slezyngerio karjeros vystymo asistentas, vyresnysis straipsnio autorius Konoras Kolis (Connor Coley).
Kartu su Koliu prie straipsnio prisidėjo pirmasis straipsnio autorius, magistrantas Venhao Gao (Wenhao Gao) ir doktorantė Rokijo Merkado (Rocío Mercado). Tyrimas šią savaitę pristatomas Tarptautinėje mokymosi reprezentacijų konferencijoje.
Statybiniai blokai
Norint sukurti molekulinę struktūrą, modelyje imituojamas molekulės sintezės procesas, siekiant užtikrinti, kad ją būtų galima pagaminti.
Modeliui pateikiamas gyvybingų statybinių blokų, t. y. cheminių medžiagų, kurias galima įsigyti, rinkinys ir galiojančių cheminių reakcijų, su kuriomis reikia dirbti, sąrašas. Šiuos cheminių reakcijų šablonus rankomis sukūrė ekspertai. Kontroliuodami šiuos įvesties duomenis, leisdami naudoti tik tam tikras chemines medžiagas arba konkrečias reakcijas, mokslininkai gali apriboti, kokia didelė gali būti naujos molekulės paieškos erdvė.
Modelis, naudodamas šiuos įvesties duomenis, kuria medį, atrinkdamas statybinius blokus ir juos po vieną susiedamas cheminėmis reakcijomis, kad sukurtų galutinę molekulę. Kiekviename etape molekulė tampa sudėtingesnė, nes pridedama papildomų cheminių medžiagų ir reakcijų.
Modelis pateikia galutinę molekulės struktūrą ir cheminių medžiagų bei reakcijų medį, kuris ją sintetintų.
„Užuot tiesiogiai projektavę pačią produkto molekulę, mes projektuojame veiksmų seką tai molekulei gauti. Tai leidžia mums garantuoti struktūros kokybę”, – sako Gao.
Norėdami apmokyti savo modelį, tyrėjai įveda visą molekulinę struktūrą ir statybinių blokų bei cheminių reakcijų rinkinį, o modelis išmoksta sukurti molekulę sintetinantį medį. Matydamas šimtus tūkstančių pavyzdžių, modelis išmoksta pats sugalvoti šiuos sintetinimo kelius.
Molekulių optimizavimas
Apmokytas modelis gali būti naudojamas optimizavimui. Mokslininkai apibrėžia tam tikras savybes, kurių jie nori pasiekti galutinėje molekulėje, turėdami tam tikrus statybinius blokus ir cheminių reakcijų šablonus, o modelis pasiūlo sintezuojamą molekulės struktūrą.
„Nustebino tai, kokią didelę dalį molekulių iš tikrųjų galima atkurti naudojant tokį mažą šablonų rinkinį. Nereikia tiek daug statybinių blokų, kad susidarytų didelė cheminė erdvė, kurioje modelis galėtų atlikti paiešką”, – sako Mercado.
Jie išbandė modelį įvertindami, kaip gerai jis gali atkurti sintetinamas molekules. Jis sugebėjo atkurti 51 proc. šių molekulių, o kiekvienai iš jų atkurti prireikė mažiau nei sekundės
Jų metodas yra greitesnis nei kai kurie kiti metodai, nes modelis neieško visų galimybių kiekviename medžio žingsnyje. Jis turi apibrėžtą cheminių medžiagų ir reakcijų rinkinį, su kuriuo turi dirbti, aiškina Gao.
Kai jie naudojo savo modelį, kad pasiūlytų konkrečių savybių turinčias molekules, jų metodas pasiūlė kokybiškesnes molekulių struktūras, kurios turėjo stipresnį jungimosi giminingumą nei taikant kitus metodus. Tai reiškia, kad molekulės galėtų geriau prisijungti prie baltymo ir blokuoti tam tikrą veiklą, pavyzdžiui, sustabdyti viruso dauginimąsi.
Pavyzdžiui, siūlant molekulę, kuri galėtų prisijungti prie SARS-Cov-2, jų modelis pasiūlė keletą molekulinių struktūrų, kurios gali geriau jungtis su viruso baltymais nei esami inhibitoriai. Tačiau, kaip pripažįsta autoriai, tai tik skaičiavimo prognozės.
„Yra tiek daug ligų, su kuriomis reikia kovoti, – sako Gao. „Tikiuosi, kad mūsų metodas gali pagreitinti šį procesą, kad mums nereikėtų kiekvieną kartą tikrinti milijardų molekulių, ieškant ligos taikinio. Vietoj to galime tiesiog nurodyti norimas savybes, ir tai gali pagreitinti kandidato į vaistą paieškos procesą.”
Jų modelis taip pat galėtų patobulinti esamas vaistų paieškos linijas. Jei įmonė nustatė konkrečią molekulę, kuri turi pageidaujamų savybių, bet negali būti pagaminta, ji galėtų pasinaudoti šiuo modeliu ir pasiūlyti sintetinamas molekules, kurios būtų labai panašios į ją, sako Mercado.
Dabar, kai patvirtino savo metodą, komanda planuoja toliau tobulinti cheminių reakcijų šablonus, kad dar labiau pagerintų modelio veikimą. Turėdami papildomų šablonų, jie galės atlikti daugiau bandymų su tam tikrais ligų taikiniais ir galiausiai pritaikyti modelį vaistų atradimo procese.”
„Idealiu atveju norėtume, kad algoritmai automatiškai projektuotų molekules ir kartu greitai pateiktų sintezės medį”, – sako Marvinas Segleris (Marwin Segler), kuris vadovauja komandai, dirbančiai su mašininiu mokymusi vaistų atradimo srityje „Microsoft Research Cambridge” (Jungtinė Karalystė) ir šiame darbe nedalyvavo. „Šis elegantiškas profesoriaus Coley ir komandos metodas yra didelis žingsnis į priekį sprendžiant šią problemą. Nors yra ankstesnių koncepcijos įrodymo darbų, skirtų molekulių projektavimui generuojant sintezės medį, ši komanda iš tiesų padarė tai veiksminga. Pirmą kartą jie pademonstravo puikų našumą reikšmingu mastu, todėl tai gali turėti praktinį poveikį kompiuterizuotam molekulių atradimui.”
Darbas taip pat labai įdomus, nes galiausiai jis gali padėti sukurti naują kompiuterizuotos sintezės planavimo paradigmą. Tikėtina, kad tai bus didžiulis įkvėpimas būsimiems šios srities tyrimams.”
Šį tyrimą iš dalies rėmė JAV Karinio jūrų laivyno tyrimų biuras ir Konsorciumas „Machine Learning for Pharmaceutical Discovery and Synthesis Consortium”.