Farmacijos įmonės naudoja dirbtinį intelektą, kad supaprastintų naujų vaistų atradimo procesą. Mašininio mokymosi modeliai gali pasiūlyti naujų molekulių, turinčių specifinių savybių, galinčių kovoti su tam tikromis ligomis, per kelias minutes padarydamos tai, ko žmonėms gali prireikti kelių mėnesių, kad jos pasiektų rankiniu būdu.
Tačiau yra didelė kliūtis, trukdanti šioms sistemoms. atgal: modeliai dažnai siūlo naujas molekulines struktūras, kurias sunku arba neįmanoma pagaminti laboratorijoje. Jei chemikas iš tikrųjų negali pagaminti molekulės, jos kovos su ligomis savybės negali būti išbandytos.
Naujas MIT tyrėjų požiūris riboja mašininio mokymosi modelį, todėl jis siūlo tik molekulinį struktūrų, kurias galima susintetinti. Metodas garantuoja, kad molekulės yra sudarytos iš medžiagų, kurias galima įsigyti, ir kad tarp tų medžiagų vykstančios cheminės reakcijos atitinka chemijos dėsnius.
Palyginus su kitais metodais, jų modelis siūlo molekulines struktūras, kurios, naudojant populiarius vertinimus, surinko aukštus ir kartais geresnius balus, tačiau buvo garantuotai sintezuojamos. Jų sistema taip pat užtrunka mažiau nei vieną sekundę, kad pasiūlytų sintetinį kelią, o kiti metodai, kurie atskirai siūlo molekules ir įvertina jų sintezuojamumą, gali užtrukti kelias minutes. Paieškos erdvėje, kurioje gali būti milijardai potencialių molekulių, sutaupomas laikas didėja.
„Šis procesas iš naujo suformuluoja, kaip mes prašome šių modelių sukurti naujas molekulines struktūras. Daugelis šių modelių galvoja apie naujų molekulinių struktūrų kūrimą atomas po atomo arba ryšį po jungties. Vietoj to, mes kuriame naujas molekules pagal bloką, o reakciją – pagal reakciją“, – sako Connor Coley, MIT Chemijos inžinerijos ir Elektros inžinerijos bei Kompiuterių mokslų katedrų profesorius, vyresnysis šio straipsnio autorius.
Straipsnyje prie Coley prisijungia pirmasis autorius Wenhao Gao, magistrantūros studentas, ir Rocío Mercado, postdoc. Tyrimas šią savaitę pristatomas tarptautinėje mokymosi reprezentacijų konferencijoje.
Statybiniai blokai
Siekiant sukurti molekulinę struktūrą, modelis imituoja molekulės sintezės procesą, kad būtų užtikrinta, jog ji gali būti pagaminta.
Modeliui pateikiamas gyvybingų statybinių blokų rinkinys, kuris yra cheminių medžiagų, kurias galima įsigyti, ir galiojančių cheminių reakcijų, su kuriomis reikia dirbti, sąrašą. Šiuos cheminių reakcijų šablonus rankomis gamina ekspertai. Kontroliuojant šias įvestis leidžiant tik tam tikras chemines medžiagas ar specifines reakcijas, mokslininkai gali apriboti naujos molekulės paieškos erdvę.
Modelis naudoja šias įvestis medžiui kurti, pasirinkdamas statybinius blokus ir susiejant juos cheminėmis reakcijomis po vieną, kad būtų sukurta galutinė molekulė. Kiekviename etape molekulė tampa sudėtingesnė, nes pridedama papildomų cheminių medžiagų ir vyksta reakcijų.
Ji išveda galutinę molekulinę struktūrą ir cheminių medžiagų bei reakcijų, kurios ją sintetintų, medį.
„Užuot tiesiogiai kurdami pačią produkto molekulę, mes kuriame veiksmų seką, kad gautume tą molekulę. Tai leidžia mums garantuoti struktūros kokybę“, – sako Gao.
Norėdami parengti savo modelį, mokslininkai įveda visą molekulinę struktūrą ir statybinių blokų rinkinį bei chemines reakcijas. modelis mokosi sukurti medį, kuris sintetina molekulę. Pamatęs šimtus tūkstančių pavyzdžių, modelis išmoksta pats sugalvoti šiuos sintetinius kelius.
Molekulių optimizavimas
Išmokytas modelis gali būti naudojamas optimizavimui. Tyrėjai apibrėžia tam tikras savybes, kurias jie nori pasiekti galutinėje molekulėje, atsižvelgdami į tam tikrus statybinius blokus ir cheminių reakcijų šablonus, o modelis siūlo sintezuojamą molekulinę struktūrą.
„Nuostabu buvo tai, kokia didelė molekulių dalį, kurią iš tikrųjų galite atkurti naudodami tokį mažą šablonų rinkinį. Jums nereikia tiek daug statybinių blokų, kad sukurtumėte daug laisvos cheminės erdvės modeliui ieškoti“, – sako Mercado.
Jie išbandė modelį įvertindami, kaip gerai jis gali rekonstruoti. sintetinamos molekulės. Jis sugebėjo atkurti 51 procentus šių molekulių ir kiekvienai iš jų atkurti prireikė mažiau nei sekundės.
Jų technika yra greitesnė nei kai kurių kitų metodų. nes modelis neieško visų parinkčių kiekvienam medžio žingsniui. Gao paaiškina, kad jis turi apibrėžtą cheminių medžiagų ir reakcijų rinkinį.
Kai jie naudojo savo modelį, kad pasiūlytų molekules, turinčias specifinių savybių, jų metodas pasiūlė aukštesnės kokybės molekulines struktūras, kurios turi stipresnį ryšį. giminingumą nei kiti metodai. Tai reiškia, kad molekulės galėtų geriau prisijungti prie baltymo ir blokuoti tam tikrą veiklą, pvz., sustabdyti viruso dauginimąsi.
Pavyzdžiui, siūlant molekulę, kuri galėtų prisijungti prie SARS, Cov-2, jų modelis pasiūlė keletą molekulinių struktūrų, kurios gali geriau jungtis su viruso baltymais nei esami inhibitoriai. Tačiau, kaip pripažįsta autoriai, tai tik skaičiavimo prognozės.
„Yra tiek daug ligų, su kuriomis reikia kovoti“, – sako Gao. „Tikiuosi, kad mūsų metodas gali paspartinti šį procesą, kad nereikėtų kiekvieną kartą tikrinti milijardų molekulių, kad būtų galima nustatyti ligos taikinį. Vietoj to galime tiesiog nurodyti norimas savybes ir tai gali paspartinti kandidato į vaistą paieškos procesą.“
Jų modelis taip pat galėtų pagerinti esamus vaistų atradimo vamzdynus. Jei įmonė nustatė tam tikrą molekulę, kuri turi norimų savybių, bet negali būti pagaminta, ji gali naudoti šį modelį, kad pasiūlytų sintetinamas molekules, kurios labai panašios į ją, sako Mercado.
Dabar Jie patvirtino savo požiūrį, komanda planuoja toliau tobulinti cheminių reakcijų šablonus, kad dar labiau pagerintų modelio veikimą. Naudodami papildomus šablonus jie gali atlikti daugiau bandymų su tam tikromis ligomis ir galiausiai pritaikyti modelį vaistų atradimo procesui.
„Idealiu atveju norime algoritmų, kurie automatiškai projektuotų molekules ir suteiktų mums sintezės medį tuo pačiu metu, greitai“, – sako Marwinas Segleris, vadovaujantis „Microsoft Research Cambridge“ (JK) mašininio mokymosi narkotikų atradimo komandai ir nedalyvavęs šiame darbe. „Šis elegantiškas prof. Coley ir komandos požiūris yra didelis žingsnis į priekį sprendžiant šią problemą. Nors yra ankstesnių koncepcijos įrodymų, susijusių su molekulių projektavimu generuojant sintezės medį, ši komanda iš tikrųjų padarė tai. Pirmą kartą jie pademonstravo puikų našumą prasmingu mastu, todėl tai gali turėti praktinio poveikio kompiuteriniams molekuliniams atradimams.
Darbas taip pat labai įdomus, nes galiausiai gali padėti nauja kompiuterinio sintezės planavimo paradigma. Tikėtina, kad tai bus didžiulis įkvėpimas būsimiems šios srities tyrimams.“
Šį tyrimą iš dalies parėmė JAV karinio jūrų laivyno tyrimų biuras ir Farmacijos atradimų ir sintezės mašinų mokymasis. konsorciumas.

