Išleidus tokias platformas kaip DALL-E 2 ir Midjourney, difuzijos generuojantys modeliai įgijo visuotinį populiarumą dėl savo sugebėjimo sukurti absurdiškų, kvapą gniaužiančių ir dažnai memų vertų vaizdų iš teksto raginimų, pvz., „meškiukai, dirbantys su naujais“. DI tyrimai apie mėnulį devintajame dešimtmetyje. Tačiau mokslininkų komanda iš MIT Abdul Latif Jameel klinikos mašininio mokymosi sveikatos srityje (Jameel Clinic) mano, kad difuzijos generaciniai modeliai gali būti daugiau nei tik siurrealistinių vaizdų kūrimas – jie galėtų pagreitinti naujų vaistų kūrimą ir sumažinti neigiamos pusės tikimybę. efektai.
Pranešimas, pristatantis šį naują molekulinio prijungimo modelį, pavadintą DiffDock, bus pristatytas 11-ojoje tarptautinėje mokymosi reprezentacijų konferencijoje. Unikalus modelio požiūris į kompiuterinį vaistų kūrimą yra paradigmos pokytis nuo dabartinių naujausių įrankių, kuriuos naudoja dauguma farmacijos įmonių, ir tai suteikia didelę galimybę pertvarkyti tradicinį vaistų kūrimo vamzdyną.
Narkotikai paprastai veikia sąveikaudami su baltymais, kurie sudaro mūsų kūną, arba bakterijų ir virusų baltymais. Molekulinis prijungimas buvo sukurtas siekiant suprasti šias sąveikas, numatant atomines 3D koordinates, su kuriomis ligandas (ty vaisto molekulė) ir baltymas gali susijungti.
Nors molekulinis prijungimas leido sėkmingai identifikuoti vaistus, kurie dabar gydo ŽIV ir vėžį, kiekvienas vaistas vidutiniškai buvo sukurtas dešimtmetį, o 90 procentų vaistų kandidatų nepavyko atlikti brangių klinikinių tyrimų (dauguma tyrimų apskaičiavo, kad vidutinės vaistų kūrimo išlaidos yra apie 1 mlrd. daugiau nei 2 mlrd.
Šiuo metu dauguma molekulinių prijungimo įrankių, naudojamų in-silico vaistų projektavimui, taiko „mėginių ėmimo ir vertinimo“ metodą, ieškant ligando „pozos“, kuri geriausiai tinka baltymų kišenei. Šis daug laiko reikalaujantis procesas įvertina daugybę skirtingų pozų, tada jas įvertina pagal tai, kaip gerai ligandas jungiasi su baltymu.
Ankstesniuose giluminio mokymosi sprendimuose molekulinis prijungimas traktuojamas kaip regresijos problema. Kitaip tariant, „daroma prielaida, kad turite vieną tikslą, kurį bandote optimizuoti, ir yra vienas teisingas atsakymas“, – sako Gabriele Corso, bendraautorė ir antrojo kurso MIT elektros inžinerijos ir kompiuterių mokslo doktorantė. yra MIT kompiuterių mokslų ir dirbtinio intelekto laboratorijos (CSAIL) filialas. „Naudodami generatyvųjį modeliavimą darote prielaidą, kad yra galimų atsakymų pasiskirstymas – tai labai svarbu, kai yra neapibrėžtumo.
„Vietoj vieno numatymo, kaip anksčiau, dabar leidžiate nuspėti kelias pozas ir kiekviena su skirtinga tikimybe“, – priduria Hannes Stärk, bendraautoris ir pirmojo kurso MIT elektros inžinerijos ir kompiuterių mokslo doktorantas. MIT kompiuterių mokslų ir dirbtinio intelekto laboratorijos (CSAIL) filialas. Todėl modeliui nereikia eiti į kompromisus bandant padaryti vieną išvadą, kuri gali būti nesėkmės receptas.
Norint suprasti, kaip veikia difuzijos generaciniai modeliai, naudinga juos paaiškinti remiantis vaizdą generuojančiais difuzijos modeliais. Čia difuzijos modeliai palaipsniui prideda atsitiktinio triukšmo prie 2D vaizdo, atlikdami daugybę veiksmų, sunaikindami vaizdo duomenis, kol jie tampa tik grūdėtūs. Tada neuroninis tinklas apmokomas atkurti pradinį vaizdą, pakeičiant šį triukšmo procesą. Tada modelis gali generuoti naujus duomenis, pradėdamas nuo atsitiktinės konfigūracijos ir pakartotinai pašalindamas triukšmą.
„DiffDock“ atveju, apmokytas įvairių ligandų ir baltymų pozų, modelis gali sėkmingai identifikuoti kelias baltymų surišimo vietas, su kuriomis jis niekada anksčiau nebuvo susidūręs. Užuot generavęs naujus vaizdo duomenis, jis generuoja naujas 3D koordinates, kurios padeda ligandui rasti galimus kampus, kurie leistų jam tilpti į baltymų kišenę.
Šis „aklojo prijungimo“ metodas suteikia naujų galimybių pasinaudoti AlphaFold 2 (2020), garsaus DeepMind baltymų sulankstymo AI modelio pranašumais. Nuo pirminio AlphaFold 1 išleidimo 2018 m., mokslininkų bendruomenė labai jaudinasi dėl AlphaFold skaičiavimo būdu sulankstytų baltymų struktūrų, padedančių nustatyti naujus vaistų veikimo mechanizmus. Tačiau moderniausi molekulinio prijungimo įrankiai dar turi įrodyti, kad jų veikimas surišant ligandus prie skaičiavimo būdu numatytų struktūrų yra geresnis už atsitiktinę galimybę.
„DiffDock“ yra ne tik daug tikslesnis nei ankstesni tradicinių prijungimo etalonų metodai, nes dėl savo gebėjimo svarstyti aukštesniu mastu ir netiesiogiai modeliuoti tam tikrą baltymų lankstumą, „DiffDock“ išlaiko aukštą našumą, net kai kiti prijungimo modeliai pradeda žlugti. Realesnis scenarijus, apimantis skaičiavimo būdu sukurtų nesurištų baltymų struktūrų naudojimą, „DiffDock“ pateikia 22 procentus savo prognozių per 2 angstremus (plačiai laikomas tikslios pozos slenksčiu, 1Å atitinka vieną daugiau nei 10 milijardų metrų), daugiau nei dvigubai. kiti prijungimo modeliai kai kuriems vos svyruoja virš 10 procentų ir nukrenta net 1,7 procento.
Šie patobulinimai sukuria naują biologinių tyrimų ir vaistų atradimo galimybių kraštovaizdį. Pavyzdžiui, daugelis vaistų randami per procesą, žinomą kaip fenotipinė patikra, kai mokslininkai stebi tam tikro vaisto poveikį ligai, nežinodami, kokius baltymus vaistas veikia. Tada labai svarbu išsiaiškinti vaisto veikimo mechanizmą, kad suprastumėte, kaip galima pagerinti vaistą ir galimą jo šalutinį poveikį. Šis procesas, žinomas kaip „atvirkštinis patikrinimas“, gali būti labai sudėtingas ir brangus, tačiau baltymų lankstymo metodų ir „DiffDock“ derinys gali leisti atlikti didelę proceso dalį in silico, o tai leidžia nustatyti galimą „netikslinį“ šalutinį poveikį. anksti prieš pradedant klinikinius tyrimus.
„DiffDock leidžia daug lengviau nustatyti narkotikų taikinius. Anksčiau reikėjo atlikti daug pastangų reikalaujančius ir brangius eksperimentus (nuo mėnesių iki metų) su kiekvienu baltymu, norint apibrėžti vaisto prijungimą. Tačiau dabar galima patikrinti daugybę baltymų ir atlikti bandymą praktiškai per dieną“, – sako Timas Petersonas, Vašingtono universiteto Sent Luiso medicinos mokyklos docentas. Petersonas panaudojo DiffDock, kad apibūdintų naujo kandidato į vaistą, gydančio su senėjimu susijusias ligas, veikimo mechanizmą neseniai paskelbtame dokumente. „Yra labai „likimas mėgsta ironiją“ aspektas, kad Eromo dėsnis – kad vaistų atradimas užtrunka ilgiau ir kasmet kainuoja daugiau pinigų – išsprendžiamas pagal bendravardį Moore’o dėsnį – kad kompiuteriai kasmet tampa greitesni ir pigesni – naudojant tokias priemones kaip DiffDock. .
Šį darbą atliko MIT doktorantai Gabriele Corso, Hannes Stärk ir Bowen Jing bei jų patarėjai profesorė Regina Barzilay ir profesorius Tommi Jaakkola, o jį parėmė Mašininio mokymosi farmacijos atradimams ir sintezei konsorciumas, Jameel klinika, DTRA. Medicininių atsakomųjų priemonių prieš naujas ir kylančias grėsmes atradimas, DARPA pagreitinto molekulinio atradimo programa, Sanofi skaičiavimo antikūnų projektavimo stipendija ir Energijos skaičiavimo mokslų katedros absolventų stipendija.

