Didžiulėse vaistų junginių bibliotekose gali būti įvairių ligų, tokių kaip vėžys ar širdies ligos, gydymo būdai. Idealiu atveju mokslininkai norėtų eksperimentiškai išbandyti kiekvieną iš šių junginių prieš visus galimus taikinius, tačiau tokio tipo ekrano atlikimas užima be galo daug laiko.
Pastaraisiais metais mokslininkai pradėjo naudoti skaičiavimo metodus, kad patikrintų tas bibliotekas, tikėdamiesi paspartinti vaistų atradimą. Tačiau daugelis iš šių metodų taip pat užtrunka ilgai, nes dauguma jų apskaičiuoja kiekvieno tikslinio baltymo trimatę struktūrą pagal aminorūgščių seką, tada naudoja šias struktūras, kad nuspėtų, su kuriomis vaistų molekulėmis jis sąveikaus.
MIT ir Tufts universiteto mokslininkai dabar sukūrė alternatyvų skaičiavimo metodą, pagrįstą dirbtinio intelekto algoritmo tipu, žinomu kaip didelės kalbos modelis. Šie modeliai – vienas iš gerai žinomų pavyzdžių yra „ChatGPT“ – gali analizuoti didžiulį teksto kiekį ir išsiaiškinti, kurie žodžiai (arba, šiuo atveju, aminorūgštys) greičiausiai pasirodys kartu. Naujasis modelis, žinomas kaip ConPLEX, gali suderinti tikslinius baltymus su potencialiomis vaistų molekulėmis, neatliekant intensyvaus skaičiavimo žingsnio apskaičiuojant molekulių struktūras.
Naudodami šį metodą, mokslininkai gali patikrinti daugiau nei 100 milijonų junginių per vieną dieną – daug daugiau nei bet kuris esamas modelis.
„Šiame darbe atsižvelgiama į poreikį atlikti veiksmingą ir tikslią potencialių vaistų kandidatų in silico atranką, o modelio mastelio keitimas leidžia atlikti didelio masto ekranus, kad būtų galima įvertinti netikslinį poveikį, pakeisti vaistų paskirtį ir nustatyti mutacijų poveikį vaistų surišimui. sako Bonnie Berger, Simonso matematikos profesorė, MIT kompiuterių mokslo ir dirbtinio intelekto laboratorijos (CSAIL) skaičiavimo ir biologijos grupės vadovė ir viena iš vyresniųjų naujojo tyrimo autorių.
Lenore Cowen, Tufts universiteto kompiuterių mokslų profesorė, taip pat yra vyresnioji straipsnio, kuris šią savaitę pasirodys žurnale, autorė. Nacionalinės mokslų akademijos darbai. Rohitas Singhas, CSAIL tyrinėtojas ir Samuelis Sledzieski, MIT absolventas, yra pagrindiniai šio straipsnio autoriai ir Bryanas Brysonas, MIT biologinės inžinerijos docentas ir MGH Ragon instituto narys, MIT ir Harvardas taip pat yra autorius. Be dokumento, mokslininkai savo modelį paskelbė internete, kad galėtų naudoti kiti mokslininkai.
Prognozių darymas
Pastaraisiais metais skaičiavimo mokslininkai padarė didelę pažangą kurdami modelius, kurie gali numatyti baltymų struktūras pagal jų aminorūgščių sekas. Tačiau naudojant šiuos modelius numatyti, kaip, pavyzdžiui, didelė galimų vaistų biblioteka gali sąveikauti su vėžiniu baltymu, pasirodė sudėtinga, daugiausia todėl, kad trijų matmenų baltymų struktūrų apskaičiavimas reikalauja daug laiko ir skaičiavimo galios.
Papildoma kliūtis yra ta, kad tokie modeliai neturi gerų rezultatų pašalinant junginius, vadinamus masalais, kurie yra labai panašūs į sėkmingą vaistą, bet iš tikrųjų blogai sąveikauja su taikiniu.
„Vienas iš ilgalaikių iššūkių šioje srityje buvo tai, kad šie metodai yra trapūs ta prasme, kad jei modeliui duočiau vaistą ar nedidelę molekulę, kuri atrodė beveik kaip tikra, bet kažkaip šiek tiek skyrėsi, modelis vis tiek gali nuspėti, kad jie sąveikaus, nors to neturėtų“, – sako Singhas.
Tyrėjai sukūrė modelius, kurie gali įveikti tokį pažeidžiamumą, tačiau jie paprastai yra pritaikyti tik vienai vaistų molekulių klasei ir nėra gerai pritaikyti didelio masto ekranams, nes skaičiavimai trunka per ilgai.
MIT komanda nusprendė pasirinkti alternatyvų metodą, pagrįstą baltymų modeliu, kurį jie pirmą kartą sukūrė 2019 m. Dirbdamas su daugiau nei 20 000 baltymų duomenų baze, kalbos modelis koduoja šią informaciją į prasmingas skaitines kiekvienos aminorūgščių sekos reprezentacijas, kurios fiksuoja asociacijas. tarp sekos ir struktūros.
„Naudojant šiuos kalbos modelius, net baltymai, kurių sekos labai skirtingos, bet gali turėti panašias struktūras ar panašias funkcijas, šioje kalbos erdvėje gali būti pavaizduoti panašiai, ir mes galime tuo pasinaudoti, kad galėtume prognozuoti“, – sako Sledzieski. sako.
Savo naujame tyrime mokslininkai pritaikė baltymų modelį, siekdami išsiaiškinti, kurios baltymų sekos sąveikaus su konkrečiomis vaistų molekulėmis, kurios abi turi skaitines reprezentacijas, kurios neuroninio tinklo paverčiamos bendra, bendra erdve. Jie apmokė tinklą apie žinomą baltymų ir vaistų sąveiką, kuri leido jam išmokti susieti specifines baltymų savybes su gebėjimu surišti vaistus, neskaičiuojant jokios molekulės 3D struktūros.
„Su šiuo aukštos kokybės skaitmeniniu vaizdu, modelis gali visiškai sutrumpinti atominį vaizdavimą ir pagal šiuos skaičius numatyti, ar šis vaistas susijungs“, – sako Singhas. „To pranašumas yra tas, kad jums nereikia pereiti per atominį vaizdą, tačiau skaičiai vis tiek turi visą jums reikalingą informaciją.
Kitas šio metodo privalumas yra tas, kad atsižvelgiama į baltymų struktūrų lankstumą, kuris gali būti „svyruojantis“ ir įgauti šiek tiek kitokias formas sąveikaujant su vaisto molekule.
Didelis giminingumas
Kad jų modelis būtų mažiau apgautas dėl apgaulingų vaistų molekulių, mokslininkai taip pat įtraukė mokymo etapą, pagrįstą kontrastinio mokymosi koncepcija. Pagal šį metodą mokslininkai pateikia „tikrųjų“ narkotikų ir apsimetėlių pavyzdžius ir moko juos atskirti.
Tada tyrėjai išbandė savo modelį, patikrindami apie 4700 kandidatų į vaistų molekules biblioteką dėl jų gebėjimo prisijungti prie 51 fermento, žinomo kaip baltymų kinazės, rinkinio.
Iš geriausių rezultatų tyrėjai pasirinko 19 vaistų ir baltymų porų eksperimentiniam tyrimui. Eksperimentai atskleidė, kad iš 19 pataikymų 12 turėjo stiprų surišimo afinitetą (nanomoliariniame diapazone), o beveik visos kitos galimos vaisto ir baltymų poros neturėjo afiniteto. Keturios iš šių porų yra susietos itin dideliu, subnanomoliniu afinitetu (tokiu stipriu, kad nedidelė vaisto koncentracija, maždaug milijardo dalių tvarka, slopins baltymą).
Nors šiame tyrime mokslininkai daugiausia dėmesio skyrė mažų molekulių vaistų atrankai, dabar jie dirba siekdami pritaikyti šį metodą kitų tipų vaistams, pvz., terapiniams antikūnams. Toks modeliavimas taip pat gali būti naudingas atliekant galimų vaistų junginių toksiškumo tyrimus, siekiant įsitikinti, kad jie neturi nepageidaujamo šalutinio poveikio prieš bandydami juos su gyvūnų modeliais.
„Iš dalies priežasčių, kodėl vaistų atradimas yra toks brangus, yra tai, kad jie turi didelį gedimų skaičių. Jei galime sumažinti tuos nesėkmių rodiklius iš anksto pasakydami, kad šis vaistas greičiausiai nepasiteisins, tai gali labai padėti sumažinti vaistų atradimo išlaidas“, – sako Singhas.
Šis naujas požiūris „reiškia reikšmingą proveržį vaistų ir tikslinės sąveikos prognozėje ir atveria papildomų galimybių būsimiems tyrimams, siekiant dar labiau sustiprinti jų galimybes“, – sako Nacionalinio vėžio instituto Vėžio duomenų mokslo laboratorijos vadovas Eytanas Ruppinas, kuris nedalyvavo. studijoje. „Pavyzdžiui, įtraukus struktūrinę informaciją į latentinę erdvę arba tiriant molekulinės generacijos metodus, skirtus jaukų generavimui, būtų galima dar labiau pagerinti prognozes.
Tyrimą finansavo Nacionaliniai sveikatos institutai, Nacionalinis mokslo fondas ir Phillip and Susan Ragon fondas.