Senas posakis, dažnai mums įvedamas formavimosi metais, skirtas išstumti mus už mūsų egocentriško, besikuriančio proto: „Dvi galvos yra geriau nei viena“. Ši patarlė skatina bendradarbiauti ir pabrėžia bendro intelekto galią.
Pasukite į priekį iki 2023 m. ir pastebėjome, kad ši išmintis galioja net dirbtinio intelekto srityje: kelių kalbų modeliai, veikiantys darniai, yra geriau nei vienas.
Neseniai MIT kompiuterių mokslo ir dirbtinio intelekto laboratorijos (CSAIL) komanda įkūnijo šią senovės išmintį šiuolaikinių technologijų ribose. Jie pristatė strategiją, kuri pasitelkia kelias AI sistemas diskutuoti ir ginčytis tarpusavyje, kad būtų galima rasti geriausią atsakymą į duotą klausimą. Šis metodas įgalina šiuos plataus masto kalbos modelius geriau laikytis faktinių duomenų ir patobulinti sprendimų priėmimą.
Didelių kalbų modelių (LLM) problemos esmė slypi jų generuojamų atsakymų nenuoseklume, dėl kurio atsiranda galimų netikslumų ir klaidingų samprotavimų. Šis naujas metodas leidžia kiekvienam agentui aktyviai įvertinti visų kitų agentų atsakymus ir naudoja šį kolektyvinį atsiliepimą, kad patobulintų savo atsakymą. Techniniu požiūriu procesas susideda iš kelių atsako generavimo ir kritikos etapų. Kiekvienas kalbos modelis generuoja atsakymą į pateiktą klausimą, o tada įtraukia visų kitų agentų atsiliepimus, kad atnaujintų savo atsakymą. Šis kartotinis ciklas baigiasi galutiniu modelių sprendimų balsų dauguma. Tai šiek tiek atspindi grupinės diskusijos dinamiką – kai asmenys prisideda prie vieningos ir gerai pagrįstos išvados.
Viena iš tikrojo požiūrio privalumų yra sklandus pritaikymas esamiems juodosios dėžės modeliams. Kadangi metodika sukasi aplink teksto generavimą, ji taip pat gali būti įdiegta įvairiose LLM, nereikalaujant prieigos prie jų vidinių funkcijų. Šis paprastumas, pasak komandos, gali padėti tyrėjams ir kūrėjams naudoti įrankį, kad pagerintų kalbos modelio išvesties nuoseklumą ir faktinį tikslumą.
„Naudodami naują metodą, atsakydami nepasikliaujame vienu AI modeliu. Vietoj to, mūsų procesas apima daugybę AI modelių, kurių kiekvienas suteikia unikalių įžvalgų, kaip išspręsti klausimą. Nors pradiniai jų atsakymai gali atrodyti sutrumpinti arba juose gali būti klaidų, šie modeliai gali patobulinti ir patobulinti savo atsakymus, atidžiai išnagrinėdami jų kolegų pateiktus atsakymus“, – sako Yilun Du, MIT elektros inžinerijos ir kompiuterių mokslo doktorantas, MIT CSAIL filialas. , ir pagrindinis autorius naujame dokumente apie darbą. „Kadangi šie AI modeliai dalyvauja diskusijose ir svarstymuose, jie yra geriau pasirengę atpažinti ir ištaisyti problemas, pagerinti savo problemų sprendimo gebėjimus ir geriau patikrinti savo atsakymų tikslumą. Iš esmės mes puoselėjame aplinką, kuri verčia juos gilintis į problemos esmę. Tai prieštarauja vienam, pavieniui AI modeliui, kuris dažnai paverčia internete rastą turinį. Tačiau mūsų metodas aktyviai skatina AI modelius kurti tikslesnius ir išsamesnius sprendimus.
Tyrime buvo nagrinėjamas matematinių problemų sprendimas, įskaitant vidurinės mokyklos ir vidurinės mokyklos matematikos problemas, ir pastebėta, kad daugelio agentų diskusijų procesas žymiai padidino našumą. Be to, kalbos modeliai parodė patobulintus gebėjimus generuoti tikslius aritmetinius vertinimus, iliustruojančius potencialą įvairiose srityse.
Šis metodas taip pat gali padėti išspręsti „haliucinacijų“, kurios dažnai kamuoja kalbos modelius, problemą. Sukūrę aplinką, kurioje agentai kritikuotų vienas kito atsakymus, jie buvo labiau skatinami vengti atsitiktinės informacijos ir teikti pirmenybę faktiniam tikslumui.
Šis metodas ne tik taikomas kalbos modeliams, bet ir gali būti naudojamas integruoti įvairius modelius su specializuotomis galimybėmis. Sukūrę decentralizuotą sistemą, kurioje sąveikauja ir diskutuoja keli agentai, jie galėtų panaudoti šiuos išsamius ir veiksmingus problemų sprendimo gebėjimus įvairiais būdais, pavyzdžiui, kalba, vaizdo įrašu ar tekstu.
Nors metodika davė vilčių teikiančių rezultatų, mokslininkai teigia, kad esami kalbos modeliai gali susidurti su iššūkiais apdorojant labai ilgus kontekstus, o kritikos gebėjimai gali būti ne tokie patobulinti, kaip norima. Be to, daugelio agentų diskusijų formatas, įkvėptas žmonių grupių sąveikos, dar turi apimti sudėtingesnes diskusijų formas, kurios prisideda prie protingo kolektyvinio sprendimų priėmimo – esminės ateities tyrinėjimų srities, teigia komanda. Technikos tobulinimas galėtų apimti gilesnį žmonių diskusijų ir diskusijų skaičiavimo pagrindų supratimą ir tų modelių naudojimą siekiant sustiprinti arba papildyti esamus LLM.
„Šis metodas ne tik suteikia galimybę pagerinti esamų kalbos modelių našumą, bet ir yra automatinė savęs tobulinimo priemonė. Naudojant diskusijų procesą kaip prižiūrimus duomenis, kalbos modeliai gali savarankiškai pagerinti savo faktiškumą ir samprotavimą, sumažindami pasikliauti žmonių atsiliepimais ir pasiūlyti keičiamą požiūrį į savęs tobulinimą“, – sako Du. „Kadangi mokslininkai ir toliau tobulina ir tyrinėja šį požiūrį, galime priartėti prie ateities, kurioje kalbos modeliai ne tik imituoja į žmogų panašią kalbą, bet ir demonstruoja sistemingesnį bei patikimesnį mąstymą, sukurdami naują kalbos supratimo ir taikymo erą.
„Labai prasminga naudoti svarstymo procesą siekiant pagerinti bendrą modelio našumą, ir tai yra didelis žingsnis į priekį nuo minčių grandinės raginimo“, – sako Anca Dragan, Kalifornijos universiteto Berklio Elektros inžinerijos katedros docentė. ir Kompiuterių mokslai, kuris nedalyvavo darbe. „Džiaugiuosi, kur tai gali būti toliau. Ar žmonės gali geriau įvertinti LLM atsakymus, kai mato svarstymą, ar jie susilieja, ar ne? Ar žmonės gali gauti geresnius atsakymus patys, svarstydami su LLM? Ar gali panašiai Idėja gali būti panaudota siekiant padėti vartotojui ištirti LLM atsakymą, kad gautų geresnį atsakymą?
Du parašė darbą su trimis CSAIL filialais: Shuang Li SM ’20, PhD ’23; MIT elektrotechnikos ir kompiuterių mokslo profesorius Antonio Torralba; ir MIT kompiuterinio pažinimo mokslo profesorius bei Smegenų, protų ir mašinų centro narys Joshua Tenenbaum. „Google DeepMind“ tyrinėtojas Igoris Mordatchas taip pat buvo bendraautorius.