Scheminė giluminio aktyvaus mokymosi tyrimo struktūra, apimanti pagrindines sąvokas, pritaikymus ir ateities iššūkius. Kreditas: Išmanusis kompiuteris (2023). DOI: 10.34133/computing.0058 Kinijos mokslininkų komanda parašė apžvalginį straipsnį apie gilųjį aktyvųjį mokymąsi – vis populiaresnį aktyvųjį mokymąsi derinant su giliuoju mokymusi, kad būtų galima atrinkti pavyzdį, mokant neuroninius tinklus dirbtinio intelekto užduotims atlikti. Jis buvo paskelbtas m Išmanusis kompiuteris.
Atsižvelgiant į tai, kad giluminio aktyvaus mokymosi metodų tyrimai pagrindų modelių kontekste yra riboti, šioje apžvalgoje pateikiama keletas šios temos įžvalgų. Jame nagrinėjami esami gilaus aktyvaus mokymosi metodai, pritaikymai ir ypač iššūkiai „pagrindų modelių eroje“ ir daroma išvada, kad būtina sukurti pritaikytus gilaus aktyvaus mokymosi metodus pagrindų modeliams.
Pastaruoju metu pamatų modelių sėkmė atkreipė dėmesį į daug duomenų reikalaujantį dirbtinio intelekto pobūdį. Pamatų modeliai paprastai kuriami naudojant gilaus mokymosi technologijas ir apmokyti naudojant didžiulius pažymėtus duomenų rinkinius. Tik su tiksliu duomenų žymėjimu ar anotacija modeliai gali tiksliai prognozuoti ir prisitaikyti prie įvairių tolesnių užduočių. Tačiau tokių duomenų rinkimas yra sunkus, sudėtingas ir brangus.
Čia atsiranda gilus aktyvus mokymasis. Aktyvaus mokymosi naudojimas gilaus mokymosi modeliams mokyti gali veiksmingai sumažinti sunkų ženklinimo darbą, nes aktyvus mokymasis atrenka ir paženklina tik vertingiausius pavyzdžius. Dėl to gilus aktyvus mokymasis gali sušvelninti mokymosi procesą ir sumažinti išlaidas, taip prisidedant prie „efektyviai išteklius naudojančių duomenų, kurie yra tvirtai pažymėti“.
Pagal tipinės aktyvaus mokymosi sistemos struktūrą, kuri apima užklausos duomenis, užklausos strategiją, žmogaus anotaciją ir modelio mokymą cikle, gilaus aktyvaus mokymosi metodai yra susiję su užklausų strategijomis, užklausų duomenų rinkinio charakteristikomis ir modelio mokymu.
Veiksmingos užklausų strategijos yra raktas į vertingiausius duomenų anotavimo pavyzdžius. Aktyvaus mokymosi užklausų strategijos paprastai skirstomos į tris kategorijas: narystės užklausų sintezė, srautu pagrįsta atranka ir telkiniu pagrįsta atranka; šis skirstymas į kategorijas pagrįstas nepažymėtų mėginių srautu į duomenų anotatorių.
Kita vertus, gilaus aktyvaus mokymosi algoritmams yra keturių rūšių strategijos: neapibrėžtumu pagrįstos, paskirstymo pagrindu, hibridinės ir automatiškai sukurtos.
Neapibrėžtumu pagrįstos strategijos nustato pavyzdžius, turinčius didžiausią neapibrėžtumą, pasiskirstymu pagrįstos strategijos sutelkia dėmesį į pagrindinę duomenų struktūrą, kad nustatytų reprezentatyvius pavyzdžius, o mišriose strategijose naudojamas neapibrėžtumu pagrįstų ir pasiskirstymu pagrįstų atrankos metrikų derinys; visi trys tipai yra sukurti rankiniu būdu, todėl nėra lengvai pritaikomi giluminio mokymosi modeliams ir yra pernelyg priklausomi nuo žmogaus patirties. Šios problemos gali būti sprendžiamos naudojant automatiškai sukurtas strategijas, kuriose naudojamas meta-mokymasis arba mokymosi pastiprinimas.
Užklausos strategijos turi būti pritaikytos įvairioms duomenų rinkinio ypatybėms, tokioms kaip užklausos duomenų rinkinio dydis, biudžetas ir pasiskirstymas. Tai poaibis, kruopščiai atrinktas iš didesnio duomenų rinkinio, kurį reikia pažymėti. Tiksliau, duomenų papildymas dažnai naudojamas siekiant pagerinti pažymėtų mokymo duomenų įvairovę ir kiekį; turėtų būti priimtos skirtingos strategijos, kurios atitiktų skirtingus biudžeto dydžius ir kad būtų galima susidoroti su pažymėtų ir nepažymėtų duomenų paskirstymo neatitikimu, ty vadinamąja domeno poslinkio problema.
Modelio mokymo metu autoriai aptarė, kaip derinti gilų aktyvų mokymąsi su dabartiniais daug duomenų turinčiais pagrindiniais metodais, įskaitant prižiūrimą mokymą, pusiau prižiūrimą mokymąsi, mokymąsi perkėlimą ir neprižiūrimą mokymąsi, kad būtų pasiektas optimalus modelio veikimas.
Tada buvo pristatytos gilaus aktyvaus mokymosi taikymas įvairiuose scenarijuose, ypač susiję su brangiu, daug laiko reikalaujančiu duomenų rinkimu ir anotavimu. Kaip pastebėjo autoriai, gilus aktyvus mokymasis buvo naudojamas apdoroti ne tik vieno modalinius duomenis, tokius kaip vaizdiniai duomenys, natūrali kalba ir akustiniai signalai, bet ir gausūs daugiarūšiai duomenys.
Tačiau autoriai taip pat atkreipė dėmesį į tai, kad dauguma dabartinių gilaus aktyvaus mokymosi metodų yra sutelkti į konkrečioms užduotims skirtus modelius, o ne į išsamius, daug duomenų reikalaujančius pagrindinius modelius.
Norint geriau integruoti gilų aktyvųjį mokymąsi į pagrindų modelius ir maksimaliai padidinti bendrą našumą, reikia išspręsti keletą pagrindinių iššūkių mokant ir tobulinant pagrindų modelius, įskaitant duomenų kokybės vertinimą, aktyvų koregavimą, veiksmingą duomenų atrankos ir anotacijos sąveiką ir veiksmingo mašininio mokymosi operacijų sistema.
Daugiau informacijos: Tianjiao Wan ir kt., Gilaus aktyvaus mokymosi pagrindų modeliams tyrimas, Išmanusis kompiuteris (2023). DOI: 10.34133/computing.0058
Teikia išmanioji kompiuterija
Citata: Kai gilus mokymasis susitinka su aktyviu mokymusi pamatinių modelių eroje (2023 m. gruodžio 1 d.), gauta 2023 m. gruodžio 1 d. iš https://techxplore.com/news/2023-12-deep-era-foundation.html
Šis dokumentas yra saugomas autorių teisių. Išskyrus bet kokius sąžiningus sandorius privačių studijų ar mokslinių tyrimų tikslais, jokia dalis negali būti atkuriama be raštiško leidimo. Turinys pateikiamas tik informaciniais tikslais.