• Naujausi
Mašininio mokymosi paslapties sprendimas

Mašininio mokymosi paslapties sprendimas

prieš 1 mėnuo
Demokratinis atstovas Jamaalas Bowmanas ir GOP atstovas Thomas Massie įsivėlė į karštą pokalbį dėl ginkluoto smurto Kongreso salėse: „Nusiraminti?  Vaikai miršta!’

Demokratinis atstovas Jamaalas Bowmanas ir GOP atstovas Thomas Massie įsivėlė į karštą pokalbį dėl ginkluoto smurto Kongreso salėse: „Nusiraminti? Vaikai miršta!’

prieš 1 val
Mianmaro chunta paleido Aung San Suu Kyi partiją ir dešimtis kitų opozicinių partijų

Mianmaro chunta paleido Aung San Suu Kyi partiją ir dešimtis kitų opozicinių partijų

prieš 5 val
„SpaceX“ paleido dar vieną „Starlink“ interneto palydovų paketą

„SpaceX“ paleido dar vieną „Starlink“ interneto palydovų paketą

prieš 6 val
Modernūs baldai
Popiežius Pranciškus paguldytas į ligoninę dėl širdies problemų, kvėpavimo takų infekcijos

Popiežius Pranciškus paguldytas į ligoninę dėl širdies problemų, kvėpavimo takų infekcijos

prieš 6 val
Starlink Group 5-10 ruošiasi startui, laukiant oro

Starlink Group 5-10 ruošiasi startui, laukiant oro

prieš 7 val
JAV ir Pietų Korėja surengė paplūdimio šturmą demonstruodamos karinę jėgą

JAV ir Pietų Korėja surengė paplūdimio šturmą demonstruodamos karinę jėgą

prieš 7 val
„Sotheby’s“ aukcione parduos labiausiai vertinamą rožinį deimantą istorijoje

„Sotheby’s“ aukcione parduos labiausiai vertinamą rožinį deimantą istorijoje

prieš 8 val
Popiežius Pranciškus apžiūrimas ligoninėje Romoje

Popiežius Pranciškus apžiūrimas ligoninėje Romoje

prieš 9 val
S. Gentvilas Po Susitikimo Su ūkininkais: žemės įsigijimo Ribojimai Išliks, Jiems Veikti Bus Ieškoma Saugiklių, Leidimas Laikinai Naudotis Valstybine žeme  Galios Dar 2  Metus

S. Gentvilas Po Susitikimo Su ūkininkais: žemės įsigijimo Ribojimai Išliks, Jiems Veikti Bus Ieškoma Saugiklių, Leidimas Laikinai Naudotis Valstybine žeme Galios Dar 2 Metus

prieš 9 val
„Laiko beveik nėra!“ – svarbios tiesos iš penkiasdešimtmetės moters

„Laiko beveik nėra!“ – svarbios tiesos iš penkiasdešimtmetės moters

prieš 10 val
Kurdų naftos gavyba buvo sustabdyta dėl eksporto ginčų

Kurdų naftos gavyba buvo sustabdyta dėl eksporto ginčų

prieš 10 val
VRM Iniciatyva – 125 Valstybės Finansuojamos Studijų Vietos Policijos Ir Pasienio Pareigūnams Rengti

VRM Iniciatyva – 125 Valstybės Finansuojamos Studijų Vietos Policijos Ir Pasienio Pareigūnams Rengti

prieš 11 val
  • Reklama
  • Apie mus
  • Privatumo politika
  • Kontaktai
Ketvirtadienis, 30 kovo, 2023
Retail
No Result
View All Result
Reklama
Kontaktai
  • Karas Ukrainoje
  • Lietuvoje
  • Užsienyje
  • Politika
  • Verslas
  • Kriminalai
  • Sportas
  • Technologijos ir Mokslas
    • Metaverse
    • SpaceX
    • Dirbtinis intelektas
  • Gyvenimo būdas
    • Sveikata
    • Maistas ir Receptai
    • Muzika ir Filmai
    • Kelionės
    • Namai ir Statybos
    • Gyvūnai
    • Stilius ir Grožis
    • Psichologija
    • Šeima
    • Laisvalaikis
  • Įdomybės
  • Horoskopai
    • Simboliai ir Reikšmės
    • Savaitės horoskopai
    • Mėnesio horoskopai
    • Metų horoskopai
Tiksaviems.lt - Naujienų portalas | Skaitykite naujienas iš viso pasaulio
No Result
View All Result
Pagrindinis Technologijos ir Mokslas Dirbtinis intelektas

Mašininio mokymosi paslapties sprendimas

Paskelbė TikSaviems
2023-02-14
in Dirbtinis intelektas
Skaitymo laikas: 7 mins read
27 2
A A
0
Mašininio mokymosi paslapties sprendimas

Dideli kalbų modeliai, tokie kaip OpenAI GPT-3, yra didžiuliai neuroniniai tinklai, galintys generuoti į žmogų panašų tekstą – nuo ​​poezijos iki programavimo kodo. Šie mašininio mokymosi modeliai, išmokyti naudojant daugybę interneto duomenų, įveda nedidelę dalį teksto ir numato kitą tekstą.

Tačiau tai dar ne viskas, ką šie modeliai gali padaryti. Tyrėjai tiria keistą reiškinį, žinomą kaip mokymasis kontekste, kai didelis kalbos modelis išmoksta atlikti užduotį, matydamas tik kelis pavyzdžius, nepaisant to, kad jis nebuvo apmokytas atlikti šią užduotį. Pavyzdžiui, kas nors galėtų pateikti modeliui kelis pavyzdinius sakinius ir jų jausmus (teigiamus arba neigiamus), tada paskatinti jį nauju sakiniu, ir modelis gali pateikti teisingą nuotaiką.

TAU TAIP PAT GALI PATIKTI

Bakterijų Injekcijos Sistema Tiekia Baltymus į Peles Ir žmogaus Ląsteles

TechScape: kaip pasaulis atsigręžia prieš socialinę žiniasklaidą

Paprastai mašininio mokymosi modelis, pvz., GPT-3, turi būti perkvalifikuotas naudojant naujus duomenis šiai naujai užduočiai atlikti. Šio mokymo proceso metu modelis atnaujina savo parametrus, kai apdoroja naują informaciją, kad išmoktų užduotį. Tačiau naudojant kontekstinį mokymąsi, modelio parametrai neatnaujinami, todėl atrodo, kad modelis išmoksta naują užduotį visiškai nieko neišmokęs.

Mokslininkai iš MIT, Google Research ir Stanfordo universiteto stengiasi įminti šią paslaptį. Jie ištyrė modelius, kurie yra labai panašūs į didelių kalbų modelius, kad sužinotų, kaip jie gali mokytis neatnaujindami parametrų.

Tyrėjų teoriniai rezultatai rodo, kad šie didžiuliai neuroninių tinklų modeliai gali turėti mažesnius, paprastesnius linijinius modelius, palaidotus juose. Tada didelis modelis galėtų įgyvendinti paprastą mokymosi algoritmą, kad šis mažesnis, tiesinis modelis būtų išmokytas atlikti naują užduotį, naudojant tik didesniame modelyje jau esančią informaciją. Jo parametrai išlieka pastovūs.

Svarbus žingsnis siekiant suprasti mokymosi kontekste mechanizmus, šis tyrimas atveria duris daugiau tyrinėti mokymosi algoritmus, kuriuos gali įgyvendinti šie dideli modeliai, sako Ekinas Akyürekas, informatikos magistrantūros studentas ir pagrindinis šio reiškinio tyrimo autorius. Geriau suprasdami mokymąsi kontekste, tyrėjai galėtų sudaryti sąlygas modeliams atlikti naujas užduotis be brangaus perkvalifikavimo.

„Paprastai, jei norite patikslinti šiuos modelius, turite rinkti konkrečių domenų duomenis ir atlikti tam tikrą sudėtingą inžineriją. Tačiau dabar galime tiesiog pateikti įvestį, penkis pavyzdžius, ir tai padarys tai, ko norime. Taigi -Kontekstinis mokymasis yra nepagrįstai efektyvus mokymosi reiškinys, kurį reikia suprasti“, – sako Akyürek.

Prie Akyürek prisijungia Dale’as Schuurmansas, „Google Brain“ mokslininkas ir Albertos universiteto skaičiavimo mokslų profesorius; taip pat vyresnieji autoriai Jacob Andreas, X konsorciumo asistentas MIT Elektros inžinerijos ir kompiuterių mokslo katedroje ir MIT kompiuterių mokslo ir dirbtinio intelekto laboratorijos (CSAIL) narys; Tengyu Ma, Stanfordo kompiuterių mokslo ir statistikos docentas; ir Danny Zhou, pagrindinis „Google Brain“ mokslininkas ir tyrimų direktorius. Tyrimas bus pristatytas tarptautinėje mokymosi reprezentacijų konferencijoje.

Modelis modelyje

Mašininio mokymosi mokslinių tyrimų bendruomenėje daugelis mokslininkų tikėjo, kad dideli kalbų modeliai gali mokytis kontekste dėl to, kaip jie yra mokomi, sako Akyürek.

Pavyzdžiui, GPT-3 turi šimtus milijardų parametrų ir buvo išmokytas skaitant daugybę tekstų internete, nuo Vikipedijos straipsnių iki Reddit įrašų. Taigi, kai kas nors parodo naujos užduoties modelio pavyzdžius, jis tikriausiai jau matė kažką labai panašaus, nes jo mokymo duomenų rinkinyje buvo tekstas iš milijardų svetainių. Jis kartoja modelius, kuriuos matė treniruočių metu, o ne mokosi atlikti naujas užduotis.

Akyürek iškėlė hipotezę, kad kontekste besimokantys asmenys ne tik atitinka anksčiau matytus modelius, bet iš tikrųjų mokosi atlikti naujas užduotis. Jis ir kiti eksperimentavo suteikdami šiuos modelius raginimus naudodami sintetinius duomenis, kurių anksčiau niekur negalėjo matyti, ir nustatė, kad modeliai vis tiek gali pasimokyti iš kelių pavyzdžių. Akyürek ir jo kolegos manė, kad galbūt šiuose neuroninių tinklų modeliuose yra mažesni mašininio mokymosi modeliai, kuriuos modeliai gali išmokyti atlikti naują užduotį.

„Tai galėtų paaiškinti beveik visus mokymosi reiškinius, kuriuos matėme su šiais dideliais modeliais“, – sako jis.

Norėdami patikrinti šią hipotezę, mokslininkai naudojo neuroninio tinklo modelį, vadinamą transformatoriumi, kurio architektūra tokia pati kaip GPT-3, tačiau buvo specialiai apmokyta mokytis kontekste.

Tyrinėdami šio transformatoriaus architektūrą, jie teoriškai įrodė, kad jis gali parašyti linijinį modelį savo paslėptose būsenose. Neuroninį tinklą sudaro daugybė tarpusavyje sujungtų mazgų, apdorojančių duomenis, sluoksnių. Paslėptos būsenos yra sluoksniai tarp įvesties ir išvesties sluoksnių.

Jų matematiniai vertinimai rodo, kad šis tiesinis modelis parašytas kažkur ankstyviausiuose transformatoriaus sluoksniuose. Tada transformatorius gali atnaujinti tiesinį modelį įdiegdamas paprastus mokymosi algoritmus.

Iš esmės modelis imituoja ir treniruoja mažesnę savo versiją.

Paslėptų sluoksnių zondavimas

Tyrėjai ištyrė šią hipotezę naudodami zondavimo eksperimentus, kurių metu jie pažvelgė į paslėptus transformatoriaus sluoksnius, kad bandytų atkurti tam tikrą kiekį.

„Šiuo atveju mes bandėme atkurti tikrąjį linijinio modelio sprendimą ir galėjome parodyti, kad parametras parašytas paslėptose būsenose. Tai reiškia, kad linijinis modelis yra kažkur“, – sako jis.

Remdamiesi šiuo teoriniu darbu, mokslininkai gali leisti transformatoriui atlikti kontekstinį mokymąsi, pridėdami tik du neuroninio tinklo sluoksnius. Akyürek įspėja, kad dar reikia išsiaiškinti daugybę techninių detalių, tačiau tai gali padėti inžinieriams sukurti modelius, kurie galėtų atlikti naujas užduotis, nereikalaujant perkvalifikuoti naujų duomenų.

„Straipsnyje atskleidžiama viena ryškiausių šiuolaikinių didelių kalbų modelių savybių – jų gebėjimas mokytis iš duomenų, pateiktų įvestyje, be aiškaus mokymo. Naudodami supaprastintą tiesinės regresijos atvejį, autoriai teoriškai parodo, kaip modeliai gali įgyvendinti standartinius mokymosi algoritmus skaitydami jų įvestį, ir empiriškai, kurie mokymosi algoritmai geriausiai atitinka jų stebimą elgesį“, – sako Mike’as Lewisas, „Facebook AI Research“ mokslininkas, kuris nebuvo dalyvauja šiame darbe. „Šie rezultatai yra žingsnis siekiant suprasti, kaip modeliai gali išmokti sudėtingesnių užduočių, ir padės tyrėjams sukurti geresnius kalbos modelių mokymo metodus, kad būtų dar labiau pagerintas jų veikimas.”

Judėdamas į priekį, Akyürek planuoja ir toliau tyrinėti kontekstinį mokymąsi su funkcijomis, kurios yra sudėtingesnės nei linijiniai modeliai, kuriuos jie tyrinėjo šiame darbe. Jie taip pat galėtų pritaikyti šiuos eksperimentus dideliems kalbos modeliams, kad sužinotų, ar jų elgesys taip pat aprašytas paprastais mokymosi algoritmais. Be to, jis nori giliau įsigilinti į išankstinio mokymo duomenų tipus, kurie gali padėti mokytis kontekste.

„Su šiuo darbu žmonės dabar gali įsivaizduoti, kaip šie modeliai gali mokytis iš pavyzdžių. Taigi, tikiuosi, kad tai pakeis kai kurių žmonių požiūrį į mokymąsi kontekste“, – sako Akyürek. „Šie modeliai nėra tokie kvaili, kaip žmonės galvoja. Jie ne tik įsimena šias užduotis. Jie gali išmokti naujų užduočių, o mes parodėme, kaip tai galima padaryti.

Paspauskite Paminėjimai

Pagrindinė plokštė

Pagrindinė plokštė reporterė Tatyana Woodall rašo, kad naujame MIT mokslininkų bendraautoriame tyrime nustatyta, kad dirbtinio intelekto modeliai, kurie gali išmokti atlikti naujas užduotis tik iš kelių pavyzdžių, sukuria mažesnius modelius savyje, kad pasiektų šias naujas užduotis. „Mokymasis yra supainiotas [existing] žinių“, – aiškina magistrantas Ekinas Akyürekas. „Parodome, kad šie modeliai gali mokytis iš pavyzdžių skrydžio metu, neatnaujinant modeliui taikomų parametrų.

Susijusios nuorodos

Dalintis14Dalintis9Siųsti
Sekantis
Turite turėti širdies: kompiuterių mokslininkas stengiasi padėti AI suprasti žmogaus emocijas

Turite turėti širdies: kompiuterių mokslininkas stengiasi padėti AI suprasti žmogaus emocijas

Parašykite komentarą Atšaukti atsakymą

El. pašto adresas nebus skelbiamas. Būtini laukeliai pažymėti *

Sutinku su taisyklėmis ir nuostatomis bei privatumo politika.

Naujausi komentarai

  • Tomas Jakutis apie Žiūrėkite tiesiogiai: „SpaceX“ skaičiuoja iki saulėlydžio paleidimo iš Kanaveralo kyšulio
  • Lina apie Kodėl vyrai išeina? Moterys, jūs labai klystate!
  • Saule apie Kas lauktų apsilankius Preiloje?
  • Kaip patiems nupoliruoti langą. – R.D. spindesys apie Specialistas pataria: kaip patiems nupoliruoti langą?
  • Tegul eina apie Kodėl vyrai išeina? Moterys, jūs labai klystate!

Naujienos

Demokratinis atstovas Jamaalas Bowmanas ir GOP atstovas Thomas Massie įsivėlė į karštą pokalbį dėl ginkluoto smurto Kongreso salėse: „Nusiraminti?  Vaikai miršta!’

Demokratinis atstovas Jamaalas Bowmanas ir GOP atstovas Thomas Massie įsivėlė į karštą pokalbį dėl ginkluoto smurto Kongreso salėse: „Nusiraminti? Vaikai miršta!’

2023 30 kovo
Mianmaro chunta paleido Aung San Suu Kyi partiją ir dešimtis kitų opozicinių partijų

Mianmaro chunta paleido Aung San Suu Kyi partiją ir dešimtis kitų opozicinių partijų

2023 29 kovo
„SpaceX“ paleido dar vieną „Starlink“ interneto palydovų paketą

„SpaceX“ paleido dar vieną „Starlink“ interneto palydovų paketą

2023 29 kovo

Tiksaviems yra naujienų portalas, kurio tikslas - pateikti savo skaitytojams naujienas iš viso pasaulio. Apžvelgiame viską - nuo politinių naujienų iki gyvenimo būdo turinio.

Naujienos

  • Demokratinis atstovas Jamaalas Bowmanas ir GOP atstovas Thomas Massie įsivėlė į karštą pokalbį dėl ginkluoto smurto Kongreso salėse: „Nusiraminti? Vaikai miršta!’
  • Mianmaro chunta paleido Aung San Suu Kyi partiją ir dešimtis kitų opozicinių partijų
  • „SpaceX“ paleido dar vieną „Starlink“ interneto palydovų paketą

Kategorijos

Naujausi komentarai

  • Tomas Jakutis apie Žiūrėkite tiesiogiai: „SpaceX“ skaičiuoja iki saulėlydžio paleidimo iš Kanaveralo kyšulio
  • Lina apie Kodėl vyrai išeina? Moterys, jūs labai klystate!
  • Saule apie Kas lauktų apsilankius Preiloje?
  • Reklama
  • Apie mus
  • Privatumo politika
  • Kontaktai
  • lt
    • en
    • de
    • fr
    • pl
    • es
    • lt
    • uk
    • lv
    • et
    • ru

© 2023 TikSaviems. Visos teisės saugomos. Ainewshive.com - 24Newsy.com - 365Nachrichten.de - EntreNosotros.es - SEO Paslaugos įmonėms

No Result
View All Result
  • Karas Ukrainoje
  • Lietuvoje
  • Užsienyje
  • Politika
  • Verslas
  • Kriminalai
  • Sportas
  • Technologijos ir Mokslas
    • Metaverse
    • SpaceX
    • Dirbtinis intelektas
  • Gyvenimo būdas
    • Sveikata
    • Maistas ir Receptai
    • Muzika ir Filmai
    • Kelionės
    • Namai ir Statybos
    • Gyvūnai
    • Stilius ir Grožis
    • Psichologija
    • Šeima
    • Laisvalaikis
  • Įdomybės
  • Horoskopai
    • Simboliai ir Reikšmės
    • Savaitės horoskopai
    • Mėnesio horoskopai
    • Metų horoskopai

© 2023 TikSaviems. Visos teisės saugomos. Ainewshive.com - 24Newsy.com - 365Nachrichten.de - EntreNosotros.es - SEO Paslaugos įmonėms

Sveiki sugrįžę!

Prisijunkite

Pamiršote slaptažodį?

Retrieve your password

Please enter your username or email address to reset your password.

Turite paskyrą? Prisijunkite