Horoskopai
Pranešti naujieną
  • Prisijungti
Karščiausios naujienos šiandien
No Result
View All Result
Reklamos įkainiai
Kontaktai
  • Naujienos Lietuvoje
    • Kriminalai
    • Politika
  • Pasaulio naujienos
    • Ukrainos naujienos
  • Sporto naujienos
  • Įdomybės
  • Technologijos ir Mokslas
    • Kriptovaliutos
    • Dirbtinis intelektas
    • Metaverse
    • SpaceX
  • Gyvenimo būdas
    • Sveikata
    • Maistas ir Receptai
    • Muzika ir Filmai
    • Kelionės
    • Namai ir Statybos
    • Gyvūnai
    • Stilius ir Grožis
    • Psichologija
    • Šeima
    • Laisvalaikis
    • Įdomybės
    • Transportas
  • Verslo žinios
  • Miestai
    • Alytaus naujienos
    • Kaišiadorių naujienos
    • Kauno naujienos
    • Klaipėdos naujienos
    • Pajūrio naujienos
    • Palangos naujienos
    • Panevėžio naujienos
    • Radviliškio naujienos
    • Raseinių naujienos
    • Šiaulių naujienos
    • Varėnos naujienos
    • Vilniaus naujienos
  • Naujienos Lietuvoje
    • Kriminalai
    • Politika
  • Pasaulio naujienos
    • Ukrainos naujienos
  • Sporto naujienos
  • Įdomybės
  • Technologijos ir Mokslas
    • Kriptovaliutos
    • Dirbtinis intelektas
    • Metaverse
    • SpaceX
  • Gyvenimo būdas
    • Sveikata
    • Maistas ir Receptai
    • Muzika ir Filmai
    • Kelionės
    • Namai ir Statybos
    • Gyvūnai
    • Stilius ir Grožis
    • Psichologija
    • Šeima
    • Laisvalaikis
    • Įdomybės
    • Transportas
  • Verslo žinios
  • Miestai
    • Alytaus naujienos
    • Kaišiadorių naujienos
    • Kauno naujienos
    • Klaipėdos naujienos
    • Pajūrio naujienos
    • Palangos naujienos
    • Panevėžio naujienos
    • Radviliškio naujienos
    • Raseinių naujienos
    • Šiaulių naujienos
    • Varėnos naujienos
    • Vilniaus naujienos
Karščiausios naujienos šiandien
No Result
View All Result
Pagrindinis Technologijos ir Mokslas Dirbtinis intelektas

Mokymasis Kurti Mašininio Mokymosi Modelius

Paskelbė Naujienų portalas Tiksaviems
2023-03-22
in Dirbtinis intelektas
Skaitymo laikas: 6 min.
496
A A
0
Mokymasis Kurti Mašininio Mokymosi Modelius

Ne paslaptis, kad OpenAI ChatGPT turi keletą neįtikėtinų galimybių – pavyzdžiui, pokalbių robotas gali rašyti poeziją, primenančią Šekspyro sonetus arba derinti kompiuterio programos kodą. Šiuos gebėjimus įgalina didžiulis mašininio mokymosi modelis, kurio pagrindu sukurtas „ChatGPT“. Tyrėjai nustatė, kad kai tokio tipo modeliai tampa pakankamai dideli, atsiranda nepaprastų galimybių.

Tačiau didesniems modeliams apmokyti taip pat reikia daugiau laiko ir pinigų. Mokymo procesas apima šimtų milijardų pavyzdžių rodymą modeliui. Tiek duomenų rinkimas yra sudėtingas procesas. Tada ateina piniginės ir aplinkosaugos kaštai, susiję su daugelio galingų kompiuterių eksploatavimu kelias dienas ar savaites, norint parengti modelį, kuris gali turėti milijardus parametrų.

TAU TAIP PAT GALI PATIKTI

Nuo iliuzijos iki realybės: kaip dirbtinis intelektas keičia žaidimų industriją

Komisija nubrėžia kelią Europos lyderystei dirbtinio intelekto srityje – pristatytas ambicingas „Dirbtinio intelekto žemyno veiksmų planas“

„Apskaičiuota, kad tokio masto treniruočių modeliai, kokiu, kaip spėjama, gali veikti ChatGPT, gali kainuoti milijonus dolerių vienam treniruočių bėgimui. Ar galime pagerinti šių mokymo metodų efektyvumą, kad vis tiek galėtume gauti gerų modelių per trumpesnį laiką ir už mažiau pinigų? Siūlome tai padaryti naudojant mažesnius kalbos modelius, kurie anksčiau buvo išmokyti“, – sako Yoon Kim, MIT Elektros inžinerijos ir kompiuterių mokslo katedros docentas ir Kompiuterių mokslo ir dirbtinio intelekto laboratorijos (CSAIL) narys.

Užuot atmetęs ankstesnę modelio versiją, Kimas ir jo bendradarbiai naudoja ją kaip naujo modelio blokus. Naudojant mašininį mokymąsi, jų metodas išmoksta „išauginti“ didesnį modelį iš mažesnio modelio taip, kad būtų užkoduotos žinios, kurias mažesnis modelis jau įgijo. Tai leidžia greičiau treniruoti didesnį modelį.

Jų technika sutaupo apie 50 procentų skaičiavimo išlaidų, reikalingų dideliam modeliui parengti, palyginti su metodais, kuriais naujas modelis mokomas nuo nulio. Be to, modeliai, apmokyti naudojant MIT metodą, veikė taip pat arba geriau nei modeliai, mokyti naudojant kitus metodus, kurie taip pat naudoja mažesnius modelius, kad būtų galima greičiau treniruoti didesnius modelius.

Sumažinus milžiniškų modelių mokymo laiką, mokslininkai galėtų greičiau tobulėti su mažesnėmis sąnaudomis, taip pat sumažinti anglies dvideginio išmetimą mokymo proceso metu. Tai taip pat leistų mažesnėms mokslinių tyrimų grupėms dirbti su šiais didžiuliais modeliais, o tai gali atverti duris daugeliui naujų pasiekimų.

„Kadangi stengiamės demokratizuoti šių tipų technologijas, mokymasis taps greitesnis ir pigesnis“, – sako Kimas, vyresnysis šio metodo autorius.

Kimas ir jo magistrantas Lucas Torroba Hennigen parašė darbą su pagrindiniu autoriumi Peihao Wangu, Teksaso universiteto Ostine magistrantu, taip pat kitais MIT-IBM Watson AI laboratorijos ir Kolumbijos universiteto darbuotojais. Tyrimas bus pristatytas tarptautinėje mokymosi reprezentacijų konferencijoje.

Kuo didesnis tuo geriau

Dideli kalbų modeliai, tokie kaip GPT-3, kuris yra „ChatGPT“ pagrindas, yra sukurti naudojant neuroninio tinklo architektūrą, vadinamą transformatoriumi. Neuroninis tinklas, laisvai pagrįstas žmogaus smegenimis, sudarytas iš tarpusavyje sujungtų mazgų arba „neuronų“ sluoksnių. Kiekviename neurone yra parametrų, kurie yra mokymo proceso metu išmokti kintamieji, kuriuos neuronas naudoja duomenims apdoroti.

Transformatorių architektūros yra unikalios, nes didėjant šio tipo neuroninių tinklų modeliams, jie pasiekia daug geresnių rezultatų.

„Tai paskatino įmonių, bandančių apmokyti vis didesnius transformatorius vis didesniuose duomenų rinkiniuose, ginklavimosi lenktynes. Labiau nei kitos architektūros, atrodo, kad transformatorių tinklai tampa daug geresni keičiant mastelį. Mes tiesiog nesame tikri, kodėl taip yra“, – sako Kim.

Šie modeliai dažnai turi šimtus milijonų ar milijardus išmokstamų parametrų. Visų šių parametrų mokymas nuo nulio yra brangus, todėl mokslininkai siekia pagreitinti procesą.

Viena veiksminga technika yra žinoma kaip modelio augimas. Naudodami modelio augimo metodą, mokslininkai gali padidinti transformatoriaus dydį, nukopijuodami neuronus ar net ištisus ankstesnės tinklo versijos sluoksnius, tada sudėdami juos ant viršaus. Jie gali padaryti tinklą platesnį, pridėdami naujų neuronų į sluoksnį arba pagilinti, pridėdami papildomų neuronų sluoksnių.

Priešingai nei ankstesni modelio augimo metodai, parametrai, susiję su naujais neuronais išplėstiniame transformatoriuje, nėra tik mažesnio tinklo parametrų kopijos, aiškina Kim. Atvirkščiai, jie yra išmokti mažesnio modelio parametrų deriniai.

Mokymasis augti

Kimas ir jo bendradarbiai naudoja mašininį mokymąsi, kad išmoktų tiesinį mažesnio modelio parametrų atvaizdavimą. Šis tiesinis žemėlapis yra matematinė operacija, kuri paverčia įvesties reikšmių rinkinį, šiuo atveju mažesniojo modelio parametrus, į išvesties reikšmių rinkinį, šiuo atveju į didesnio modelio parametrus.

Jų metodas, kurį jie vadina išmoktu linijinio augimo operatoriumi (LiGO), išmoksta išplėsti didesnio tinklo plotį ir gylį iš mažesnio tinklo parametrų duomenų valdomu būdu.

Tačiau mažesnis modelis iš tikrųjų gali būti gana didelis – galbūt jis turi šimtą milijonų parametrų – ir mokslininkai galbūt norėtų sukurti modelį su milijardu parametrų. Taigi LiGO technika suskaido linijinį žemėlapį į mažesnes dalis, kurias gali apdoroti mašininio mokymosi algoritmas.

LiGO taip pat išplečia plotį ir gylį vienu metu, todėl jis yra efektyvesnis nei kiti metodai. Įvesdamas mažesnį modelį ir jo parametrus, naudotojas gali nustatyti, kokio pločio ir gylio nori didesnio modelio, aiškina Kim.

Kai jie palygino savo techniką su naujo modelio mokymo procesu nuo nulio, taip pat su modelio tobulinimo metodais, tai buvo greitesnė nei visos pradinės linijos. Jų metodas sutaupo apie 50 procentų skaičiavimo išlaidų, reikalingų tiek regėjimo, tiek kalbos modeliams lavinti, o dažnai pagerina našumą.

Tyrėjai taip pat nustatė, kad jie gali naudoti LiGO, kad paspartintų transformatorių mokymą, net jei jie neturėjo prieigos prie mažesnio, iš anksto paruošto modelio.

„Buvau nustebintas, kad visi metodai, įskaitant mūsų, buvo geresni, palyginti su atsitiktine inicijavimu, traukiniu nuo nulio. Kim sako.

Ateityje Kimas ir jo bendradarbiai nekantrauja pritaikyti LiGO dar didesniems modeliams.

Darbą iš dalies finansavo MIT-IBM Watson AI Lab, Amazon, IBM tyrimų AI aparatinės įrangos centras, Rensselaer politechnikos instituto skaičiavimo inovacijų centras ir JAV armijos tyrimų biuras.

Dalintis211Dalintis132Siųsti
Sekantis
Teismas įvertins Sigučio Obelevičiaus Teisėtą Lūkestį

Teismas įvertins Sigučio Obelevičiaus Teisėtą Lūkestį

Parašykite komentarą Atšaukti atsakymą

El. pašto adresas nebus skelbiamas. Būtini laukeliai pažymėti *

Sutinku su taisyklėmis ir nuostatomis bei privatumo politika.

Naujausi komentarai

  • Buvusi koncerte apie Žolinių ir Svėdasų 522-ojo gimtadienio šventė
  • Negali būti apie Pasipiktino mamos elgesiu Nidos kavinėje: kur valgau – ten kakoju, kitą kartą galima ant stalo
  • Kipras apie Pasipiktino mamos elgesiu Nidos kavinėje: kur valgau – ten kakoju, kitą kartą galima ant stalo
  • EleanorViolet Violet apie Mes ne triušiukai su skeltom lupytėm ir ne ožkytės, kad salotų lapus valgyti prie cepelinų, blynų, košių
  • Ka apie Kodėl vis daugiau lietuvių perka Bitcoin

Tema

  • Gyvenimo būdas
    • Gyvūnai
    • Kelionės
    • Laisvalaikis
    • Maistas ir Receptai
    • Muzika ir Filmai
    • Namai ir Statybos
    • Psichologija
    • Šeima
    • Stilius ir Grožis
    • Sveikata
    • Transportas
    • Žmonės
  • Horoskopai
  • Įdomybės
  • Kriminalai
  • Miestai
    • Alytaus naujienos
    • Kaišiadorių naujienos
    • Kauno naujienos
    • Klaipėdos naujienos
    • Pajūrio naujienos
    • Palangos naujienos
    • Panevėžio naujienos
    • Radviliškio naujienos
    • Šiaulių naujienos
    • Varėnos naujienos
    • Vilniaus naujienos
  • Naujausios
  • Naujienos Lietuvoje
  • Pasaulio naujienos
  • Politika
  • Pranešimai spaudai
  • Sporto naujienos
  • Technologijos ir Mokslas
    • Dirbtinis intelektas
    • Kriptovaliutos
    • Metaverse
    • SpaceX
  • Ukrainos naujienos
  • Verslo žinios

Partneriai

  • Zinoti.lt
  • Kosmetika | Pickcartline
  • AOGX | Ark of Genesis
  • CBDnutzen.de
  • Maisto papildai | Boostexter.com
  • Reidas Official
  • OHOHO.lt

Tiksaviems yra karščiausių naujienų šiandien portalas, kurio tikslas - pateikti savo skaitytojams naujienas iš viso pasaulio. Apžvelgiame viską - nuo politinių naujienų iki gyvenimo būdo turinio.

Naujienos

  • VMVT sustabdė greitojo maisto restorano veiklą, kuris tiekė maistą neveikiant vandentiekiui
  • Rimtas užmojis: plynėje kurs pasaulinio lygio meno centrą
  • „Makaronų tiltai 2026“ Troškūnų Kazio Inčiūros gimnazijoje

Kategorijos

Naujausi komentarai

  • Buvusi koncerte apie Žolinių ir Svėdasų 522-ojo gimtadienio šventė
  • Negali būti apie Pasipiktino mamos elgesiu Nidos kavinėje: kur valgau – ten kakoju, kitą kartą galima ant stalo
  • Kipras apie Pasipiktino mamos elgesiu Nidos kavinėje: kur valgau – ten kakoju, kitą kartą galima ant stalo
  • Reklama
  • Apie mus
  • Privatumo politika
  • Kontaktai

© 2025 Tiksaviems - Karščiausios naujienos šiandien. Visos teisės saugomos. Ukmergės žinios - Jonavos žinios - German News - Spain News - Travels

Sveiki sugrįžę!

Prisijungti su Google
Arba

Prisijunkite

Pamiršote slaptažodį?

Retrieve your password

Please enter your username or email address to reset your password.

Turite paskyrą? Prisijunkite
Tvarkyti sutikimą
Siekdami teikti geriausią patirtį, įrenginio informacijai saugoti ir (arba) pasiekti naudojame tokias technologijas kaip slapukus. Jei sutiksime su šiomis technologijomis, galėsime apdoroti duomenis, tokius kaip naršymo elgsena arba unikalūs ID šioje svetainėje. Nesutikimas arba sutikimo atšaukimas gali neigiamai paveikti tam tikras funkcijas ir funkcijas.
Funkcinis Visada aktyvus
Techninė saugykla arba prieiga yra griežtai būtina siekiant teisėto tikslo – sudaryti sąlygas naudotis konkrečia paslauga, kurios aiškiai paprašė abonentas arba naudotojas, arba tik tam, kad būtų galima perduoti ryšį elektroninių ryšių tinklu.
Parinktys
Techninė saugykla arba prieiga yra būtina teisėtam tikslui išsaugoti nuostatas, kurių neprašo abonentas ar vartotojas.
Statistika
Techninė saugykla arba prieiga, kuri naudojama tik statistiniais tikslais. Techninė saugykla arba prieiga, kuri naudojama tik anoniminiais statistikos tikslais. Be teismo šaukimo, jūsų interneto paslaugų teikėjo savanoriško įsipareigojimo ar papildomų įrašų iš trečiosios šalies, vien šiuo tikslu saugoma ar gauta informacija paprastai negali būti naudojama jūsų tapatybei nustatyti.
Rinkodara
Techninė saugykla arba prieiga reikalinga norint sukurti naudotojo profilius reklamai siųsti arba sekti vartotoją svetainėje ar keliose svetainėse panašiais rinkodaros tikslais.
  • Tvarkyti parinktis
  • Tvarkyti paslaugas
  • Tvarkyti {vendor_count} pardavėjus
  • Skaitykite daugiau apie šiuos tikslus
Peržiūrėti nuostatas
  • {title}
  • {title}
  • {title}
No Result
View All Result
  • Naujausios
  • Naujienos Lietuvoje
  • Pasaulio naujienos
  • Ukrainos naujienos
  • Politika
  • Verslo žinios
  • Kriminalai
  • Gyvenimo būdas
  • Laisvalaikis
  • Gyvūnai
  • Kelionės
  • Technologijos ir Mokslas
    • Kriptovaliutos
    • Dirbtinis intelektas
    • Metaverse
    • SpaceX
  • Maistas ir Receptai
  • Muzika ir Filmai
  • Namai ir Statybos
  • Psichologija
  • Šeima
  • Stilius ir Grožis
  • Sveikata
  • Transportas
  • Žmonės
  • Horoskopai
  • Įdomybės
  • Miestai
    • Alytaus naujienos
    • Kaišiadorių naujienos
    • Kauno naujienos
    • Klaipėdos naujienos
    • Pajūrio naujienos
    • Palangos naujienos
    • Panevėžio naujienos
    • Radviliškio naujienos
    • Raseinių naujienos
    • Šiaulių naujienos
    • Varėnos naujienos
    • Vilniaus naujienos
  • Pranešimai spaudai
  • Sporto naujienos
Reklamos įkainiai
Kontaktai

© 2025 Tiksaviems - Karščiausios naujienos šiandien. Visos teisės saugomos. Ukmergės žinios - Jonavos žinios - German News - Spain News - Travels