Horoskopai
Pranešti naujieną
  • Prisijungti
Karščiausios naujienos šiandien
No Result
View All Result
Reklamos įkainiai
Kontaktai
  • Naujienos Lietuvoje
    • Kriminalai
    • Politika
  • Pasaulio naujienos
    • Ukrainos naujienos
  • Sporto naujienos
  • Įdomybės
  • Technologijos ir Mokslas
    • Kriptovaliutos
    • Dirbtinis intelektas
    • Metaverse
    • SpaceX
  • Gyvenimo būdas
    • Sveikata
    • Maistas ir Receptai
    • Muzika ir Filmai
    • Kelionės
    • Namai ir Statybos
    • Gyvūnai
    • Stilius ir Grožis
    • Psichologija
    • Šeima
    • Laisvalaikis
    • Įdomybės
    • Transportas
  • Verslo žinios
  • Miestai
    • Alytaus naujienos
    • Kaišiadorių naujienos
    • Kauno naujienos
    • Klaipėdos naujienos
    • Pajūrio naujienos
    • Palangos naujienos
    • Panevėžio naujienos
    • Radviliškio naujienos
    • Raseinių naujienos
    • Šiaulių naujienos
    • Varėnos naujienos
    • Vilniaus naujienos
  • Naujienos Lietuvoje
    • Kriminalai
    • Politika
  • Pasaulio naujienos
    • Ukrainos naujienos
  • Sporto naujienos
  • Įdomybės
  • Technologijos ir Mokslas
    • Kriptovaliutos
    • Dirbtinis intelektas
    • Metaverse
    • SpaceX
  • Gyvenimo būdas
    • Sveikata
    • Maistas ir Receptai
    • Muzika ir Filmai
    • Kelionės
    • Namai ir Statybos
    • Gyvūnai
    • Stilius ir Grožis
    • Psichologija
    • Šeima
    • Laisvalaikis
    • Įdomybės
    • Transportas
  • Verslo žinios
  • Miestai
    • Alytaus naujienos
    • Kaišiadorių naujienos
    • Kauno naujienos
    • Klaipėdos naujienos
    • Pajūrio naujienos
    • Palangos naujienos
    • Panevėžio naujienos
    • Radviliškio naujienos
    • Raseinių naujienos
    • Šiaulių naujienos
    • Varėnos naujienos
    • Vilniaus naujienos
Karščiausios naujienos šiandien
No Result
View All Result
Pagrindinis Technologijos ir Mokslas Dirbtinis intelektas

Veiksmingesnis Būdas Treniruoti Mašinas Neapibrėžtoms Realaus Pasaulio Situacijoms

Paskelbė Naujienų portalas Tiksaviems
2023-05-31
in Dirbtinis intelektas
Skaitymo laikas: 7 min.
512
A A
0
Veiksmingesnis Būdas Treniruoti Mašinas Neapibrėžtoms Realaus Pasaulio Situacijoms

Kas nors, besimokantis žaisti tenisą, gali pasamdyti mokytoją, kuris padėtų greičiau išmokti. Kadangi šis mokytojas (tikiuosi) yra puikus tenisininkas, kartais bandymas tiksliai mėgdžioti mokytoją nepadės mokiniui mokytis. Galbūt mokytojas pašoka aukštai į orą, kad mikliai grąžintų salvę. Studentė, negalėdama to nukopijuoti, gali pati pabandyti kelis kitus judesius, kol įgis įgūdžių, kurių jai reikia norint grąžinti salves.

Kompiuterių mokslininkai taip pat gali naudoti „mokytojų“ sistemas, kad išmokytų kitą mašiną atlikti užduotį. Tačiau, kaip ir mokantis žmogus, mokinio mašina susiduria su dilema – žinoti, kada sekti mokytoją, o kada tyrinėti pačiam. Šiuo tikslu mokslininkai iš MIT ir Technion, Izraelio technologijos instituto, sukūrė algoritmą, kuris automatiškai ir savarankiškai nustato, kada mokinys turėtų mėgdžioti mokytoją (žinomas kaip imitacinis mokymasis), o kada jis turėtų mokytis per bandymus ir klaidas (žinoma). kaip pastiprinimo mokymasis).

TAU TAIP PAT GALI PATIKTI

Nuo iliuzijos iki realybės: kaip dirbtinis intelektas keičia žaidimų industriją

Komisija nubrėžia kelią Europos lyderystei dirbtinio intelekto srityje – pristatytas ambicingas „Dirbtinio intelekto žemyno veiksmų planas“

Jų dinaminis požiūris leidžia mokiniui nukrypti nuo mokytojo kopijavimo, kai mokytojas yra per geras arba nepakankamai geras, bet vėliau vėl seka mokytoją, jei tai padarys pasiekti geresnių rezultatų ir greičiau mokytis.

Kai mokslininkai išbandė šį metodą modeliavimuose, jie nustatė, kad jų mokymosi iš bandymų ir klaidų ir mokymosi imitacijos derinys leido studentams efektyviau išmokti užduotis nei metodai, naudojantys tik vieną mokymosi tipą.

Šis metodas galėtų padėti tyrėjams pagerinti mašinų, kurios bus naudojamos neapibrėžtose realaus pasaulio situacijose, pavyzdžiui, robotas, mokomas naršyti pastate, kurio jis dar nematė, mokymo procesą.

„Šis mokymosi bandymų ir klaidų ir sekimo mokytoju derinys yra labai galingas. Tai suteikia mūsų algoritmui galimybę išspręsti labai sudėtingas užduotis, kurių negalima išspręsti naudojant bet kurią techniką atskirai“, – sako Idan Shenfeld, elektros inžinerijos ir kompiuterių mokslų (EECS) magistrantūros studentas ir pagrindinis šios technikos straipsnio autorius.

Shenfeld parašė darbą su bendraautoriais Zhang-Wei Hong, EECS absolventu; Avivas Tamaras; Techniono elektros inžinerijos ir informatikos docentas; ir vyresnysis autorius Pulkit Agrawal, Improbable AI Lab direktorius ir Kompiuterių mokslų ir dirbtinio intelekto laboratorijos docentas. Tyrimas bus pristatytas tarptautinėje mašininio mokymosi konferencijoje.

Išlaikyti pusiausvyrą

Daugelis esamų metodų, kuriais siekiama išlaikyti pusiausvyrą tarp mokymosi imitacijos ir mokymosi pastiprinimo, tai daroma taikant žiaurios jėgos bandymus ir klaidas. Tyrėjai pasirenka svertinį dviejų mokymosi metodų derinį, atlieka visą mokymo procedūrą ir kartoja procesą, kol suras optimalią pusiausvyrą. Tai neefektyvu ir dažnai taip brangu, kad net neįmanoma.

„Norime algoritmų, kurie būtų principingi, sureguliuotų kuo mažiau rankenėlių ir pasiektų aukštą našumą – šie principai paskatino mūsų tyrimus“, – sako Agrawal.

Kad tai pasiektų, komanda į problemą žiūrėjo kitaip nei ankstesniame darbe. Jų sprendimas apima dviejų studentų mokymą: vieną su svertiniu mokymosi pastiprinimu ir mokymosi imitavimu deriniu, o antrąjį, kuris gali naudoti tik sustiprintą mokymąsi, kad išmoktų tą pačią užduotį.

Pagrindinė idėja yra automatiškai ir dinamiškai koreguoti pirmojo studento sustiprinimo ir imitavimo mokymosi tikslų svorį. Čia pasirodo antrasis mokinys. Tyrėjų algoritmas nuolat lygina du studentus. Jei mokytojui sekasi geriau, algoritmas daugiau dėmesio skiria mokymuisi imitaciniam mokymuisi, kad mokytų mokinį, tačiau jei tas, kuris naudoja tik bandymus ir klaidas, pradeda gauti geresnių rezultatų, jis daugiau dėmesio skirs mokymuisi iš pastiprinimo mokymosi.

Dinamiškai nustatant, kuriuo metodu pasiekiami geresni rezultatai, algoritmas yra prisitaikantis ir gali pasirinkti geriausią techniką viso mokymo proceso metu. Dėl šios naujovės ji gali efektyviau mokyti studentus nei kiti metodai, kurie nėra prisitaikantys, sako Shenfeld.

„Vienas iš pagrindinių iššūkių kuriant šį algoritmą buvo tai, kad prireikė šiek tiek laiko, kol supratome, kad neturėtume treniruoti dviejų studentų savarankiškai. Tapo aišku, kad turime sujungti agentus, kad jie dalytųsi informacija, o tada rasti tinkamą būdą techniškai pagrįsti šią intuiciją“, – sako Shenfeldas.

Sunkių problemų sprendimas

Norėdami išbandyti savo požiūrį, mokslininkai atliko daugybę imituojamų mokytojų ir studentų mokymo eksperimentų, pavyzdžiui, naršydami lavos labirintu, kad pasiektų kitą tinklelio kampą. Šiuo atveju mokytojas turi viso tinklelio žemėlapį, o mokinys gali matyti tik priešais esantį lopą. Jų algoritmas pasiekė beveik tobulą sėkmės rodiklį visose testavimo aplinkose ir buvo daug greitesnis nei kiti metodai.

Kad jų algoritmas būtų dar sunkesnis, jie sukūrė modeliavimą, kuriame dalyvavo robotinė ranka su prisilietimo jutikliais, bet be regėjimo, kuri turi perorientuoti rašiklį į tinkamą pozą. Mokytojas turėjo prieigą prie tikrosios rašiklio orientacijos, o mokinys galėjo naudoti tik jutiklinius jutiklius, kad nustatytų rašiklio orientaciją.

Jų metodas pranoko kitus, kurie naudojo tik imitacinį mokymąsi arba tik stiprinimo mokymąsi.

Objektų perorientavimas yra viena iš daugelio manipuliavimo užduočių, kurias turės atlikti būsimas namų robotas – vizija, kurią įgyvendina Improbable AI laboratorija, priduria Agrawal.

Mokytojo ir studento mokymasis buvo sėkmingai pritaikytas mokant robotus atlikti sudėtingą manipuliavimą objektais ir judėjimą modeliuojant, o tada perkelti išmoktus įgūdžius į realų pasaulį. Taikant šiuos metodus, mokytojas turi privilegijuotą informaciją, pasiekiamą iš modeliavimo, kurios mokinys neturės, kai jis bus naudojamas realiame pasaulyje. Pavyzdžiui, mokytojas žinos išsamų pastato žemėlapį, kuriame mokinys robotas mokomas naršyti naudodamas tik jo fotoaparato užfiksuotus vaizdus.

„Dabartiniai studentų ir mokytojų mokymosi robotikos metodai neatsižvelgia į mokinio nesugebėjimą mėgdžioti mokytojo, todėl jų veikla yra ribota. Naujasis metodas atveria kelią geresniems robotams kurti“, – sako Agrawal.

Be geresnių robotų, mokslininkai mano, kad jų algoritmas gali pagerinti našumą įvairiose programose, kuriose naudojamas imitacinis arba sustiprinamas mokymasis. Pavyzdžiui, dideli kalbų modeliai, tokie kaip GPT-4, labai gerai atlieka daugybę užduočių, todėl galbūt būtų galima naudoti didelį modelį kaip mokytoją, kad būtų galima išmokyti mažesnį studento modelį, kad jis būtų dar „geresnis“ atliekant vieną konkrečią užduotį. . Kita įdomi kryptis yra ištirti mašinų ir žmonių, besimokančių iš atitinkamų mokytojų, panašumus ir skirtumus. Tokia analizė gali padėti pagerinti mokymosi patirtį, teigia mokslininkai.

„Įdomu šiame požiūryje, palyginti su susijusiais metodais, yra tai, kaip jis atrodo patikimas įvairiems parametrų pasirinkimams, o sričių, kuriose jis rodo daug žadančių rezultatų, įvairovė“, – sako Vašingtono universiteto docentas Abhishek Gupta, nedalyvavęs Šis darbas. „Nors dabartinis rezultatų rinkinys daugiausia yra modeliuojamas, aš labai džiaugiuosi, kad ateityje bus galima pritaikyti šį darbą problemoms, susijusioms su atmintimi ir samprotavimu, naudojant įvairius būdus, pavyzdžiui, lytėjimo jutimą.

„Šis darbas pristato įdomų metodą, kaip pakartotinai panaudoti ankstesnį skaičiavimo darbą stiprinant mokymąsi. Visų pirma, jų siūlomas metodas gali panaudoti neoptimalią mokytojo politiką kaip vadovą, tuo pačiu išvengiant kruopštaus hiperparametrų tvarkaraščio, reikalingo ankstesniuose metoduose, siekiant suderinti mokytojo imitavimo ir atlygio už užduotį optimizavimo tikslus“, – priduria Rishabh Agarwal, „Google Brain“ vyresnysis mokslo darbuotojas. taip pat nedalyvavo šiame tyrime. „Tikimės, kad dėl šio darbo reinkarnuojantis sustiprinimo mokymasis taikant išmoktą politiką taptų ne toks sudėtingas.

Šį tyrimą iš dalies palaikė MIT-IBM Watson AI Lab, Hyundai Motor Company, DARPA Machine Common Sense programa ir Karinio jūrų laivyno tyrimų biuras.

Dalintis211Dalintis132Siųsti
Sekantis
Anykščių Koplyčioje – šiuolaikinės Muzikos Vakaras

Anykščių Koplyčioje – šiuolaikinės Muzikos Vakaras

Parašykite komentarą Atšaukti atsakymą

El. pašto adresas nebus skelbiamas. Būtini laukeliai pažymėti *

Sutinku su taisyklėmis ir nuostatomis bei privatumo politika.

Naujausi komentarai

  • Buvusi koncerte apie Žolinių ir Svėdasų 522-ojo gimtadienio šventė
  • Negali būti apie Pasipiktino mamos elgesiu Nidos kavinėje: kur valgau – ten kakoju, kitą kartą galima ant stalo
  • Kipras apie Pasipiktino mamos elgesiu Nidos kavinėje: kur valgau – ten kakoju, kitą kartą galima ant stalo
  • EleanorViolet Violet apie Mes ne triušiukai su skeltom lupytėm ir ne ožkytės, kad salotų lapus valgyti prie cepelinų, blynų, košių
  • Ka apie Kodėl vis daugiau lietuvių perka Bitcoin

Tema

  • Gyvenimo būdas
    • Gyvūnai
    • Kelionės
    • Laisvalaikis
    • Maistas ir Receptai
    • Muzika ir Filmai
    • Namai ir Statybos
    • Psichologija
    • Šeima
    • Stilius ir Grožis
    • Sveikata
    • Transportas
    • Žmonės
  • Horoskopai
  • Įdomybės
  • Kriminalai
  • Miestai
    • Alytaus naujienos
    • Kaišiadorių naujienos
    • Kauno naujienos
    • Klaipėdos naujienos
    • Pajūrio naujienos
    • Palangos naujienos
    • Panevėžio naujienos
    • Radviliškio naujienos
    • Šiaulių naujienos
    • Varėnos naujienos
    • Vilniaus naujienos
  • Naujausios
  • Naujienos Lietuvoje
  • Pasaulio naujienos
  • Politika
  • Pranešimai spaudai
  • Sporto naujienos
  • Technologijos ir Mokslas
    • Dirbtinis intelektas
    • Kriptovaliutos
    • Metaverse
    • SpaceX
  • Ukrainos naujienos
  • Verslo žinios

Partneriai

  • Zinoti.lt
  • Kosmetika | Pickcartline
  • AOGX | Ark of Genesis
  • CBDnutzen.de
  • Maisto papildai | Boostexter.com
  • Reidas Official
  • OHOHO.lt

Tiksaviems yra karščiausių naujienų šiandien portalas, kurio tikslas - pateikti savo skaitytojams naujienas iš viso pasaulio. Apžvelgiame viską - nuo politinių naujienų iki gyvenimo būdo turinio.

Naujienos

  • VMVT sustabdė greitojo maisto restorano veiklą, kuris tiekė maistą neveikiant vandentiekiui
  • Rimtas užmojis: plynėje kurs pasaulinio lygio meno centrą
  • „Makaronų tiltai 2026“ Troškūnų Kazio Inčiūros gimnazijoje

Kategorijos

Naujausi komentarai

  • Buvusi koncerte apie Žolinių ir Svėdasų 522-ojo gimtadienio šventė
  • Negali būti apie Pasipiktino mamos elgesiu Nidos kavinėje: kur valgau – ten kakoju, kitą kartą galima ant stalo
  • Kipras apie Pasipiktino mamos elgesiu Nidos kavinėje: kur valgau – ten kakoju, kitą kartą galima ant stalo
  • Reklama
  • Apie mus
  • Privatumo politika
  • Kontaktai

© 2025 Tiksaviems - Karščiausios naujienos šiandien. Visos teisės saugomos. Ukmergės žinios - Jonavos žinios - German News - Spain News - Travels

Sveiki sugrįžę!

Prisijungti su Google
Arba

Prisijunkite

Pamiršote slaptažodį?

Retrieve your password

Please enter your username or email address to reset your password.

Turite paskyrą? Prisijunkite
Tvarkyti sutikimą
Siekdami teikti geriausią patirtį, įrenginio informacijai saugoti ir (arba) pasiekti naudojame tokias technologijas kaip slapukus. Jei sutiksime su šiomis technologijomis, galėsime apdoroti duomenis, tokius kaip naršymo elgsena arba unikalūs ID šioje svetainėje. Nesutikimas arba sutikimo atšaukimas gali neigiamai paveikti tam tikras funkcijas ir funkcijas.
Funkcinis Visada aktyvus
Techninė saugykla arba prieiga yra griežtai būtina siekiant teisėto tikslo – sudaryti sąlygas naudotis konkrečia paslauga, kurios aiškiai paprašė abonentas arba naudotojas, arba tik tam, kad būtų galima perduoti ryšį elektroninių ryšių tinklu.
Parinktys
Techninė saugykla arba prieiga yra būtina teisėtam tikslui išsaugoti nuostatas, kurių neprašo abonentas ar vartotojas.
Statistika
Techninė saugykla arba prieiga, kuri naudojama tik statistiniais tikslais. Techninė saugykla arba prieiga, kuri naudojama tik anoniminiais statistikos tikslais. Be teismo šaukimo, jūsų interneto paslaugų teikėjo savanoriško įsipareigojimo ar papildomų įrašų iš trečiosios šalies, vien šiuo tikslu saugoma ar gauta informacija paprastai negali būti naudojama jūsų tapatybei nustatyti.
Rinkodara
Techninė saugykla arba prieiga reikalinga norint sukurti naudotojo profilius reklamai siųsti arba sekti vartotoją svetainėje ar keliose svetainėse panašiais rinkodaros tikslais.
  • Tvarkyti parinktis
  • Tvarkyti paslaugas
  • Tvarkyti {vendor_count} pardavėjus
  • Skaitykite daugiau apie šiuos tikslus
Peržiūrėti nuostatas
  • {title}
  • {title}
  • {title}
No Result
View All Result
  • Naujausios
  • Naujienos Lietuvoje
  • Pasaulio naujienos
  • Ukrainos naujienos
  • Politika
  • Verslo žinios
  • Kriminalai
  • Gyvenimo būdas
  • Laisvalaikis
  • Gyvūnai
  • Kelionės
  • Technologijos ir Mokslas
    • Kriptovaliutos
    • Dirbtinis intelektas
    • Metaverse
    • SpaceX
  • Maistas ir Receptai
  • Muzika ir Filmai
  • Namai ir Statybos
  • Psichologija
  • Šeima
  • Stilius ir Grožis
  • Sveikata
  • Transportas
  • Žmonės
  • Horoskopai
  • Įdomybės
  • Miestai
    • Alytaus naujienos
    • Kaišiadorių naujienos
    • Kauno naujienos
    • Klaipėdos naujienos
    • Pajūrio naujienos
    • Palangos naujienos
    • Panevėžio naujienos
    • Radviliškio naujienos
    • Raseinių naujienos
    • Šiaulių naujienos
    • Varėnos naujienos
    • Vilniaus naujienos
  • Pranešimai spaudai
  • Sporto naujienos
Reklamos įkainiai
Kontaktai

© 2025 Tiksaviems - Karščiausios naujienos šiandien. Visos teisės saugomos. Ukmergės žinios - Jonavos žinios - German News - Spain News - Travels