Horoskopai
Pranešti naujieną
  • Prisijungti
Karščiausios naujienos šiandien
No Result
View All Result
Reklamos įkainiai
Kontaktai
  • Naujienos Lietuvoje
    • Kriminalai
    • Politika
  • Pasaulio naujienos
    • Ukrainos naujienos
  • Sporto naujienos
  • Įdomybės
  • Technologijos ir Mokslas
    • Kriptovaliutos
    • Dirbtinis intelektas
    • Metaverse
    • SpaceX
  • Gyvenimo būdas
    • Sveikata
    • Maistas ir Receptai
    • Muzika ir Filmai
    • Kelionės
    • Namai ir Statybos
    • Gyvūnai
    • Stilius ir Grožis
    • Psichologija
    • Šeima
    • Laisvalaikis
    • Įdomybės
    • Transportas
  • Verslo žinios
  • Miestai
    • Alytaus naujienos
    • Kaišiadorių naujienos
    • Kauno naujienos
    • Klaipėdos naujienos
    • Pajūrio naujienos
    • Palangos naujienos
    • Panevėžio naujienos
    • Radviliškio naujienos
    • Raseinių naujienos
    • Šiaulių naujienos
    • Varėnos naujienos
    • Vilniaus naujienos
  • Naujienos Lietuvoje
    • Kriminalai
    • Politika
  • Pasaulio naujienos
    • Ukrainos naujienos
  • Sporto naujienos
  • Įdomybės
  • Technologijos ir Mokslas
    • Kriptovaliutos
    • Dirbtinis intelektas
    • Metaverse
    • SpaceX
  • Gyvenimo būdas
    • Sveikata
    • Maistas ir Receptai
    • Muzika ir Filmai
    • Kelionės
    • Namai ir Statybos
    • Gyvūnai
    • Stilius ir Grožis
    • Psichologija
    • Šeima
    • Laisvalaikis
    • Įdomybės
    • Transportas
  • Verslo žinios
  • Miestai
    • Alytaus naujienos
    • Kaišiadorių naujienos
    • Kauno naujienos
    • Klaipėdos naujienos
    • Pajūrio naujienos
    • Palangos naujienos
    • Panevėžio naujienos
    • Radviliškio naujienos
    • Raseinių naujienos
    • Šiaulių naujienos
    • Varėnos naujienos
    • Vilniaus naujienos
Karščiausios naujienos šiandien
No Result
View All Result
Pagrindinis Technologijos ir Mokslas Dirbtinis intelektas

Toliaregiškas Požiūris į Mašininį Mokymąsi

Paskelbė Naujienų portalas Tiksaviems
2022-11-23
in Dirbtinis intelektas
Skaitymo laikas: 5 min.
523
A A
0
Toliaregiškas Požiūris į Mašininį Mokymąsi

Įsivaizduokite dvi komandas, kurios rungtyniauja futbolo aikštėje. Žaidėjai gali bendradarbiauti siekdami tikslo ir konkuruoti su kitais žaidėjais, kurių interesai prieštarauja. Taip ir veikia žaidimas.

Sukurti dirbtinio intelekto agentus, kurie išmoktų konkuruoti ir bendradarbiauti taip pat veiksmingai kaip žmonės, tebėra sudėtinga problema. Pagrindinis iššūkis yra leisti AI agentams numatyti būsimą kitų agentų elgesį, kai jie visi mokosi vienu metu.

TAU TAIP PAT GALI PATIKTI

Nuo iliuzijos iki realybės: kaip dirbtinis intelektas keičia žaidimų industriją

Komisija nubrėžia kelią Europos lyderystei dirbtinio intelekto srityje – pristatytas ambicingas „Dirbtinio intelekto žemyno veiksmų planas“

Dėl šios problemos sudėtingumo dabartiniai metodai yra trumparegiški; agentai gali tik atspėti keletą artimiausių savo komandos draugų ar konkurentų judesių, o tai ilgainiui lemia prastus rezultatus.

Mokslininkai iš MIT, MIT-IBM Watson AI Lab ir kitur sukūrė naują metodą, suteikiantį AI agentams toliaregišką perspektyvą. Jų mašininio mokymosi sistema leidžia bendradarbiaujantiems ar konkurencingiems dirbtinio intelekto agentams apsvarstyti, ką kiti agentai darys laikui artėjant prie begalybės, o ne tik atlikdami kelis tolesnius veiksmus. Tada agentai atitinkamai pritaiko savo elgesį, kad paveiktų kitų agentų elgesį ateityje ir rastų optimalų, ilgalaikį sprendimą.

Šią sistemą galėtų naudoti autonominių bepiločių orlaivių grupė, dirbanti kartu, kad surastų pasiklydusį keliautoją tankiame miške, arba savarankiškai važiuojantys automobiliai, kurie stengiasi užtikrinti keleivių saugumą, numatydami būsimų kitų transporto priemonių, važiuojančių judriu greitkeliu, judėjimą.

„Kai dirbtinio intelekto agentai bendradarbiauja arba konkuruoja, svarbiausia, kada ateityje jų elgesys susilieja. Kelyje yra daug laikinų elgsenų, kurios ilgainiui neturi didelės reikšmės. Mums iš tikrųjų rūpi pasiekti tokį suderintą elgesį, ir dabar turime matematinį būdą tai padaryti“, – sako Dong-Ki Kimas, MIT informacijos ir sprendimų sistemų laboratorijos (LIDS) absolventas ir pagrindinis straipsnio autorius. aprašant šią sistemą.

Vyresnysis autorius yra Jonathanas P. Howas, Richardo C. Maclaurino aeronautikos ir astronautikos profesorius ir MIT-IBM Watson AI laboratorijos narys. Tarp bendraautorių yra kiti iš MIT-IBM Watson AI Lab, IBM tyrimų, Mila-Quebec dirbtinio intelekto instituto ir Oksfordo universiteto. Tyrimas bus pristatytas Neuroninių informacijos apdorojimo sistemų konferencijoje.

Šiame demonstraciniame vaizdo įraše raudonasis robotas, kuris buvo apmokytas naudojant tyrėjų mašininio mokymosi sistemą, gali nugalėti žaliąjį robotą išmokdamas efektyvesnio elgesio, kuris pasinaudoja nuolat besikeičiančia priešininko strategija.

Daugiau agentų, daugiau problemų

Tyrėjai sutelkė dėmesį į problemą, vadinamą kelių agentų sustiprinimo mokymusi. Sustiprinimo mokymasis yra mašininio mokymosi forma, kai AI agentas mokosi bandymų ir klaidų būdu. Tyrėjai suteikia agentui atlygį už „gerą“ elgesį, padedantį pasiekti tikslą. Agentas pritaiko savo elgesį, kad padidintų tą atlygį, kol galiausiai tampa užduoties ekspertu.

Tačiau kai daug bendradarbiaujančių ar konkuruojančių agentų vienu metu mokosi, viskas tampa vis sudėtingesnė. Kadangi agentai svarsto daugiau būsimų savo kolegų agentų žingsnių ir kaip jų pačių elgesys daro įtaką kitiems, problemai greitai reikia per daug skaičiavimo galios, kad ją būtų galima veiksmingai išspręsti. Štai kodėl kiti metodai yra skirti tik trumpam laikotarpiui.

„AI tikrai nori galvoti apie žaidimo pabaigą, bet jie nežino, kada žaidimas baigsis. Jie turi galvoti, kaip pritaikyti savo elgesį iki begalybės, kad ateityje galėtų laimėti. Mūsų dokumente iš esmės siūlomas naujas tikslas, leidžiantis dirbtiniam intelektui galvoti apie begalybę“, – sako Kim.

Tačiau kadangi neįmanoma įjungti begalybės į algoritmą, mokslininkai sukūrė savo sistemą taip, kad agentai sutelktų dėmesį į būsimą tašką, kuriame jų elgesys susilies su kitų agentų elgesiu, vadinamu pusiausvyra. Pusiausvyros taškas lemia ilgalaikį agentų veikimą, o kelių agentų scenarijuje gali egzistuoti kelios pusiausvyros. Todėl veiksmingas agentas aktyviai veikia kitų agentų elgesį ateityje taip, kad jie pasiektų pageidaujamą pusiausvyrą iš agento perspektyvos. Jei visi agentai daro įtaką vienas kitam, jie susilieja su bendra koncepcija, kurią mokslininkai vadina „aktyvia pusiausvyra“.

Jų sukurta mašininio mokymosi sistema, žinoma kaip TOLIAU (kuri reiškia VISIŠKAI stiprinančią aktyvią įtaką su vidutiniu atlygiu), leidžia agentams išmokti pritaikyti savo elgesį, kai jie sąveikauja su kitais agentais, kad pasiektų šią aktyvią pusiausvyrą.

FURTHER tai daro naudodamas du mašininio mokymosi modulius. Pirmasis, išvadų modulis, leidžia agentui atspėti būsimą kitų agentų elgesį ir jų naudojamus mokymosi algoritmus, remiantis tik jų ankstesniais veiksmais.

Ši informacija įvedama į sustiprinimo mokymosi modulį, kurį agentas naudoja pritaikydamas savo elgesį ir paveikti kitus agentus tokiu būdu, kuris maksimaliai padidintų jo atlygį.

„Iššūkis buvo mąstymas apie begalybę. Turėjome naudoti daugybę skirtingų matematinių įrankių, kad tai įgalintume, ir padaryti tam tikras prielaidas, kad tai veiktų praktiškai“, – sako Kim.

Laimėjimas ilgainiui

Jie išbandė savo požiūrį su kitomis kelių agentų sustiprinimo mokymosi sistemomis pagal kelis skirtingus scenarijus, įskaitant porą robotų, kovojančių sumo stiliumi, ir mūšį, kuriame dvi 25 agentų komandos susipriešina viena su kita. Abiem atvejais DI agentai, naudojantys FURTHER, dažniau laimėjo žaidimus.

Kadangi jų požiūris yra decentralizuotas, o tai reiškia, kad agentai išmoksta laimėti žaidimus savarankiškai, jis taip pat yra labiau keičiamas nei kiti metodai, kuriems reikalingas centrinis kompiuteris agentams valdyti, aiškina Kim.

Tyrėjai naudojo žaidimus, kad išbandytų savo požiūrį, tačiau TOLIAU galėtų būti naudojami bet kokios rūšies daugiafunkcėms problemoms spręsti. Pavyzdžiui, ją galėtų taikyti ekonomistai, siekiantys sukurti patikimą politiką situacijose, kai daugelis sąveikaujančių teisių turi elgseną ir interesus, kurie laikui bėgant keičiasi.

Ekonomika yra viena iš taikomųjų programų, kurias Kim ypač džiaugiasi studijomis. Jis taip pat nori gilintis į aktyvios pusiausvyros sampratą ir toliau tobulinti TOLESNIĄ sistemą.

Šį tyrimą iš dalies finansuoja MIT-IBM Watson AI Lab.

Dalintis211Dalintis132Siųsti
Sekantis
„Savi Saviems“ – Proga Parodyti Savo Talentą (Video)

„Savi Saviems“ – Proga Parodyti Savo Talentą (Video)

Parašykite komentarą Atšaukti atsakymą

El. pašto adresas nebus skelbiamas. Būtini laukeliai pažymėti *

Sutinku su taisyklėmis ir nuostatomis bei privatumo politika.

Naujausi komentarai

  • Buvusi koncerte apie Žolinių ir Svėdasų 522-ojo gimtadienio šventė
  • Negali būti apie Pasipiktino mamos elgesiu Nidos kavinėje: kur valgau – ten kakoju, kitą kartą galima ant stalo
  • Kipras apie Pasipiktino mamos elgesiu Nidos kavinėje: kur valgau – ten kakoju, kitą kartą galima ant stalo
  • EleanorViolet Violet apie Mes ne triušiukai su skeltom lupytėm ir ne ožkytės, kad salotų lapus valgyti prie cepelinų, blynų, košių
  • Ka apie Kodėl vis daugiau lietuvių perka Bitcoin

Tema

  • Gyvenimo būdas
    • Gyvūnai
    • Kelionės
    • Laisvalaikis
    • Maistas ir Receptai
    • Muzika ir Filmai
    • Namai ir Statybos
    • Psichologija
    • Šeima
    • Stilius ir Grožis
    • Sveikata
    • Transportas
    • Žmonės
  • Horoskopai
  • Įdomybės
  • Kriminalai
  • Miestai
    • Alytaus naujienos
    • Kaišiadorių naujienos
    • Kauno naujienos
    • Klaipėdos naujienos
    • Pajūrio naujienos
    • Palangos naujienos
    • Panevėžio naujienos
    • Radviliškio naujienos
    • Šiaulių naujienos
    • Varėnos naujienos
    • Vilniaus naujienos
  • Naujausios
  • Naujienos Lietuvoje
  • Pasaulio naujienos
  • Politika
  • Pranešimai spaudai
  • Sporto naujienos
  • Technologijos ir Mokslas
    • Dirbtinis intelektas
    • Kriptovaliutos
    • Metaverse
    • SpaceX
  • Ukrainos naujienos
  • Verslo žinios

Partneriai

  • Zinoti.lt
  • Kosmetika | Pickcartline
  • AOGX | Ark of Genesis
  • CBDnutzen.de
  • Maisto papildai | Boostexter.com
  • Reidas Official
  • OHOHO.lt

Tiksaviems yra karščiausių naujienų šiandien portalas, kurio tikslas - pateikti savo skaitytojams naujienas iš viso pasaulio. Apžvelgiame viską - nuo politinių naujienų iki gyvenimo būdo turinio.

Naujienos

  • „Makaronų tiltai 2026“ Troškūnų Kazio Inčiūros gimnazijoje
  • Istorija prasideda Kaišiadorių Vaclovo Giržado progimnazijoje… Ar būsi jos dalis?
  • UAB „Anykščių vandenys“ vandenį gyventojams teiks buteliais

Kategorijos

Naujausi komentarai

  • Buvusi koncerte apie Žolinių ir Svėdasų 522-ojo gimtadienio šventė
  • Negali būti apie Pasipiktino mamos elgesiu Nidos kavinėje: kur valgau – ten kakoju, kitą kartą galima ant stalo
  • Kipras apie Pasipiktino mamos elgesiu Nidos kavinėje: kur valgau – ten kakoju, kitą kartą galima ant stalo
  • Reklama
  • Apie mus
  • Privatumo politika
  • Kontaktai

© 2025 Tiksaviems - Karščiausios naujienos šiandien. Visos teisės saugomos. Ukmergės žinios - Jonavos žinios - German News - Spain News - Travels

Sveiki sugrįžę!

Prisijungti su Google
Arba

Prisijunkite

Pamiršote slaptažodį?

Retrieve your password

Please enter your username or email address to reset your password.

Turite paskyrą? Prisijunkite
Tvarkyti sutikimą
Siekdami teikti geriausią patirtį, įrenginio informacijai saugoti ir (arba) pasiekti naudojame tokias technologijas kaip slapukus. Jei sutiksime su šiomis technologijomis, galėsime apdoroti duomenis, tokius kaip naršymo elgsena arba unikalūs ID šioje svetainėje. Nesutikimas arba sutikimo atšaukimas gali neigiamai paveikti tam tikras funkcijas ir funkcijas.
Funkcinis Visada aktyvus
Techninė saugykla arba prieiga yra griežtai būtina siekiant teisėto tikslo – sudaryti sąlygas naudotis konkrečia paslauga, kurios aiškiai paprašė abonentas arba naudotojas, arba tik tam, kad būtų galima perduoti ryšį elektroninių ryšių tinklu.
Parinktys
Techninė saugykla arba prieiga yra būtina teisėtam tikslui išsaugoti nuostatas, kurių neprašo abonentas ar vartotojas.
Statistika
Techninė saugykla arba prieiga, kuri naudojama tik statistiniais tikslais. Techninė saugykla arba prieiga, kuri naudojama tik anoniminiais statistikos tikslais. Be teismo šaukimo, jūsų interneto paslaugų teikėjo savanoriško įsipareigojimo ar papildomų įrašų iš trečiosios šalies, vien šiuo tikslu saugoma ar gauta informacija paprastai negali būti naudojama jūsų tapatybei nustatyti.
Rinkodara
Techninė saugykla arba prieiga reikalinga norint sukurti naudotojo profilius reklamai siųsti arba sekti vartotoją svetainėje ar keliose svetainėse panašiais rinkodaros tikslais.
  • Tvarkyti parinktis
  • Tvarkyti paslaugas
  • Tvarkyti {vendor_count} pardavėjus
  • Skaitykite daugiau apie šiuos tikslus
Peržiūrėti nuostatas
  • {title}
  • {title}
  • {title}
No Result
View All Result
  • Naujausios
  • Naujienos Lietuvoje
  • Pasaulio naujienos
  • Ukrainos naujienos
  • Politika
  • Verslo žinios
  • Kriminalai
  • Gyvenimo būdas
  • Laisvalaikis
  • Gyvūnai
  • Kelionės
  • Technologijos ir Mokslas
    • Kriptovaliutos
    • Dirbtinis intelektas
    • Metaverse
    • SpaceX
  • Maistas ir Receptai
  • Muzika ir Filmai
  • Namai ir Statybos
  • Psichologija
  • Šeima
  • Stilius ir Grožis
  • Sveikata
  • Transportas
  • Žmonės
  • Horoskopai
  • Įdomybės
  • Miestai
    • Alytaus naujienos
    • Kaišiadorių naujienos
    • Kauno naujienos
    • Klaipėdos naujienos
    • Pajūrio naujienos
    • Palangos naujienos
    • Panevėžio naujienos
    • Radviliškio naujienos
    • Raseinių naujienos
    • Šiaulių naujienos
    • Varėnos naujienos
    • Vilniaus naujienos
  • Pranešimai spaudai
  • Sporto naujienos
Reklamos įkainiai
Kontaktai

© 2025 Tiksaviems - Karščiausios naujienos šiandien. Visos teisės saugomos. Ukmergės žinios - Jonavos žinios - German News - Spain News - Travels