pateikė Beijing Zhongke Journal Publising Co. Ltd.
Atitinkamos AI apima AlphaGo, AlphaGo Zero, AlphaZero, Libratus, DeepStack, DouZero, Suphx, FTW, AlphaStar, OpenAI Five, JueWu1 ir Commander. Kreditas: Beijing Zhongke Journal Publising Co. Žmogaus ir kompiuterio žaidimai turi ilgą istoriją ir buvo pagrindinė priemonė patikrinti pagrindines dirbtinio intelekto technologijas. 1950 m. pasiūlytas Turingo testas buvo pirmasis žmogaus ir kompiuterio žaidimas, leidžiantis įvertinti, ar mašina turi žmogaus intelektą. Tai įkvėpė tyrėjus sukurti AI sistemas (AI), kurios gali mesti iššūkį profesionaliems žaidėjams.
Tipiškas pavyzdys yra šaškių dirbtinis intelektas, vadinamas Chinook, kuris buvo sukurtas 1989 m., siekiant nugalėti pasaulio čempioną. Tikslas buvo pasiektas, kai 1994 m. ji įveikė Marion Tinsley. Vėliau „Deep Blue“ iš IBM įveikė šachmatų didmeistrią Garį Kasparovą 1997 m., nustatydama naują erą žmonių ir kompiuterių žaidimų istorijoje.
Pastaraisiais metais mokslininkai stebėjo spartų žmogaus ir kompiuterio žaidimų AI vystymąsi – nuo DQN agento, AlphaGo, Libratus ir OpenAI Five iki AlphaStar. Šios AI gali nugalėti profesionalius žaidėjus tam tikruose žaidimuose su modernių technikų deriniu, o tai rodo didelį žingsnį sprendimų priėmimo žvalgybos srityje.
Pavyzdžiui, „AlphaGo Zero“, kuri naudoja Monte Karlo medžio paiešką, savarankišką žaidimą ir gilų mokymąsi, nugali dešimtis profesionalių žaidėjų, atstovaujančių galingus metodus dideliems tobuliems informaciniams žaidimams. „OpenAI Five“, naudodamas savarankišką žaidimą, gilų mokymąsi ir nuolatinį perkėlimą per operaciją, tapo pirmuoju dirbtiniu intelektu, įveikusiu pasaulio čempionus el. sporto žaidime, pateikdamas naudingus sudėtingų netobulų informacinių žaidimų metodus.
Po AlphaStar ir OpenAI Five sėkmės, kurios atitinkamai pasiekia profesionalų žaidėjo lygį žaidimuose StarCraft ir Dota2, atrodo, kad dabartiniai metodai gali išspręsti labai sudėtingus žaidimus. Ypač naujausių žmonių ir kompiuterių žaidimų AI, skirtų tokiems žaidimams kaip „Honor of Kings“ ir „Mahjong“, proveržis paklūsta panašioms „AlphaStar“ ir „OpenAI Five“ sistemoms, o tai rodo tam tikrą dabartinių technikų universalumo laipsnį.
Taigi kyla vienas natūralus klausimas: kokie galimi dabartinių žmogaus ir kompiuterio žaidimų technikos iššūkiai ir kokios yra ateities tendencijos? Paskelbtas naujas straipsnis Mašininio intelekto tyrimai siekia apžvelgti naujausias sėkmingas žmogaus ir kompiuterio žaidimų AI ir bando atsakyti į šį klausimą išsamiai analizuodamas dabartinius metodus.
Remiantis dabartiniu žmogaus ir kompiuterio žaidimų AI proveržiu (daugiausia publikuojama tokiuose žurnaluose kaip Mokslas ir Gamta), mokslininkai tiria keturis tipiškus žaidimų tipus, ty stalo žaidimus su Go; kortų žaidimai, tokie kaip „heads-up“ neribotas Texas hold′em (HUNL), „DouDiZhu“ ir „Mahjong“; pirmojo asmens šaudymo žaidimai (FPS) su „Quake III“ arena užfiksuojant vėliavą (CTF); realaus laiko strateginiai žaidimai (RTS) su StarCraft, Dota2 ir Honor of Kings. Atitinkamos AI apima AlphaGo, AlphaGo Zero, AlphaZero, Libratus, DeepStack, DouZero, Suphx, FTW, AlphaStar, OpenAI Five, JueWu ir Commander.
Likusi straipsnio dalis yra išdėstyta taip. 2 skyriuje mokslininkai aprašo žaidimus ir dirbtinį intelektą, aptartus šiame dokumente. Remiantis naujausia žmogaus ir kompiuterio žaidimų AI pažanga, šiame dokumente apžvelgiami keturi žaidimų tipai ir juos atitinkantys AI, ty stalo žaidimai, kortų žaidimai, FPS žaidimai ir RTS žaidimai. Norėdami įvertinti, kaip sunku žaidime sukurti profesionalų žmogaus lygio dirbtinį intelektą, mokslininkai išskiria kelis pagrindinius veiksnius, kurie iššaukia protingą sprendimų priėmimą, ty netobula informacija, ilgas laiko tarpas, tranzityvus žaidimas ir kelių agentų bendradarbiavimas.
3 skyrius yra apie stalo žaidimų AI. „AlphaGo“ serija sukurta remiantis Monte Karlo medžio paieška (MCTS), kuri plačiai naudojama ankstesnėse „Go“ programose. „AlphaGo“ pasirodė 2015 m. ir įveikė Europos Go čempioną Fan Hui – tai buvo pirmas kartas, kai dirbtinis intelektas laimėjo prieš profesionalius žaidėjus viso dydžio žaidime „Go without Renzi“. Vėliau, naudojant skirtingas mokymosi sistemas, buvo sukurta pažangi versija, pavadinta AlphaGo Zero, kuriai nereikia išankstinių profesionalių žmonių konfrontacijos duomenų ir kuri pasiekia viršžmogišką darbą. AlphaZero naudoja panašią mokymosi sistemą kaip AlphaGo Zero ir tiria bendrą sustiprinimo mokymosi algoritmą, kuris įvaldo Go kartu su dar dviem stalo žaidimais, šachmatais ir Shogi.
4 skyriuje pristatomi kortų žaidimų AI. Kortų žaidimas, kaip tipiškas netobulas informacinis žaidimas, buvo ilgalaikis iššūkis dirbtiniam intelektui. DeepStack ir Libratus yra dvi tipiškos AI sistemos, kurios nugali profesionalius pokerio žaidėjus HUNL. Jie naudojasi ta pačia pagrindine technika, ty priešingos padėties apgailestavimo sumažinimu (CFR). Vėliau mokslininkai daugiausia dėmesio skiria Mahjong ir DouDiZhu, kurie kelia naujus iššūkius dirbtiniam intelektui. Suphx, sukurta Microsoft Research Asia, yra pirmoji AI sistema, kuri pranoksta daugumą geriausių Mahjong žaidėjų. „DouZero“, sukurta „DouDiZhu“, yra AI sistema, kuri užėmė pirmąją vietą „Botzone“ lyderių sąraše tarp 344 AI agentų.
Pirmojo asmens šaudymo žaidimų AI parodyta 5 skyriuje. CTF yra tipiškas trimatis kelių žaidėjų pirmojo asmens vaizdo žaidimas, kuriame dvi priešingos komandos kovoja viena prieš kitą patalpų arba lauko žemėlapiuose. CTF nustatymai labai skiriasi nuo dabartinių kelių žaidėjų vaizdo žaidimų. Tiksliau sakant, CTF agentai negali pasiekti kitų žaidėjų būsenos, o komandos agentai negali bendrauti vieni su kitais, todėl ši aplinka yra labai geras mokymosi agentų bandymų pagrindas, kad jie galėtų bendrauti ir prisitaikyti prie nulinės kartos. Nulinis šūvis reiškia, kad agentas, su kuriuo bendradarbiavo ar susidūrė, nėra apmokytas agentas, o tai gali būti žaidėjai ir savavališki AI agentai. Remiantis vien pikseliais ir žaidimo taškais, pavyzdžiui, žmogaus įvestimi, išmoktas agentas FTW pasiekia stiprų žmogaus lygio našumą.
6 skyrius yra apie RTS žaidimą. RTS žaidimas, kaip tipiškas vaizdo žaidimas, kuriame dešimtys tūkstančių žmonių kovoja vieni prieš kitus, natūraliai tampa žmonių ir kompiuterių žaidimų bandymų vieta. Be to, RTS žaidimai paprastai turi sudėtingą aplinką, kuri labiau atspindi realaus pasaulio prigimtį nei ankstesni žaidimai, todėl tokių žaidimų proveržis yra tinkamesnis. „DeepMind“ sukurta „AlphaStar“ naudoja bendruosius mokymosi algoritmus ir pasiekia didžiojo meistro lygį visose trijose „StarCraft“ lenktynėse, o tai taip pat lenkia 99,8% žaidėjų, kurie yra aktyvūs Europos serveryje. „Commander“, kaip lengva skaičiavimo versija, vadovaujasi ta pačia mokymosi architektūra kaip ir „AlphaStar“, kuri naudoja daug mažiau skaičiavimų ir pranoksta du žaidėjus „Grandmaster“ tiesioginiame renginyje. „OpenAI Five“ siekia išspręsti Dota2 žaidimą, kuris yra pirmoji dirbtinio intelekto sistema, nugalėjusi pasaulio čempionus eSporto žaidime. „Honor of Kings“ yra gana panašus į „Dota2“ el. sporto žaidimą, todėl jis susiduria su daugeliu panašių iššūkių, o „JueWu“ tampa pirmąja AI sistema, galinčia žaisti visus RTS žaidimus, o ne apriboti herojų grupę.
7 skyriuje mokslininkai apibendrina ir palygina įvairius naudojamus metodus. Remiantis dabartiniu žmogaus ir kompiuterio žaidimų AI proveržiu, šiuo metu naudojami metodai gali būti apytiksliai suskirstyti į dvi kategorijas, ty medžio paiešką (TS) su savarankišku žaidimu (SP) ir paskirstytą giluminį mokymąsi (DDRL) su žaidimu savarankiškai arba gyventojų žaidimas (PP). Reikėtų pažymėti, kad mokslininkai tiesiog pamini pagrindinius arba pagrindinius kiekvienos kategorijos metodus, kuriais remdamiesi skirtingi AI paprastai pateikia kitus pagrindinius modulius, pagrįstus žaidimais, ir tie nauji moduliai kartais nėra bendri žaidimams. Medžio paieška turi dviejų tipų reprezentacinius algoritmus: MCTS, paprastai naudojamas tobuliems informaciniams žaidimams, ir CFR, paprastai sukurtą netobuliems informaciniams žaidimams. Kalbant apie gyventojų žaidimą, jis naudojamas trimis atvejais: skirtingi žaidėjai/agentai nesidalija tuo pačiu politikos tinklu dėl žaidimo ypatybių; populiacijas galima išlaikyti, kad būtų galima įveikti žaidimo teorinius iššūkius, tokius kaip netranzityvumas; populiacijos derinamos su populiacija pagrįstu mokymu, skirtu išmokti keičiamo dydžio agentus. Palygindami mokslininkai aptaria du dalykus: kaip pasiekti Nash pusiausvyrą ir kaip tapti bendra technologija.
8 skyriuje mokslininkai parodo dabartinių žaidimų AI iššūkius, kurie gali būti būsima šios srities tyrimų kryptis. Nors žmonių ir kompiuterių žaidimų srityje padaryta didelė pažanga, dabartiniai metodai turi bent vieną iš trijų apribojimų. Pirma, dauguma dirbtinio intelekto yra sukurti konkrečiam žmogaus ir kompiuterio žaidimui arba konkretaus žaidimo žemėlapiui, o išmoktos AI negali būti naudojamos net skirtingiems žaidimo žemėlapiams. Be to, neatliekama pakankamai eksperimentų, kad būtų patvirtintas AI gebėjimas, kai į žaidimą atsiranda trikdžių. Antra, minėtų AI mokymas reikalauja daug skaičiavimo išteklių. Dėl didžiulio aparatinės įrangos išteklių slenksčio tik ribotas skaičius organizacijų gali mokyti aukšto lygio dirbtinį intelektą, o tai trukdys atlikti daugumą mokslinių tyrimų ir nuodugniai ištirti problemą. Trečia, dauguma dirbtinio intelekto yra vertinami pagal jų laimėjimą prieš ribotus profesionalius žaidėjus, o teiginys pasiekti eksperto lygį gali būti šiek tiek perdėtas. Šioje dalyje pateikiamos galimos kryptys ir iššūkiai, su kuriais susiduria aukščiau išvardyti apribojimai.
Šiame dokumente apibendrinami ir palyginami dabartinių AI proveržių žmogaus ir kompiuterio žaidimuose metodai. Atlikdami šią apklausą mokslininkai tikisi, kad pradedantieji galės greitai susipažinti su šios įdomios srities technikomis, iššūkiais ir galimybėmis, o būsimi mokslininkai gali būti įkvėpti gilesniems tyrimams.
Daugiau informacijos: Qi-Yue Yin ir kt., AI žmogaus ir kompiuterio žaidimuose: metodai, iššūkiai ir galimybės, Mašininio intelekto tyrimai (2023). DOI: 10.1007/s11633-022-1384-6
Pateikė Beijing Zhongke Journal Publising Co. Ltd.
Citata: AI žmonių ir kompiuterių žaidimuose: metodai, iššūkiai ir galimybės (2023 m., gruodžio 29 d.), gauta 2023 m. gruodžio 30 d. iš https://techxplore.com/news/2023-12-ai-humancomputer-gaming-techniques-opportunities.html
Šis dokumentas yra saugomas autorių teisių. Išskyrus bet kokius sąžiningus sandorius privačių studijų ar mokslinių tyrimų tikslais, jokia dalis negali būti atkuriama be raštiško leidimo. Turinys pateikiamas tik informaciniais tikslais.