Ilinojaus universiteto Aerokosminės inžinerijos katedra
Aerokosminės inžinerijos inžinierius Huy Tran ir jo kolegos išbandė savo algoritmus naudodami imituojamus žaidimus, pavyzdžiui, populiarų kompiuterinį žaidimą „StarCraft”. Kreditas: Ilinojaus universiteto Aerokosminės inžinerijos katedra Kai ryšio linijos atviros, atskiri agentai, pavyzdžiui, robotai ar dronai, gali bendradarbiauti ir atlikti užduotį. Tačiau ką daryti, jei jie neturi tinkamos techninės įrangos arba signalai blokuojami, todėl ryšys tampa neįmanomas? Ilinojaus Urbana-Šampanės universiteto tyrėjai ėmėsi šio sudėtingesnio uždavinio. Jie sukūrė metodą, leidžiantį išmokyti kelis agentus dirbti kartu, naudojant daugiaagentinį pastiprinimo mokymąsi – dirbtinio intelekto rūšį.
„Lengviau, kai agentai gali susikalbėti tarpusavyje”, – sakė Ilinojaus universiteto aerokosmoso inžinierius Huy Tran. „Tačiau mes norėjome tai padaryti decentralizuotai, t. y. kad jie tarpusavyje nesikalbėtų. Taip pat sutelkėme dėmesį į situacijas, kai nėra akivaizdu, kokie turėtų būti skirtingi agentų vaidmenys ar darbai.”
Tranas sakė, kad šis scenarijus yra daug sudėtingesnis ir sunkesnė problema, nes nėra aišku, ką vienas agentas turėtų daryti, palyginti su kitu agentu.”
„Įdomus klausimas – kaip laikui bėgant išmokti kartu atlikti užduotį, – sakė Tranas.
Tranas ir jo bendradarbiai šiai problemai spręsti pasitelkė mašininį mokymąsi, sukurdami naudingumo funkciją, kuri agentui nurodo, kada jis daro ką nors naudingo ar gero komandai.
„Esant komandiniams tikslams, sunku žinoti, kas prisidėjo prie pergalės, – sakė jis. „Mes sukūrėme mašininio mokymosi metodą, kuris leidžia mums nustatyti, kada atskiras agentas prisideda prie visuotinio komandos tikslo. Jei pažvelgtume į tai sporto požiūriu, vienas futbolininkas gali įmušti įvartį, tačiau mes taip pat norime žinoti apie kitų komandos draugų veiksmus, lėmusius įvartį, pavyzdžiui, perdavimus. Sunku suprasti šiuos uždelstus efektus.”
Kreditas: Ilinojaus universiteto Aerokosminės inžinerijos katedra Mokslininkų sukurti algoritmai taip pat gali nustatyti, kada agentas ar robotas atlieka veiksmus, kurie neprisideda prie tikslo. „Ne tiek svarbu, kad robotas pasirinko daryti kažką ne taip, tiesiog tai, kas nenaudinga galutiniam tikslui.”
Savo algoritmus jie išbandė naudodami imituojamus žaidimus, pavyzdžiui, „Capture the Flag” ir populiarų kompiuterinį žaidimą „StarCraft”
„StarCraft” gali būti šiek tiek labiau nenuspėjamas – mes džiaugėmės, kad mūsų metodas gerai veikia ir šioje aplinkoje.”
Tranas teigė, kad tokio tipo algoritmas gali būti taikomas daugelyje realių situacijų, pavyzdžiui, karinio stebėjimo, sandėlyje kartu dirbančių robotų, eismo signalų kontrolės, autonominių transporto priemonių, koordinuojančių krovinių pristatymą, ar elektros energijos tinklo valdymo srityse.”
Tranas teigė, kad Seung Hyun Kimas didžiąją dalį idėjos teorinių darbų atliko dar būdamas mechanikos inžinerijos bakalauro studentas, o ją įgyvendinti padėjo aeronautikos studentas Neale’as Van Stralenas. Tranas ir Girishas Chowdhary konsultavo abu studentus. Darbas neseniai buvo pristatytas dirbtinio intelekto bendruomenei recenzuojamoje konferencijoje „Autonomous Agents and Multi-Agent Systems”
Tyrimas „Disentangling Successor Features for Coordination in Multi-agent Reinforcement Learning” („Paveldėtojų funkcijų išskyrimas siekiant koordinavimo daugiaagentiniame pastiprinimo mokyme”) paskelbtas gegužės mėnesį vykusios 21st tarptautinės konferencijos „Autonomous Agents and Multi-Agent Systems” („Autonominiai agentai ir daugiaagentinės sistemos”) medžiagoje 2022.
Daugiau informacijos: Seung Hyun Kim et al, Disentangling Successor Features for Coordination in Multi-agent Reinforcement Learning. arXiv: 2202.07741v1 [cs.MA], arxiv.org/abs/2202.07741
Pateikė Ilinojaus universiteto Aviacijos ir kosmoso inžinerijos katedra. Dirbtinio intelekto naudojimas robotų komandoms mokyti dirbti kartu (2022, liepa 20) gauta rugpjūčio 1 d. 2022 iš https://techxplore.com/news/2022-07-artificial-intelligence-teams-robots.html
Šiam dokumentui taikomos autorių teisės. Be raštiško leidimo negalima atgaminti jokios jo dalies, išskyrus sąžiningą naudojimą asmeninėms studijoms ar moksliniams tyrimams. Turinys pateikiamas tik informaciniais tikslais.