Naudojant naują trupmeninės galios atnaujinimo taisyklę (FPUR), pagerėja kartotinių mokymosi sistemų (ILC) konvergencija. Vaizdo antraštė: naujasis FPUR leidžia ILC mokytis greičiau ir efektyviau nei įprastai naudojama proporcinio tipo atnaujinimo taisyklė (PTUR). Kreditas: Zihan Li, Dong Shen ir Xinghuo Mokytis iš praeities klaidų galima ne tik žmonėms. Kompiuteriai taip pat tai daro. Pramonės šakose tai atliekama naudojant kompiuterines valdymo sistemas, kurios padeda valdyti gamybos sistemas. Pramoniniams robotams, kurie atlieka konkrečias užduotis partijomis, pavyzdžiui, gamina drabužius, kompiuterių lustus ar kepinius, dažniausiai naudojama valdymo technika yra kartotinis mokymosi valdymas (ILC). Dauguma pramonės šakų vis dar remiasi ILC sistemomis, kurios naudoja mokymosi strategiją, vadinamą proporcingo tipo atnaujinimo taisykle (PTUR). Šis metodas pagerina ILC sistemų našumą, kartodamas tą pačią užduotį ir atnaujindamas valdymo įvestį pagal ankstesnių iteracijų klaidas.
Tačiau ši kontrolės metodika buvo pasiūlyta dešimtmečiais praeityje. Kadangi ILC sistemos vis dažniau naudojamos sudėtingesnėms užduotims atlikti, reikia technikų, kurios galėtų mokytis greičiau ir tiksliau.
Per neseniai įvykusį proveržį mokslininkų grupė pasiūlė naują metodą, kuris naudoja trupmeninės galios atnaujinimo taisyklę (FPUR), kad padidintų vieno įvesties ir vienos išvesties linijinių ILC sistemų našumą. Tyrimas buvo paskelbtas IEEE/CAA žurnalas Automatica Sinica.
Konvergencijos rodikliai – greitis, kuriuo skirtumas tarp norimos išvesties ir faktinės produkcijos laikui bėgant mažėja – vaidina lemiamą vaidmenį apibrėžiant ILC sistemos efektyvumą. Esami konvergencijos greičio gerinimo metodai dažnai būna nepatenkinami situacijose, kurioms reikalingas didelis tikslumas. Net ir nuolatinio arba rankiniu būdu pasirinkto mokymosi laimėjimo atveju, dabartinės ILC sistemos, kurios naudoja linijinį atnaujinimo metodą, nesugeba iki galo išnaudoti turimos informacijos. Todėl mokslininkai ištyrė ne tik PTUR metodus, bet naudojo netiesinius atnaujinimo metodus, kad išmoktų ir pasiektų norimą rezultatą.
Trupmeninės galios ir proporcinio tipo (P tipo) atnaujinimo taisyklių tikslumo kreivių stebėjimas pagal skirtingas trupmenines galias. Vaizdo antraštė: Kinijos ir Australijos mokslininkai pademonstravo metodą, kuris naudoja trupmeninės galios atnaujinimo taisyklę, kad pagerintų pasikartojančių mokymosi valdymo sistemų našumą. Kreditas: Zihan Li, Dong Shen ir Xinghuo Yu „Tradicinis PTUR naudoja linijinį stebėjimo klaidos terminą, kad atnaujintų valdymo įvestį. Kita vertus, FPUR naudoja trupmeninį terminą naujinimui. Kadangi bet koks teigiamas skaičius, mažesnis už vieną, turi didesnę trupmeninę galią nei jis pats, FPUR atnaujinimo intensyvumas yra didesnis nei PTUR dėl mažų sekimo klaidų, todėl konvergencijos greitis yra greitesnis“, – aiškina Zihan Li, pagrindinis tyrimo autorius ir Kinijos Renmino universiteto Matematikos mokyklos magistrantūros studentas.
Komanda sukūrė naują FPUR metodą, įkvėptą naujesnių baigtinio laiko valdymo (FTC) ir terminalo slankiojančio režimo valdymo (TSMC) strategijų, kurios yra galimos anksčiau paminėtoms problemoms įveikti ir konvergencijos greičiui pagerinti. Mokslininkai taip pat taikė netiesinio kartografavimo metodą, kad ištirtų klaidų dinamiką laikui bėgant. Šis metodas leido jiems pranešti apie greitą konvergencijos našumą ir apibūdinti galimus ribinius stebėjimo klaidų ciklus ILC sistemose. Be to, siekiant patvirtinti naujojo metodo veiksmingumą, taip pat buvo atliktas skaitmeninis modeliavimas.
Paklaustas apie tai, kaip siūloma sistema pakeistų ILC sistemų sritį, Li sako: „Šis tyrimas turi tris pagrindinius tikslus. Pirma, jame pateikiamas algoritmas, kuris naudoja netiesinio atnaujinimo metodą, kad pagerintų mokymosi gebėjimus. Antra, jis parodo, kad prisitaikymas trupmeninės galios terminai leidžia reguliuoti konvergencijos greitį pagal faktinį našumą. Ir galiausiai, jis pasižymi dideliu konvergencijos greičiu, lygiaverčiu FTC ir TMSC.
Šis tyrimas pirmą kartą parodė, kad FPUR naudojamas ILC vieno įvesties ir vieno išvesties linijinėse sistemose. Siūloma technika gali būti naudojama kitose pasikartojančiose sistemose, tokiose kaip autonominės transporto priemonės, nepilotuojami orlaiviai ir reabilitacijos robotai.
Daugiau informacijos: Zihan Li ir kt., Iteratyvaus mokymosi kontrolės tobulinimas trupmeninės galios atnaujinimo įstatymu, IEEE/CAA žurnalas Automatica Sinica (2023). DOI: 10.1109/JAS.2023.123525
Teikia Cactus Communications
Citata: nauja technika, skirta pagerinti pasikartojančias užduotis atliekančių robotų mokymosi gebėjimus (2023 m., birželio 5 d.), gauta 2023 m. birželio 5 d. iš https://techxplore.com/news/2023-06-technique-ability-robots-repetitive-tasks. html
Šis dokumentas yra saugomas autorių teisių. Išskyrus bet kokius sąžiningus sandorius privačių studijų ar mokslinių tyrimų tikslais, jokia dalis negali būti atkuriama be raštiško leidimo. Turinys pateikiamas tik informaciniais tikslais.