EmotionPrompt metodo iliustracija. Kreditas: Li ir kt. arXiv (2023). DOI: 10.48550/arxiv.2307.11760 Nuo tada, kai atsirado OpenAI ChatGPT, didelių kalbų modeliai (LLM) tapo labai populiarūs. Šie modeliai, parengti naudojant didžiulius duomenų kiekius, gali atsakyti į vartotojų rašytines užklausas stulbinančiai žmogiškais būdais, greitai generuodami konkrečių terminų apibrėžimus, teksto santraukas, konkrečius pasiūlymus, mitybos planus ir daug daugiau.
Nors buvo nustatyta, kad šie modeliai puikiai veikia daugelyje sričių, jų reakcija į emocinius dirgiklius tebėra menkai ištirta. „Microsoft“ ir CAS programinės įrangos instituto tyrėjai neseniai sukūrė metodą, kuris galėtų pagerinti LLM ir žmonių vartotojų sąveiką, leisdamas jiems reaguoti į žmonių vartotojų pateiktus emocijomis pagrįstus, psichologija pagrįstus raginimus.
„LLM pasiekė reikšmingų rezultatų daugelyje sričių, tokių kaip samprotavimas, kalbos supratimas ir matematikos problemų sprendimas, ir yra laikomi esminiu žingsniu į dirbtinį bendrąjį intelektą (AGI)“, – savo darbe rašė Cheng Li, Jindong Wang ir jų kolegos. , iš anksto paskelbta arXiv. „Tačiau LLM jautrumas raginimams tebėra pagrindinė kliūtis kasdieniniam jų priėmimui. Šiame darbe įkvėpimo semiamės iš psichologijos ir siūlome „EmotionPrompt” ištirti emocinį intelektą, kad pagerintume LLM veiklą.”
Li, Wang ir jų kolegų sukurtas metodas, pavadintas EmotionPrompt, įkvėpimo semiasi iš nusistovėjusių žinių, kurių šaknys yra psichologijoje ir socialiniuose moksluose. Pavyzdžiui, ankstesniuose psichologijos tyrimuose nustatyta, kad padrąsinantys žodžiai ir kiti emociniai dirgikliai gali turėti teigiamą poveikį įvairioms žmogaus gyvenimo sritims, pavyzdžiui, pagerinti mokinių pažymius, skatinti sveikesnio gyvenimo būdo pasirinkimą ir pan.
Norėdami išsiaiškinti, ar emociniai raginimai taip pat gali turėti įtakos LLM veiklai, tyrėjai pateikė 11 emocingų sakinių, kuriuos būtų galima pridėti prie tipiškų raginimų, pateikiamų modeliams. Tai buvo tokie sakiniai kaip „tai labai svarbu mano karjerai“, „geriau būkite tikri“, „didžiuokis savo darbu ir duoti jam viską, ką gali“ ir „priimk iššūkius kaip augimo galimybes“.
Šie sakiniai buvo paimti iš esamos psichologijos literatūros, tokios kaip socialinės tapatybės teorija, kurią aštuntajame dešimtmetyje pristatė Henri Tajfel ir John Turner, socialinio pažinimo teorija ir kognityvinių emocijų reguliavimo teorija. Tada mokslininkai pridėjo šiuos sakinius prie raginimų, išsiųstų įvairiems LLM, kurie paprašė modelių atlikti skirtingas kalbos užduotis.
Iki šiol jie išbandė savo požiūrį keturiuose skirtinguose modeliuose: ChatGPT , Vicuna-13b, Bloom ir Flan-T5-Large. Apskritai jie nustatė, kad tai pagerino šių modelių našumą atliekant aštuonias skirtingas užduotis ir padidino jų atsakymų tikslumą daugiau nei 10 % atliekant daugiau nei pusę šių užduočių.
„EmotionPrompt veikia pagal nepaprastai paprastą principą: emocinio stimulo įtraukimas į raginimus“, – rašė Li, Wang ir jų kolegos. „Eksperimentiniai rezultatai rodo, kad mūsų EmotionPrompt, naudojant tuos pačius vieno raginimo šablonus, žymiai pranoksta originalų nulinio šūvio raginimą ir „Zero-shot-CoT” atliekant aštuonias užduotis su skirtingais modeliais: ChatGPT, Vicuna-13b, Bloom ir T5. Be to, EmotionPrompt buvo pastebėta, kad pagerina teisingumą ir informatyvumą“.
Šios tyrėjų komandos sukurtas naujas požiūris netrukus galėtų paskatinti papildomus tyrimus, kuriais siekiama pagerinti žmogaus ir LLM sąveiką, įvedant emocinius / psichologinius nurodymus. Nors iki šiol surinkti rezultatai yra daug žadantys, reikės atlikti tolesnius tyrimus, kad būtų patvirtintas jo veiksmingumas ir apibendrinimas.
„Šis darbas turi keletą apribojimų“, – savo darbe daro išvadą tyrėjai. „Pirma, mes eksperimentuojame tik su keturiais LLM ir atliekame eksperimentus atlikdami keletą užduočių su keliais bandymų pavyzdžiais, kurie yra riboti. Taigi mūsų išvados apie emocijų stimulą gali būti naudingos tik mūsų eksperimentams, o bet kokie LLM ir duomenų rinkiniai, nepatenkantys į šio dokumento sritį, gali Antra, šiame dokumente siūlomas emocinis stimulas gali būti ne bendras kitoms užduotims, o mokslininkai gali pasiūlyti kitų naudingų jūsų užduočių pakaitalų.
Daugiau informacijos: Cheng Li ir kt., EmotionPrompt: Psichologijos panaudojimas didelėms kalbų modeliams stiprinti naudojant emocinį stimulą, arXiv (2023). DOI: 10.48550/arxiv.2307.11760
Žurnalo informacija: arXiv
© „Science X Network“, 2023 m
Citata: Emocinių dirgiklių padavimo dideliems kalbos modeliams poveikio tyrinėjimas (2023 m. rugpjūčio 6 d.), gautas 2023 m. rugpjūčio 6 d. iš https://techxplore.com/news/2023-08-exploring-effects-emotional-stimuli-large.html
Šis dokumentas yra saugomas autorių teisių. Išskyrus bet kokius sąžiningus sandorius privačių studijų ar mokslinių tyrimų tikslais, jokia dalis negali būti atkuriama be raštiško leidimo. Turinys pateikiamas tik informaciniais tikslais.