Norimo vaizdo gavimas gali būti ilgas bandymų ir klaidų pratimas. Kreditas: OpenAI Meno kūrimas naudojant dirbtinį intelektą nėra naujiena. Jis toks pat senas, kaip ir pats AI.
Nauja yra tai, kad įrankių banga dabar leidžia daugumai žmonių generuoti vaizdus įvedant teksto raginimą. Tereikia į teksto laukelį įrašyti „van Gogho stiliaus peizažas“, ir AI gali sukurti gražų vaizdą, kaip nurodyta.
Šios technologijos galia slypi gebėjime naudoti žmonių kalbą meno kūrimui valdyti. Bet ar šios sistemos tiksliai išverčia menininko viziją? Ar kalbos įtraukimas į meno kūrimą iš tiesų gali lemti meninius proveržius?
Inžineriniai išėjimai
Daugelį metų dirbau su generatyviuoju dirbtiniu intelektu kaip menininkas ir kompiuterių mokslininkas, ir manyčiau, kad šis naujo tipo įrankis riboja kūrybinį procesą.
Kai rašote tekstinį raginimą sukurti vaizdą naudodami AI, yra begalinės galimybės. Jei esate atsitiktinis naudotojas, galite būti patenkinti tuo, ką jums sukuria AI. Pradedantieji ir investuotojai į šią technologiją įleido milijardus, matydami, kad tai paprastas būdas sukurti straipsnių, vaizdo žaidimų personažų ir reklamų grafiką.
Priešingai, menininkui gali tekti parašyti esė panašų raginimą, kad būtų sukurtas aukštos kokybės vaizdas, atspindintis jų viziją – naudojant tinkamą kompoziciją, tinkamą apšvietimą ir tinkamą atspalvį. Šis ilgas raginimas nebūtinai apibūdina vaizdą, bet paprastai naudoja daug raktinių žodžių, kad iškviestų menininko mintyse esančią sistemą. Tam yra palyginti naujas terminas: greita inžinerija.
Iš esmės šiuos įrankius naudojančio menininko vaidmuo yra sumažintas iki sistemos atvirkštinės inžinerijos, siekiant rasti tinkamus raktinius žodžius, kurie priverstų sistemą generuoti norimą rezultatą. Norint rasti tinkamus žodžius, reikia daug pastangų ir daug bandymų bei klaidų.
AI nėra toks protingas, kaip atrodo
Norint sužinoti, kaip geriau valdyti išvestis, svarbu pripažinti, kad dauguma šių sistemų yra apmokytos naudojant vaizdus ir antraštes iš interneto.
Pagalvokite, ką apie vaizdą pasakoja tipiškas vaizdo antraštė. Antraštės paprastai rašomos siekiant papildyti vaizdinę žiniatinklio naršymo patirtį.
Pavyzdžiui, antraštėje gali būti aprašytas fotografo ir autorių teisių turėtojo vardas. Kai kuriose svetainėse, pvz., „Flickr“, antraštė paprastai apibūdina fotoaparato tipą ir naudojamą objektyvą. Kitose svetainėse antraštė apibūdina grafinį variklį ir aparatinę įrangą, naudojamą vaizdui pateikti.
Generatyvusis dirbtinis intelektas laikomas perspektyvia priemone sugalvoti vaizdo žaidimų personažus. Kreditas: Benlisquare / Wikimedia Commons, CC BY-SA Taigi, norėdami parašyti naudingą teksto raginimą, vartotojai turi įterpti daug neaprašomųjų AI sistemos raktinių žodžių, kad sukurtų atitinkamą vaizdą.
Šiandieninės AI sistemos nėra tokios protingos, kaip atrodo; iš esmės tai yra išmaniosios paieškos sistemos, turinčios didžiulę atmintį ir veikiančios pagal asociacijas.
Menininkai nusivylę kontrolės stoka
Ar tai tikrai tokia priemonė, kuri gali padėti menininkams sukurti puikius darbus?
Mano įkurtoje generatyvaus AI meno platformoje Playform AI atlikome apklausą, kad geriau suprastume menininkų patirtį naudojant generatyvųjį AI. Surinkome atsakymus iš daugiau nei 500 skaitmeninių menininkų, tradicinių tapytojų, fotografų, iliustratorių ir grafikos dizainerių, kurie, be kita ko, naudojo tokias platformas kaip DALL-E, Stable Diffusion ir Midjourney.
Tik 46 % respondentų mano, kad tokie įrankiai yra „labai naudingi“, o 32 % – šiek tiek naudingi, bet negalėjo jų integruoti į savo darbo eigą. Likusiems naudotojams – 22 % – jie visai nenaudingi.
Pagrindinis menininkų ir dizainerių akcentuotas apribojimas buvo kontrolės trūkumas. Skalėje nuo 0 iki 10, kai 10 buvo daugiausiai kontrolės, respondentai apibūdino savo gebėjimą kontroliuoti rezultatą nuo 4 iki 5. Pusei respondentų rezultatai buvo įdomūs, bet nepakankamai kokybiški, kad juos būtų galima panaudoti savo praktikoje.
Kalbant apie įsitikinimus, ar generatyvinis AI turės įtakos jų praktikai, 90 % apklaustų menininkų manė, kad tai turės įtakos; 46% tikėjo, kad poveikis bus teigiamas, o 7% prognozavo, kad tai turės neigiamą poveikį. Ir 37 % manė, kad tai turės įtakos jų praktikai, bet nebuvo tikri, kokiu būdu.
Geriausias vizualinis menas pranoksta kalbą
Ar šie apribojimai yra esminiai, ar jie tiesiog išnyks tobulėjant technologijoms?
Žinoma, naujesnės generatyvaus AI versijos suteiks vartotojams daugiau galimybių valdyti išvestį, didesnę skiriamąją gebą ir geresnę vaizdo kokybę.
Tačiau man pagrindinis apribojimas, susijęs su menu, yra esminis: tai yra kalbos, kaip pagrindinės varomosios jėgos kuriant įvaizdį, naudojimo procesas.
Ta pati įvestis gali sukelti daugybę atsitiktinių išėjimų. Kreditas: OpenAI / Wikimedia Commons Vaizdo menininkai pagal apibrėžimą yra vizualūs mąstytojai. Įsivaizduodami savo kūrybą, jie dažniausiai remiasi vaizdinėmis nuorodomis, o ne žodžiais – prisiminimais, fotografijų kolekcijomis ar kitokiu menu, su kuriuo susidūrė.
Kai kalba yra įvaizdžio generavimo vairuotojo vietoje, matau papildomą barjerą tarp menininko ir skaitmeninės drobės. Pikseliai bus pateikiami tik per kalbos objektyvą. Menininkai praranda laisvę manipuliuoti pikseliais už semantikos ribų.
Yra dar vienas esminis teksto į vaizdą technologijos apribojimas.
Jei du menininkai įveda tą patį raginimą, labai mažai tikėtina, kad sistema sukurs tą patį vaizdą. Tai ne dėl to, ką menininkas padarė; skirtingus rezultatus paprasčiausiai lemia tai, kad AI pradeda nuo skirtingų atsitiktinių pradinių vaizdų.
Kitaip tariant, menininko kūryba nulemta atsitiktinumo.
Beveik du trečdaliai mūsų apklaustų menininkų nerimavo, kad jų dirbtinio intelekto kartos gali būti panašios į kitų menininkų darbus ir kad technologija neatspindi jų tapatybės arba net ją visiškai pakeičia.
Menininko tapatybės klausimas yra labai svarbus kuriant ir atpažįstant meną. XIX amžiuje, kai pradėjo populiarėti fotografija, buvo diskutuojama, ar fotografija yra meno forma. 1861 m. Prancūzijos teismas turėjo nuspręsti, ar fotografija gali būti saugoma autorių teisių kaip meno rūšis. Sprendimas priklausė nuo to, ar menininko unikali tapatybė gali būti išreikšta fotografijomis.
Tie patys klausimai kyla svarstant AI sistemas, kurios mokomos naudojant esamus interneto vaizdus.
Prieš atsirandant raginimui iš teksto į vaizdą, meno kūrimas naudojant dirbtinį intelektą buvo sudėtingesnis procesas: menininkai dažniausiai mokydavo savo AI modelius, remdamiesi savo vaizdais. Tai leido jiems naudoti savo darbus kaip vaizdines nuorodas ir išlaikyti daugiau galimybių kontroliuoti rezultatus, kurie geriau atspindėjo jų unikalų stilių.
Teksto į vaizdą įrankiai gali būti naudingi tam tikriems kūrėjams ir kasdieniams naudotojams, norintiems sukurti darbo pristatymo ar socialinės žiniasklaidos įrašo grafiką.
Tačiau kalbant apie meną, neįsivaizduoju, kaip teksto į vaizdą programinė įranga gali tinkamai atspindėti tikruosius menininko ketinimus arba užfiksuoti grožį ir emocinį rezonansą, ar kūrinius, kurie sužavi žiūrovus ir verčia pamatyti pasaulį iš naujo.
Šis straipsnis iš naujo paskelbtas iš The Conversation pagal Creative Commons licenciją. Skaitykite originalų straipsnį.
Citata: Nuomonė: Meno kūrimo kvailystė naudojant teksto į vaizdą generatyvųjį AI (2023 m., birželio 23 d.), gauta 2023 m. birželio 25 d. iš https://techxplore.com/news/2023-06-opinion-folly-art-text-to -image-generative.html
Šis dokumentas yra saugomas autorių teisių. Išskyrus bet kokius sąžiningus sandorius privačių studijų ar mokslinių tyrimų tikslais, jokia dalis negali būti atkuriama be raštiško leidimo. Turinys pateikiamas tik informaciniais tikslais.

