Išpuolio apžvalga, kurią pristatė mokslininkai. (1) Priešas renka duomenis iš tikslinės AIGC paslaugos. (2) Surinktiems duomenims išvalyti priešas naudoja atvirojo kodo triukšmo slopinimo modelį. (3) Priešininkas priima originalius ir išgrynintus duomenis, kad išmokytų GAN, kuris gali būti naudojamas vandens ženklui pašalinti arba suklastoti. Juodai balti vaizdai reiškia vaizdus su vandens ženklais ir be jų. Kreditas: Li ir kt. Atsiradus LensaAI, ChatGPT ir kitiems labai našiems generatyviesiems mašininio mokymosi modeliams, internetas vis labiau prisipildo tekstų, vaizdų, logotipų ir vaizdo įrašų, sukurtų dirbtinio intelekto (AI). Šis turinys, plačiai vadinamas AI generuotu turiniu (AIGC), dažnai gali būti lengvai supainiotas su žmonių sukurtu turiniu ar bet kokiais skaičiavimo modeliais.
Dėl to didėjantis generatyvinių AI modelių naudojimas atvėrė pagrindinius klausimus, susijusius su intelektine nuosavybe ir autorių teisėmis. Tiesą sakant, daugelis kompanijų ir kūrėjų yra nepatenkinti plačiai paplitusiu komerciniu jų modelių sukurto turinio naudojimu, todėl įvedė vandens ženklus, kad reguliuotų AIGC sklaidą.
Vandenženkliai iš esmės yra raštai arba charakterizuojantys ženklai, kurie gali būti dedami ant vaizdų, vaizdo įrašų ar logotipų, siekiant paaiškinti, kas juos sukūrė ir kam priklauso jų autorių teisės. Nors vandens ženklai buvo plačiai naudojami dešimtmečius, jų veiksmingumas reguliuojant AIGC naudojimą dar nebuvo nustatytas.
Nanyang technologijos universiteto, Čongčingo universiteto ir Džedziango universitetų mokslininkai neseniai atliko tyrimą, kuriame buvo tiriamas vandens ženklų veiksmingumas kaip priemonė užkirsti kelią nepageidaujamam ir nepriskirtam AIGC sklaidai. Jų dokumentas, paskelbtas išankstinio spausdinimo serveryje arXivaprašomos dvi strategijos, kurios gali leisti užpuolikams lengvai pašalinti ir suklastoti vandens ženklus AIGC.
„Pastaruoju metu AIGC buvo karšta tema bendruomenėje“, – „Tech Xplore“ sakė Guanlinas Li, šio straipsnio bendraautorius. „Daugelis įmonių prideda vandens ženklus AIGC, kad apsaugotų IP arba apribotų neteisėtą naudojimą. Vieną vakarą diskutavome, ar galėtume ištirti naują pažangų vandenženklį generatyviniams modeliams. Aš tiesiog pasakiau: „Ei, kodėl gi ne užpulti esamų vandenženklių schemų? Jei galime Pašalinus vandens ženklą, kai kurie neteisėti AIGC nebus traktuojami kaip sugeneruoti dirbtinio intelekto. Arba, jei vandenženklį paverstume realiame turinyje, jie gali būti traktuojami kaip sukurti dirbtinio intelekto. Tai gali sukelti daug chaoso internete.
Atlikdami tyrimą, Li ir jo kolegos pademonstravo skaičiavimo strategiją, skirtą AI modelių sukurtuose vaizduose ištrinti arba suklastoti vandenženklius. Asmuo, taikantis šią strategiją, iš esmės pirmiausia rinktų duomenis iš tikslinės dirbtinio intelekto įmonės, taikomosios programos ar turinio generavimo tarnybos, o tada naudotų viešai prieinamą triukšmo mažinimo modelį šiems duomenims „išvalyti“.
Švarūs vaizdai ir atitinkami komandos modelio rezultatai. Dvi viršutinės eilutės yra švarūs vaizdai. Kreditas: Li ir kt. Galiausiai vartotojas turėtų išmokyti generatyvų priešininkų tinklą (GAN), naudodamas šiuos išgrynintus duomenis. Tyrėjai nustatė, kad po mokymo šis GAN pagrįstas modelis gali sėkmingai pašalinti arba suklastoti vandens ženklą.
„Mūsų tyrimo idėja yra gana paprasta“, – paaiškino Li. „Jei norime identifikuoti vandens ženklu pažymėtą turinį, vandens ženklu pažymėto turinio pasiskirstymas turėtų skirtis nuo pradinio. Pagal tai, jei išmoksime projekciją tarp šių dviejų paskirstymų, galėsime pašalinti arba suklastoti vandenženklį.”
Atlikdami pradinius bandymus, Li ir jo kolegos nustatė, kad jų nustatyta strategija buvo labai efektyvi pašalinant ir padirbant vandens ženklus iš įvairių vaizdų, sukurtų naudojant AI pagrindu sukurtą turinio generavimo paslaugą. Taigi jų darbas pabrėžia pažeidžiamumą ir dėl to vandens ženklų naudojimo nepraktiškumą siekiant užtikrinti AIGC autorių teises.
„Nenuostabu, kad pažangias vandenženklių schemas galima lengvai pašalinti arba suklastoti, jei priešas turi visą informaciją apie vandens ženklų schemas, tačiau nenuostabu, kad net ir turėdami tik vandens ženklų turinį, mes vis tiek galime tai padaryti“, – sakė Li. .
„Kita vertus, mūsų metodas yra pagrįstas duomenų paskirstymu, todėl tai rodo, kad esamos vandenženklių schemos nėra saugios. Jei atvirai, nenoriu, kad mūsų darbas taptų realia grėsme, nes tai kad mes negalėtume valdyti generatyvinių modelių. Asmeniškai tikiuosi, kad tai įkvėps kitus sukurti pažangesnes vandenženklių schemas, kurios apsigintų nuo mūsų atakų.
Neseniai atliktas šios tyrėjų komandos darbas gali greitai įkvėpti įmones ir kūrėjus, besispecializuojančius generatyvaus dirbtinio intelekto srityje, sukurti pažangesnius vandenženklio metodus arba alternatyvius metodus, kurie geriau tinka užkirsti kelią neteisėtai AIGC sklaidai. Įkvėptas savo išvadų, Li ir jo kolegos dabar taip pat bando sukurti kai kuriuos iš šių metodų.
„Dabar daugiausia tiriame kai kurias naujas generatyvinių modelių vandenženklio schemas, skirtas ne tik vaizdų generavimo technikoms, bet ir kitiems modeliams“, – pridūrė Li.
Daugiau informacijos: Guanlin Li ir kt., Dirbtinio intelekto sukurto turinio žymėjimo vandenženkliais pažeidžiamumo link, arXiv (2023). DOI: 10.48550/arxiv.2310.07726
Žurnalo informacija: arXiv
© „Science X Network“, 2023 m
Citata: tyrimas atskleidžia vandens ženklų AI sukurto turinio spragas (2023 m. spalio 25 d.), gautą 2023 m. spalio 25 d. iš https://techxplore.com/news/2023-10-unveils-vulnerabilities-watermarking-ai-generated.html
Šis dokumentas yra saugomas autorių teisių. Išskyrus bet kokius sąžiningus sandorius privačių studijų ar mokslinių tyrimų tikslais, jokia dalis negali būti atkuriama be raštiško leidimo. Turinys pateikiamas tik informaciniais tikslais.

