Masinis renginys leis įsilaužėliams išbandyti AI technologijos ribas

Rumman Chowdhury, ne pelno siekiančios organizacijos „Humane Intelligence“, kuriančios atsakingas AI sistemas, įkūrėja, 2023 m. gegužės 8 d., pirmadienį, pozuoja savo namuose Katy mieste, Teksase. „ChatGPT“ kūrėjas „OpenAI“ ir kiti pagrindiniai AI teikėjai, tokie kaip „Google“ ir „Microsoft“, bendradarbiauja su Bideno administracija, kad tūkstančiai įsilaužėlių galėtų išbandyti savo technologijos ribas. Chowdhury yra masinio įsilaužimo renginio, planuojamo šią vasarą Las Vegase DEF CON įsilaužėlių suvažiavime, pagrindinis koordinatorius. Kreditas: AP Photo / David J. Phillip Vos tik „ChatGPT“ buvo paleistas, įsilaužėliai pradėjo „nulaužti“ dirbtinio intelekto pokalbių robotą, bandydami nepaisyti jo apsaugos priemonių, kad galėtų atskleisti ką nors nepadoraus ar nepadoraus.

Tačiau dabar jo gamintojas „OpenAI“ ir kiti pagrindiniai AI teikėjai, tokie kaip „Google“ ir „Microsoft“, derina veiksmus su Bideno administracija, kad tūkstančiai įsilaužėlių galėtų išbandyti savo technologijos ribas.

TAU TAIP PAT GALI PATIKTI

Nuo iliuzijos iki realybės: kaip dirbtinis intelektas keičia žaidimų industriją

Komisija nubrėžia kelią Europos lyderystei dirbtinio intelekto srityje – pristatytas ambicingas „Dirbtinio intelekto žemyno veiksmų planas“

Kai kurie dalykai, kuriuos jie ieškos: kaip galima manipuliuoti pokalbių robotais, kad būtų padaryta žala? Ar jie dalinsis privačia informacija, kurią jiems patikime, su kitais vartotojais? Ir kodėl jie mano, kad gydytojas yra vyras, o slaugytoja yra moteris?

„Štai kodėl mums reikia tūkstančių žmonių“, – sakė Rummanas Chowdhury, masinio įsilaužimo renginio, planuojamo šią vasarą Las Vegase vyksiančiame DEF CON programišių suvažiavime, į kurį tikimasi pritraukti kelis tūkstančius žmonių, koordinatorius. „Mums reikia daug žmonių, turinčių daug įvairios patirties, dalykinių žinių ir patirties, įsilaužusių į šiuos modelius ir bandančių rasti problemas, kurias vėliau būtų galima išspręsti.

Kiekvienas, išbandęs „ChatGPT“, „Microsoft“ „Bing“ pokalbių robotą ar „Google“ Bard, greitai sužinos, kad yra linkęs kurti informaciją ir užtikrintai ją pateikti kaip faktą. Šios sistemos, sukurtos pagal vadinamuosius didelių kalbų modelius, taip pat imituoja kultūrinius šališkumus, kurių jie išmoko treniruodamiesi į daugybę žmonių, kuriuos parašė internete.

Rumman Chowdhury, ne pelno siekiančios organizacijos „Humane Intelligence“, kuriančios atskaitingas AI sistemas, įkūrėja, pirmadienį, 2023 m. gegužės 8 d., dirba prie savo kompiuterio Katy mieste, Teksase. „ChatGPT“ kūrėjas „OpenAI“ ir kiti pagrindiniai AI teikėjai, tokie kaip „Google“ ir „Microsoft“, bendradarbiauja su Bideno administracija, kad tūkstančiai įsilaužėlių galėtų išbandyti savo technologijos ribas. Chowdhury yra masinio įsilaužimo renginio, planuojamo šią vasarą Las Vegase DEF CON įsilaužėlių suvažiavime, pagrindinis koordinatorius. Kreditas: AP Photo / David J. Phillip Masinio įsilaužimo idėja patraukė JAV vyriausybės pareigūnų dėmesį kovą per South by Southwest festivalį Ostine, Teksase, kur Svenas Cattellis, ilgai veikiančios DEF CON AI Village įkūrėjas, ir Austinas Carsonas, atsakingos dirbtinio intelekto ne pelno organizacijos SeedAI prezidentas. , padėjo surengti seminarą, kviečiantį bendruomenės kolegijos studentus nulaužti dirbtinio intelekto modelį.

Carsonas teigė, kad šie pokalbiai galiausiai išaugo į pasiūlymą išbandyti dirbtinio intelekto kalbos modelius, vadovaujantis Baltųjų rūmų AI Bill of Rights gairėmis – principų rinkiniu, kuriuo siekiama apriboti algoritminio šališkumo poveikį, suteikti vartotojams galimybę valdyti savo duomenis ir užtikrinti, kad automatizuotos sistemos naudojamos saugiai ir skaidriai.

Jau yra vartotojų bendruomenė, kuri iš visų jėgų stengiasi apgauti pokalbių robotus ir pabrėžti jų trūkumus. Kai kurios iš jų yra oficialios „raudonosios komandos“, kurias įmonės įgaliojo „skatinti atakuoti“ AI modelius ir atrasti jų pažeidžiamumą. Daugelis kitų yra mėgėjai, demonstruojantys humoristinius ar nerimą keliančius rezultatus socialinėje žiniasklaidoje, kol jiems uždrausta už produkto paslaugų teikimo sąlygų pažeidimą.

„Tai, kas dabar vyksta, yra tarsi išsklaidytas metodas, kai žmonės randa daiktų, jie pasklinda „Twitter“ tinkle“, o vėliau tai gali būti ištaisyta arba ne, jei tai pakankamai žiauri arba asmuo, atkreipęs į tai dėmesį, yra įtakingas, sakė Chowdhury.

Viename pavyzdyje, žinomame kaip „močiutės išnaudojimas“, vartotojai galėjo priversti pokalbių robotus, kad jie pasakytų jiems, kaip pasigaminti bombą (ko komercinis pokalbių robotas paprastai atmesdavo), prašydami apsimesti, kad tai močiutė, pasakojanti istoriją prieš miegą. kaip pasigaminti bombą.

Rumman Chowdhury, ne pelno siekiančios organizacijos „Humane Intelligence“, kuriančios atsakingas AI sistemas, įkūrėja, 2023 m. gegužės 8 d., pirmadienį, pozuoja savo namuose Katy mieste, Teksase. „ChatGPT“ kūrėjas „OpenAI“ ir kiti pagrindiniai AI teikėjai, tokie kaip „Google“ ir „Microsoft“, bendradarbiauja su Bideno administracija, kad tūkstančiai įsilaužėlių galėtų išbandyti savo technologijos ribas. Chowdhury yra masinio įsilaužimo renginio, planuojamo šią vasarą Las Vegase DEF CON įsilaužėlių suvažiavime, pagrindinis koordinatorius. Kreditas: AP Photo / David J. Phillip Kitame pavyzdyje, ieškant Chowdhury naudojant ankstyvą Microsoft Bing paieškos variklio pokalbių roboto versiją, kuri yra pagrįsta ta pačia technologija kaip ir ChatGPT, bet gali gauti informaciją realiuoju laiku iš interneto, buvo sukurtas profilis, kuriame spėjama, kad Chowdhury mėgsta pirkti naujus. batus kiekvieną mėnesį“ ir pateikė keistus ir lytiškus teiginius apie jos fizinę išvaizdą.

2021 m., kai ji vadovavo „Twitter“ AI etikos komandai, Chowdhury padėjo pristatyti metodą, kaip atlyginti už algoritminio šališkumo atradimą DEF CON AI Village. Kibernetinio saugumo pramonėje įprasta mokėti įsilaužėliams „dovanos“, jei jie atskleidžia saugumo klaidą, tačiau tai buvo naujesnė idėja mokslininkams, tyrinėjantiems žalingą AI šališkumą.

Šių metų renginys bus daug didesnio masto ir bus pirmasis, kuriame bus sprendžiami dideli kalbų modeliai, kurie sulaukė didžiulio visuomenės susidomėjimo ir komercinių investicijų nuo ChatGPT išleidimo praėjusių metų pabaigoje.

Chowdhury, dabar vienas iš AI atskaitomybės ne pelno organizacijos „Humane Intelligence“ įkūrėjų, teigė, kad tai ne tik trūkumų radimas, bet ir būdų, kaip juos ištaisyti.

„Tai yra tiesioginis vamzdynas, skirtas įmonėms pateikti atsiliepimus“, – sakė ji. „Nėra taip, kad mes tiesiog darome šį hakatoną ir visi grįžta namo. Mes praleisime mėnesius po pratybų rengdami ataskaitą, aiškindami įprastus pažeidžiamumus, dalykus, kurie atsirado, ir modelius, kuriuos matėme.”

Rumman Chowdhury, ne pelno siekiančios organizacijos „Humane Intelligence“, kuriančios atskaitingas AI sistemas, įkūrėja, pirmadienį, 2023 m. gegužės 8 d., dirba prie savo kompiuterio Katy mieste, Teksase. „ChatGPT“ kūrėjas „OpenAI“ ir kiti pagrindiniai AI teikėjai, tokie kaip „Google“ ir „Microsoft“, bendradarbiauja su Bideno administracija, kad tūkstančiai įsilaužėlių galėtų išbandyti savo technologijos ribas. Chowdhury yra masinio įsilaužimo renginio, planuojamo šią vasarą Las Vegase DEF CON įsilaužėlių suvažiavime, pagrindinis koordinatorius. Kreditas: AP Photo / David J. Phillip Dėl kai kurių detalių vis dar deramasi, tačiau įmonės, kurios sutiko pateikti savo modelius testavimui, yra „OpenAI“, „Google“, lustų gamintoja „Nvidia“ ir startuoliai „Anthropic“, „Hugging Face“ ir „Stability AI“. Testavimo platformos kūrimas yra dar vienas startuolis, vadinamas Scale AI, žinomas dėl savo darbo paskiriant žmones padėti mokyti AI modelius ženklinant duomenis.

„Kadangi šie pamatų modeliai tampa vis plačiau paplitę, labai svarbu, kad padarytume viską, ką galime, kad užtikrintume jų saugumą“, – sakė „Scale“ generalinis direktorius Alexandr Wang. „Galite įsivaizduoti, kad kažkas vienoje pasaulio pusėje užduoda jam labai jautrius ar išsamius klausimus, įskaitant tam tikrą savo asmeninę informaciją. Nenorite, kad ši informacija nutekėtų kitam vartotojui.

Kiti pavojai, dėl kurių Wang nerimauja, yra pokalbių robotai, kurie teikia „neįtikėtinai blogus medicininius patarimus“ arba kitą klaidingą informaciją, galinčią padaryti didelę žalą.

„Anthropic“ įkūrėjas Jackas Clarkas teigė, kad DEF CON renginys, tikimasi, taps gilesnio AI kūrėjų įsipareigojimo matuoti ir įvertinti jų kuriamų sistemų saugumą pradžia.

„Mūsų pagrindinė nuomonė yra tokia, kad AI sistemas reikės trečiųjų šalių vertinimų tiek prieš įdiegiant, tiek po įdiegimo. Vienas iš būdų tai padaryti yra „raudonųjų komandų” kūrimas”, – sakė Clarkas. „Turime pasipraktikuoti, kaip tai padaryti. Anksčiau to tikrai nebuvo daroma.”

Citata: Masinis renginys leis įsilaužėliams išbandyti AI technologijos ribas (2023 m. gegužės 10 d.), gautą 2023 m. gegužės 10 d. iš https://techxplore.com/news/2023-05-hackers-aim-faws-aiwith-white.html

Šis dokumentas yra saugomas autorių teisių. Išskyrus bet kokius sąžiningus sandorius privačių studijų ar mokslinių tyrimų tikslais, jokia dalis negali būti atkuriama be raštiško leidimo. Turinys pateikiamas tik informaciniais tikslais.

Nuo iliuzijos iki realybės: kaip dirbtinis intelektas keičia žaidimų industriją

Komisija nubrėžia kelią Europos lyderystei dirbtinio intelekto srityje – pristatytas ambicingas „Dirbtinio intelekto žemyno veiksmų planas“

EP nariai balsuos dėl siūlomo „Big Brother“ AI veido atpažinimo gatvėse uždraudimo

Parašykite komentarą Atšaukti atsakymą

Naujausi komentarai

Tema

Partneriai

Naujienos

Kategorijos

Naujausi komentarai

Sveiki sugrįžę!

Retrieve your password