Kreditas: CC0 viešasis domenas Ji yra svarbi figūra už šiandieninio dirbtinio intelekto bumo, tačiau ne visi kompiuterių mokslininkai manė, kad Fei-Fei Li ėjo teisingu keliu, kai sugalvojo milžinišką vizualinę duomenų bazę, pavadintą „ImageNet“, kuriai sukurti prireikė metų.
Li, dabar Stanfordo universiteto Į žmogų orientuoto dirbtinio intelekto instituto įkūrėja, išleido naujus atsiminimus, kuriuose pasakojama apie jos novatorišką darbą kuriant duomenų rinkinį, paspartinusį dirbtinio intelekto kompiuterinės vizijos šaką.
Knygoje „Pasaulis, kurią aš matau“ taip pat vaizduojami jos formavimosi metai, kurie staiga perėjo iš Kinijos į Naująjį Džersį ir seka ją per akademinę bendruomenę, Silicio slėnį ir Kongresų sales, nes augantis dirbtinio intelekto technologijų komercializavimas sulaukė visuomenės dėmesio ir atsako. Ji kalbėjo su „The Associated Press“ apie knygą ir dabartinę AI akimirką. Interviu buvo redaguotas siekiant ilgumo ir aiškumo.
Kl.: Jūsų knygoje aprašoma, kaip įsivaizdavote „ImageNet“ kaip daugiau nei tik didžiulį duomenų rinkinį. Ar gali paaiškinti?
A: „ImageNet“ iš tikrųjų yra esminė AI problemos Šiaurės žvaigždės atpažinimo ir būdo, kaip tai pasiekti, istorija. Šiaurinė žvaigždė man buvo iš tikrųjų permąstyti, kaip galime išspręsti regėjimo intelekto problemą. Viena iš pagrindinių regėjimo intelekto problemų yra objektų supratimas arba matymas, nes pasaulis susideda iš objektų. Žmogaus regėjimas grindžiamas mūsų supratimu apie objektus. Ir jų yra daug, daug, daug. „ImageNet“ iš tikrųjų yra bandymas apibrėžti objektų atpažinimo problemą ir taip pat numatyti būdą, kaip ją išspręsti, ty didžiųjų duomenų kelią.
K: Jei galėčiau keliauti laiku atgal prieš 15 metų, kai sunkiai dirbate „ImageNet“ ir papasakoti apie DALL-E, „Stable Diffusion“, „Google Gemini“ ir „ChatGPT“ – kas jus labiausiai nustebintų?
A: Manęs nestebina tai, kad viskas, ką minite – DALL-E, ChatGPT, Gemini – yra pagrįsta dideliais duomenimis. Jie yra iš anksto apmokyti gauti didelį duomenų kiekį. Būtent to ir tikėjausi. Mane nustebino tai, kad prie generatyvaus AI priėjome greičiau, nei daugelis iš mūsų manė. Žmonių generavimas iš tikrųjų nėra toks lengvas. Daugelis iš mūsų nėra natūralūs menininkai. Žmonėms lengviausia generuoti žodžius, nes kalbėjimas yra generatyvus, bet piešti ir tapyti normaliems žmonėms nėra generatyvūs. Mums reikia pasaulio Van Gogų.
Kl.: Ko, jūsų nuomone, dauguma žmonių nori iš pažangių mašinų ir ar tai atitinka mokslininkų ir technologijų įmonių kūrimą?
A: Manau, kad iš esmės žmonės nori orumo ir gero gyvenimo. Tai beveik pagrindinis mūsų šalies principas. Mašinos ir technologijos turėtų būti suderintos su visuotinėmis žmogaus vertybėmis – orumu ir geresniu gyvenimu, įskaitant laisvę ir visus tuos dalykus. Kartais, kai kalbame apie technologijas, o kartais, kai kuriame technologijas, nesvarbu, ar jos yra numatytos, ar neplanuotos, mes nepakankamai apie tai kalbame. Kai sakau „mes“, tai apima technologus, įmones, bet taip pat ir žurnalistus. Tai mūsų kolektyvinė atsakomybė.
K: Kokie yra didžiausi klaidingi supratimai apie AI?
A: Didžiausias klaidingas AI supratimas žurnalistikoje yra tada, kai žurnalistai naudoja temą AI ir veiksmažodį ir į objektą įdeda žmones. Žmogaus iniciatyva yra labai, labai svarbi. Mes kuriame technologijas, diegiame technologijas ir valdome technologijas. Žiniasklaida ir viešasis diskursas, tačiau stipriai paveikti žiniasklaidos, kalba apie dirbtinį intelektą be tinkamos pagarbos žmogaus veiklai. Turime tiek daug straipsnių, tiek daug diskusijų, prasidedančių „AI atneša bla, bla, bla; AI daro bla bla bla; AI pristato bla bla bla; AI naikina bla, bla, bla. Ir aš manau, kad turime tai pripažinti.
Klausimas: Išstudijavus neuromokslą prieš pradėdamas kompiuterinį regėjimą, kuo dirbtinio intelekto procesai skiriasi ar panašūs į žmogaus intelektą?
A: Kadangi nubraukiau neurologijos paviršių, dar labiau gerbiu, kokie jie skirtingi. Mes iš tikrųjų nežinome sudėtingų mūsų smegenų mąstymo detalių. Turime šiek tiek supratimo apie žemesnio lygio vizualines užduotis, pvz., spalvų ir formų matymą. Bet mes nežinome, kaip žmonės rašo Šekspyrą, kaip mes ką nors pamilome, kaip suprojektavome Auksinių vartų tiltą. Žmogaus smegenų moksle yra tiek sudėtingumo, kuris vis dar yra paslaptis. Mes nežinome, kaip tai padaryti naudojant mažiau nei 30 vatų, energijos, kurią naudoja smegenys. Kodėl mes taip baisūs matematikoje, o taip greitai matome, naršome ir manipuliuojame fiziniu pasauliu? Smegenys yra begalinis įkvėpimo šaltinis tam, ką dirbtinis intelektas turėtų ir turėtų daryti. Jo neuroninė architektūra – (Nobelio premijos laureatai neurofiziologai) Hubelis ir Wieselis iš tikrųjų buvo to atradėjai – buvo dirbtinio neuroninio tinklo įkvėpimo pradžia. Mes pasiskolinome tą architektūrą, nors matematiškai ji visiškai neatkartoja to, ką daro smegenys. Yra daug persipynusio įkvėpimo. Tačiau turime gerbti ir tai, kad yra daug nežinomųjų, todėl sunku atsakyti, kiek jie panašūs.
© 2023 The Associated Press. Visos teisės saugomos. Šios medžiagos negalima skelbti, transliuoti, perrašyti ar platinti be leidimo.
Citata: AI pradininkas sako, kad viešasis diskursas apie išmaniąsias mašinas turi būti „derama pagarba žmogaus agentūrai“ (2023 m. gruodžio 25 d.), gauta 2023 m. gruodžio 25 d. iš https://techxplore.com/news/2023-12-ai-discourse-intelligent-machines -proper.html
Šis dokumentas yra saugomas autorių teisių. Išskyrus bet kokius sąžiningus sandorius privačių studijų ar mokslinių tyrimų tikslais, jokia dalis negali būti atkuriama be raštiško leidimo. Turinys pateikiamas tik informaciniais tikslais.