Tštai senas posakis, kad niekas niekada nevalgytų dešros, jei žinotų, kaip gaminamos dešros. Tai, be jokios abejonės, nesąžininga mėsos perdirbimo pramonės atžvilgiu, nes ne visos dešros yra, kaip kai kurie garsiai pastebėjo, „kasetės, kuriose yra skerdyklos grindų šluotos medžiagos“. Tačiau tai yra naudingas atsargumo principas susidūrus su gaminiais, kurių gamintojai – kaip tai pasakysime? – gudruolis apie jų gamybos procesų detales.
Įeikite, scena kairėje, technologijų įmonės, šiuo metu reklamuojančios savo generatyvius dirbtinio intelekto stebuklus – ypač tuos didelių kalbų modelius (LLM), kurie, reaguodami į žmonių raginimus, laisvai sudaro tikėtinus angliškus sakinius. Pasiteiravus, kaip šis stebuklas pasiekiamas, standartiniai paaiškinimai pabrėžia naudojamos technologijos ryškumą.
Pasakojimas vyksta taip. Pirma, viskas, ką žmonės kada nors paskelbė mašininiu būdu nuskaitoma forma, buvo „nuskaityta“ (ty surinkta), kad būtų sukurtas didžiulis duomenų rinkinys, kuriuo remiantis būtų galima apmokyti mašinas. Technologija, kuri leido jiems „mokytis“ iš šio duomenų rinkinio, yra išradingas didžiulės skaičiavimo galios, galingų algoritmų (įskaitant tai, kas paslaptingai vadinama „transformatoriaus“ architektūra, kurią „Google“ išrado maždaug 2017 m.), ir įrankių, vadinamų „neuroniniais tinklais“, derinys. 1986 m. kompiuterių mokslininkas Geoffas Hintonas išgelbėjo nuo pasenimo). Sudėjus visa tai, buvo galima sukurti mašinas, kurios kuria tekstą, atlikdamos statistines prognozes, koks žodis greičiausiai atsiras toliau jų kuriamame sakinyje.
Iš esmės tai tik labai brangios statistinės papūgos, kitaip tariant, ir – jų dizainerių požiūriu – tai ne jų kaltė, jei pasaulis naiviai priskiria mašinoms intelektą ir (arba) nerimauja, kad jos gali kelti egzistencinę grėsmę žmonijai. . Tiesą sakant, šios spekuliacinės baimės yra naudingos pramonei – galbūt dėl to kai kurie technologijų lyderiai, pavyzdžiui, OpenAI vadovas Samas Altmanas, ragina politikus atkreipti į jas dėmesį. Galų gale, jie atitraukia dėmesį nuo realios žalos, kurią dabar daro esamos technologijos diegimas; ir jie neleidžia žmonėms klausinėti nepatogių klausimų apie tai, kaip buvo pagaminta ši technologinė dešra.
Vienas iš seniausių skaičiavimo principų yra GIGO – šiukšlės į, šiukšlės lauk. Jis taikomas LLM, nes jie yra tokie pat geri, kaip ir duomenys, kuriais remiantis jie buvo mokomi. Tačiau dirbtinio intelekto įmonės yra labai griežtos dėl tų mokymo duomenų pobūdžio. Didžiąją jo dalį gauna žiniatinklio tikrinimo programos – interneto robotai, kurie sistemingai naršo internete. Iki šiol „ChatGPT“ ir „co“ naudojosi „Common Crawl“ – skaitmeninio voro, kuris kiekvieną mėnesį naršo internete, renkantis duomenų petabaitus ir laisvai teikdamas savo archyvus bei duomenų rinkinius visuomenei, paslaugomis. Tačiau šie mokymo duomenys neišvengiamai apima daugybę autorių teisių saugomų kūrinių, kurie yra įtraukti į „sąžiningo naudojimo“ paraiškas, kurios gali būti negaliojančios. Taigi: kiek LLM buvo apmokyti piratinės medžiagos? Mes nežinome, o gal ir įmonės nežino.
Tas pats pasakytina ir apie šių sistemų anglies pėdsaką. Šiuo metu apie tai žinome tris dalykus. Pirma, jis didelis: 2019 m. treniruotėse ankstyvas LLM išmetė 300 000 kg CO.2 – atitinka 125 skrydžius pirmyn ir atgal iš Niujorko į Pekiną; Šiandieniniai modeliai yra daug didesni. Antra, įmonės racionalizuoja šias emisijas pirkdamos „kompensacijas“, kurios yra šiuolaikinis viduramžių atlaidų, erzinusių Martiną Liuterį, atitikmuo. Trečia, įmonės yra patologiškai paslaptingos dėl viso to aplinkosaugos sąnaudų – kaip atrado žymus dirbtinio intelekto tyrinėtojas Timnitas Gebru.
Yra daug daugiau, iš kur tai kilo, bet istorijos moralas yra griežtas. Esame esminiame žmogaus kelionės taške, išradę potencialiai transformuojančią technologiją. Jos esmė yra nesuvokiamos mašinos, priklausančios korporacijoms, kurios bjaurisi skaidrumu. Galbūt mes mažai ką galime padaryti dėl mašinų, bet tikrai galime ką nors padaryti dėl jų savininkų. Kaip teigia technologijų leidėjas Timas O’Reilly: „Reguliavimo institucijos turėtų pradėti formalizuodami ir reikalaudami išsamiai atskleisti matavimo ir valdymo metodus, kuriuos jau naudoja tie, kurie kuria ir naudoja pažangias AI sistemas. Jie turėtų. Turime žinoti, kaip gaminamos šios dešrelės.
Ką aš skaičiau
Knygų mokymasis
Kas nutinka, kai dirbtinis intelektas skaito knygą – intriguojančio Ethano Mollicko tinklaraščio įrašo pavadinimas svetainėje „One Useful Thing“.
Aukštas volelis
Philo Mickelsono lažybų įpročiai – skaitykite ištrauką adresu „Golf Digest“. iš stulbinančių atsiminimų vaikino, kuris anksčiau buvo jo lošimo partneris.
Pabaigos laikai
Kodėl Amerika grįžta atgal, yra įdomi Mike’o Lofgreno esė Salonas apie ryšį tarp reakcingos politikos ir kultūros nuosmukio.

