Horoskopai
Pranešti naujieną
  • Prisijungti
Karščiausios naujienos šiandien
No Result
View All Result
Reklamos įkainiai
Kontaktai
  • Naujienos Lietuvoje
    • Kriminalai
    • Politika
  • Pasaulio naujienos
    • Ukrainos naujienos
  • Sporto naujienos
  • Įdomybės
  • Technologijos ir Mokslas
    • Kriptovaliutos
    • Dirbtinis intelektas
    • Metaverse
    • SpaceX
  • Gyvenimo būdas
    • Sveikata
    • Maistas ir Receptai
    • Muzika ir Filmai
    • Kelionės
    • Namai ir Statybos
    • Gyvūnai
    • Stilius ir Grožis
    • Psichologija
    • Šeima
    • Laisvalaikis
    • Įdomybės
    • Transportas
  • Verslo žinios
  • Miestai
    • Alytaus naujienos
    • Kaišiadorių naujienos
    • Kauno naujienos
    • Klaipėdos naujienos
    • Pajūrio naujienos
    • Palangos naujienos
    • Panevėžio naujienos
    • Radviliškio naujienos
    • Raseinių naujienos
    • Šiaulių naujienos
    • Varėnos naujienos
    • Vilniaus naujienos
  • Naujienos Lietuvoje
    • Kriminalai
    • Politika
  • Pasaulio naujienos
    • Ukrainos naujienos
  • Sporto naujienos
  • Įdomybės
  • Technologijos ir Mokslas
    • Kriptovaliutos
    • Dirbtinis intelektas
    • Metaverse
    • SpaceX
  • Gyvenimo būdas
    • Sveikata
    • Maistas ir Receptai
    • Muzika ir Filmai
    • Kelionės
    • Namai ir Statybos
    • Gyvūnai
    • Stilius ir Grožis
    • Psichologija
    • Šeima
    • Laisvalaikis
    • Įdomybės
    • Transportas
  • Verslo žinios
  • Miestai
    • Alytaus naujienos
    • Kaišiadorių naujienos
    • Kauno naujienos
    • Klaipėdos naujienos
    • Pajūrio naujienos
    • Palangos naujienos
    • Panevėžio naujienos
    • Radviliškio naujienos
    • Raseinių naujienos
    • Šiaulių naujienos
    • Varėnos naujienos
    • Vilniaus naujienos
Karščiausios naujienos šiandien
No Result
View All Result
Pagrindinis Technologijos ir Mokslas Dirbtinis intelektas

Dirbtinio intelekto sistema mokosi vaizdo, garso ir teksto sąvokų

Paskelbė Naujienų portalas Tiksaviems
2022-07-30
in Dirbtinis intelektas
Skaitymo laikas: 6 min.
517
A A
0
Dirbtinio intelekto sistema mokosi vaizdo, garso ir teksto sąvokų

Žmonės stebi pasaulį derindami įvairius būdus, pavyzdžiui, regėjimą, klausą ir kalbos supratimą. Kita vertus, mašinos interpretuoja pasaulį naudodamos duomenis, kuriuos gali apdoroti algoritmai

Taigi, kai mašina „mato” nuotrauką, ji turi užkoduoti tą nuotrauką į duomenis, kuriuos gali panaudoti tokiai užduočiai, kaip vaizdų klasifikavimas, atlikti. Šis procesas tampa dar sudėtingesnis, kai įvestis gaunama keliais formatais, pavyzdžiui, vaizdo įrašai, garso įrašai ir vaizdai

TAU TAIP PAT GALI PATIKTI

Nuo iliuzijos iki realybės: kaip dirbtinis intelektas keičia žaidimų industriją

Komisija nubrėžia kelią Europos lyderystei dirbtinio intelekto srityje – pristatytas ambicingas „Dirbtinio intelekto žemyno veiksmų planas“

.

„Pagrindinis iššūkis šiuo atveju yra, kaip mašina gali suderinti šiuos skirtingus modalumus? Mums, kaip žmonėms, tai padaryti lengva. Matome automobilį ir girdime važiuojančio automobilio garsą, ir žinome, kad tai yra tas pats dalykas. Tačiau mašinų mokymosi atveju tai nėra taip paprasta”, – sako Kompiuterių mokslo ir dirbtinio intelekto laboratorijos (CSAIL) magistrantas Aleksandras Liu (Alexander Liu), kuris yra pirmasis šią problemą sprendžiančio straipsnio autorius.

Liu ir jo bendradarbiai sukūrė dirbtinio intelekto metodą, kuriuo mokomasi atvaizduoti duomenis taip, kad būtų galima užfiksuoti sąvokas, kurios yra bendros regos ir garso modalumams. Pavyzdžiui, jų metodas gali sužinoti, kad vaizdo įraše matomas kūdikio verksmas yra susijęs su garso įraše pasakytu žodžiu „verkia”

Naudodamasis šiomis žiniomis, jų mašininio mokymosi modelis gali nustatyti, kur vaizdo įraše vyksta tam tikras veiksmas, ir jam suteikti etiketę

Jis geriau nei kiti mašininio mokymosi metodai atlieka kryžminės paieškos užduotis, kai reikia surasti duomenų dalį, pavyzdžiui, vaizdo įrašą, atitinkantį vartotojo užklausą, pateiktą kita forma, pavyzdžiui, šnekamąja kalba. Jų modelis taip pat leidžia vartotojams lengviau suprasti, kodėl mašina mano, kad vaizdo įrašas atitinka jų užklausą.

Šis metodas kada nors galėtų būti panaudotas padėti robotams mokytis apie pasaulio sąvokas per suvokimą, panašiai kaip tai daro žmonės.

Kartu su Liu prie šio straipsnio prisidėjo CSAIL doktorantas SouYoung Jin, magistrantai Cheng-I Jeff Lai ir Andrew Rouditchenko, CSAIL vyresnioji mokslininkė ir MIT-IBM Watson dirbtinio intelekto laboratorijos direktorė Aude Oliva ir vyresnysis autorius James Glass, CSAIL Šnekamosios kalbos sistemų grupės vyresnysis mokslininkas ir vadovas. Tyrimas bus pristatytas metiniame Kompiuterinės lingvistikos asociacijos susitikime.

Reprezentacijų mokymasis

Tyrėjai savo darbe daugiausia dėmesio skiria reprezentacijų mokymuisi, kuris yra mašininio mokymosi forma, siekianti transformuoti įvesties duomenis, kad būtų lengviau atlikti tokią užduotį kaip klasifikavimas ar prognozavimas

Reprezentacijų mokymosi modelis paima neapdorotus duomenis, pavyzdžiui, vaizdo įrašus ir atitinkamus tekstinius užrašus, ir juos užkoduoja, išskirdamas požymius arba pastabas apie vaizdo įraše esančius objektus ir veiksmus. Tuomet jis šiuos duomenų taškus atvaizduoja tinklelyje, vadinamame įterpimo erdve. Modelis grupuoja panašius duomenis kaip atskirus taškus tinklelyje. Kiekvienas iš šių duomenų taškų, arba vektorių, žymimas atskiru žodžiu.

Pavyzdžiui, žongliruojančio asmens vaizdo įrašas gali būti atvaizduotas kaip vektorius, pažymėtas „žongliravimas”

Tyrėjai apriboja modelį taip, kad jis gali naudoti tik 1,000 žodį vektoriams žymėti. Modelis gali nuspręsti, kokius veiksmus ar sąvokas jis nori užkoduoti viename vektoriuje, tačiau jis gali naudoti tik 1,000 vektorių. Modelis pasirenka žodžius, kurie, jo manymu, geriausiai atspindi duomenis.

Užuot kodavus skirtingų modalumų duomenis atskiruose tinkleliuose, jų metodas naudoja bendrą įterpimo erdvę, kurioje du modalumai gali būti koduojami kartu. Tai leidžia modeliui išmokti ryšį tarp dviejų modalumų reprezentacijų, pavyzdžiui, vaizdo įrašo, kuriame matomas žongliruojantis žmogus, ir garso įrašo, kuriame girdimas žmogus, sakantis „žongliravimas”.

Kad padėtų sistemai apdoroti kelių modalumų duomenis, jie sukūrė algoritmą, kuris nurodo mašinai koduoti panašias sąvokas tame pačiame vektoriuje.

„Jei yra vaizdo įrašas apie kiaules, modelis gali priskirti žodį „kiaulė” vienam iš 1,000 vektorių. Tada, jei modelis išgirs, kad garso įraše kas nors taria žodį „kiaulė”, jis vis tiek turėtų naudoti tą patį vektorių šiam žodžiui užkoduoti”, – aiškina Liu.

Geresnis retriveris

Jie išbandė modelį atlikdami įvairiarūšės paieškos užduotis, naudodami tris duomenų rinkinius: vaizdo ir teksto duomenų rinkinį su vaizdo klipais ir tekstiniais užrašais, vaizdo ir garso duomenų rinkinį su vaizdo klipais ir garsiniais užrašais bei vaizdo ir garso duomenų rinkinį su vaizdais ir garsiniais užrašais.

Pavyzdžiui, vaizdo ir garso duomenų rinkinyje modelis pasirinko 1,000 žodžius veiksmams vaizdo įrašuose reikšti. Tada, kai tyrėjai pateikė jam garso užklausas, modelis stengėsi rasti klipą, kuris geriausiai atitiktų tuos žodžius.

„Panašiai kaip „Google” paieškoje, įvedate tam tikrą tekstą, o mašina bando pasakyti jums tinkamiausius dalykus, kurių ieškote. Tik mes tai darome vektorių erdvėje”, – sako Liu.

Jų metodas ne tik padėjo rasti geresnius atitikmenis nei modeliai, su kuriais jie lygino, bet ir yra lengviau suprantamas.

Kadangi modelis vektoriams žymėti galėjo naudoti tik 1,000 iš viso žodžių, vartotojas gali lengviau suprasti, kokius žodžius mašina naudojo darydama išvadą, kad vaizdo įrašas ir sakomi žodžiai yra panašūs. Dėl to modelį būtų lengviau taikyti realiose situacijose, kai labai svarbu, kad naudotojai suprastų, kaip jis priima sprendimus, sako Liu.

Modelis vis dar turi tam tikrų trūkumų, kuriuos jie tikisi pašalinti būsimuose darbuose. Pirma, jų tyrime daugiausia dėmesio skirta dviejų modalumų duomenims vienu metu, tačiau realiame pasaulyje žmonės vienu metu susiduria su daugeliu duomenų modalumų, sako Liu.

„Ir mes žinome, kad 1,000 žodžiai veikia tokio tipo duomenų rinkiniuose, tačiau nežinome, ar tai galima pritaikyti realaus pasaulio problemoms”, – priduria jis.

Be to, jų duomenų rinkiniuose esančiuose vaizduose ir vaizdo įrašuose buvo paprasti objektai arba nesudėtingi veiksmai; realaus pasaulio duomenys yra daug chaotiškesni. Jie taip pat nori nustatyti, kaip gerai jų metodas pritaikomas, kai yra didesnė įvesties duomenų įvairovė.

Šį tyrimą iš dalies rėmė MIT-IBM Watson AI Lab ir jai priklausančios bendrovės Nexplore ir Woodside bei MIT Linkolno laboratorija.

Dalintis211Dalintis132Siųsti
Sekantis
Juodosios dėžės modelių išpakavimas

Juodosios dėžės modelių išpakavimas

Parašykite komentarą Atšaukti atsakymą

El. pašto adresas nebus skelbiamas. Būtini laukeliai pažymėti *

Sutinku su taisyklėmis ir nuostatomis bei privatumo politika.

Naujausi komentarai

  • Buvusi koncerte apie Žolinių ir Svėdasų 522-ojo gimtadienio šventė
  • Negali būti apie Pasipiktino mamos elgesiu Nidos kavinėje: kur valgau – ten kakoju, kitą kartą galima ant stalo
  • Kipras apie Pasipiktino mamos elgesiu Nidos kavinėje: kur valgau – ten kakoju, kitą kartą galima ant stalo
  • Ka apie Kodėl vis daugiau lietuvių perka Bitcoin
  • Ignas apie Ukrainos auka – pirmas žingsnis į Trečiąjį pasaulinį?

Tema

  • Gyvenimo būdas
    • Gyvūnai
    • Kelionės
    • Laisvalaikis
    • Maistas ir Receptai
    • Muzika ir Filmai
    • Namai ir Statybos
    • Psichologija
    • Šeima
    • Stilius ir Grožis
    • Sveikata
    • Transportas
    • Žmonės
  • Horoskopai
  • Įdomybės
  • Kriminalai
  • Miestai
    • Alytaus naujienos
    • Kaišiadorių naujienos
    • Kauno naujienos
    • Klaipėdos naujienos
    • Pajūrio naujienos
    • Palangos naujienos
    • Panevėžio naujienos
    • Radviliškio naujienos
    • Šiaulių naujienos
    • Varėnos naujienos
    • Vilniaus naujienos
  • Naujausios
  • Naujienos Lietuvoje
  • Pasaulio naujienos
  • Politika
  • Pranešimai spaudai
  • Sporto naujienos
  • Technologijos ir Mokslas
    • Dirbtinis intelektas
    • Kriptovaliutos
    • Metaverse
    • SpaceX
  • Ukrainos naujienos
  • Verslo žinios

Partneriai

  • Zinoti.lt
  • Kosmetika | Pickcartline
  • Autosel.lt – automobilių prekyba
  • Baldai namams | Baldai sodui | Mobellex.lt
  • Sharklinker
  • AOGX | Ark of Genesis
  • Möbel für Haus und Garten | Mobellex.de
  • CBDnutzen.de
  • Maisto papildai | Boostexter.com
  • Reidas Official
  • OHOHO.lt
  • Čiužiniai

Tiksaviems yra karščiausių naujienų šiandien portalas, kurio tikslas - pateikti savo skaitytojams naujienas iš viso pasaulio. Apžvelgiame viską - nuo politinių naujienų iki gyvenimo būdo turinio.

Naujienos

  • Smurtavo naktį
  • Penki medicinos proveržiai 2025 metais: atradimai, galintys pakeisti sunkių ligų gydymą
  • Difficulty of organizing a European New Year’s concert for children

Kategorijos

Naujausi komentarai

  • Buvusi koncerte apie Žolinių ir Svėdasų 522-ojo gimtadienio šventė
  • Negali būti apie Pasipiktino mamos elgesiu Nidos kavinėje: kur valgau – ten kakoju, kitą kartą galima ant stalo
  • Kipras apie Pasipiktino mamos elgesiu Nidos kavinėje: kur valgau – ten kakoju, kitą kartą galima ant stalo
  • Reklama
  • Apie mus
  • Privatumo politika
  • Kontaktai

© 2025 Tiksaviems - Karščiausios naujienos šiandien. Visos teisės saugomos. Ukmergės žinios - Jonavos žinios - German News - Spain News - Travels

Sveiki sugrįžę!

Prisijungti su Google
Arba

Prisijunkite

Pamiršote slaptažodį?

Retrieve your password

Please enter your username or email address to reset your password.

Turite paskyrą? Prisijunkite
Tvarkyti sutikimą
Siekdami teikti geriausią patirtį, įrenginio informacijai saugoti ir (arba) pasiekti naudojame tokias technologijas kaip slapukus. Jei sutiksime su šiomis technologijomis, galėsime apdoroti duomenis, tokius kaip naršymo elgsena arba unikalūs ID šioje svetainėje. Nesutikimas arba sutikimo atšaukimas gali neigiamai paveikti tam tikras funkcijas ir funkcijas.
Funkcinis Visada aktyvus
Techninė saugykla arba prieiga yra griežtai būtina siekiant teisėto tikslo – sudaryti sąlygas naudotis konkrečia paslauga, kurios aiškiai paprašė abonentas arba naudotojas, arba tik tam, kad būtų galima perduoti ryšį elektroninių ryšių tinklu.
Parinktys
Techninė saugykla arba prieiga yra būtina teisėtam tikslui išsaugoti nuostatas, kurių neprašo abonentas ar vartotojas.
Statistika
Techninė saugykla arba prieiga, kuri naudojama tik statistiniais tikslais. Techninė saugykla arba prieiga, kuri naudojama tik anoniminiais statistikos tikslais. Be teismo šaukimo, jūsų interneto paslaugų teikėjo savanoriško įsipareigojimo ar papildomų įrašų iš trečiosios šalies, vien šiuo tikslu saugoma ar gauta informacija paprastai negali būti naudojama jūsų tapatybei nustatyti.
Rinkodara
Techninė saugykla arba prieiga reikalinga norint sukurti naudotojo profilius reklamai siųsti arba sekti vartotoją svetainėje ar keliose svetainėse panašiais rinkodaros tikslais.
  • Tvarkyti parinktis
  • Tvarkyti paslaugas
  • Tvarkyti {vendor_count} pardavėjus
  • Skaitykite daugiau apie šiuos tikslus
Peržiūrėti nuostatas
  • {title}
  • {title}
  • {title}
No Result
View All Result
  • Naujausios
  • Naujienos Lietuvoje
  • Pasaulio naujienos
  • Ukrainos naujienos
  • Politika
  • Verslo žinios
  • Kriminalai
  • Gyvenimo būdas
  • Laisvalaikis
  • Gyvūnai
  • Kelionės
  • Technologijos ir Mokslas
    • Kriptovaliutos
    • Dirbtinis intelektas
    • Metaverse
    • SpaceX
  • Maistas ir Receptai
  • Muzika ir Filmai
  • Namai ir Statybos
  • Psichologija
  • Šeima
  • Stilius ir Grožis
  • Sveikata
  • Transportas
  • Žmonės
  • Horoskopai
  • Įdomybės
  • Miestai
    • Alytaus naujienos
    • Kaišiadorių naujienos
    • Kauno naujienos
    • Klaipėdos naujienos
    • Pajūrio naujienos
    • Palangos naujienos
    • Panevėžio naujienos
    • Radviliškio naujienos
    • Raseinių naujienos
    • Šiaulių naujienos
    • Varėnos naujienos
    • Vilniaus naujienos
  • Pranešimai spaudai
  • Sporto naujienos
Reklamos įkainiai
Kontaktai

© 2025 Tiksaviems - Karščiausios naujienos šiandien. Visos teisės saugomos. Ukmergės žinios - Jonavos žinios - German News - Spain News - Travels