Horoskopai
Pranešti naujieną
  • Prisijungti
Karščiausios naujienos šiandien
No Result
View All Result
Reklamos įkainiai
Kontaktai
  • Naujienos Lietuvoje
    • Kriminalai
    • Politika
  • Pasaulio naujienos
    • Ukrainos naujienos
  • Sporto naujienos
  • Įdomybės
  • Technologijos ir Mokslas
    • Kriptovaliutos
    • Dirbtinis intelektas
    • Metaverse
    • SpaceX
  • Gyvenimo būdas
    • Sveikata
    • Maistas ir Receptai
    • Muzika ir Filmai
    • Kelionės
    • Namai ir Statybos
    • Gyvūnai
    • Stilius ir Grožis
    • Psichologija
    • Šeima
    • Laisvalaikis
    • Įdomybės
    • Transportas
  • Verslo žinios
  • Miestai
    • Alytaus naujienos
    • Kaišiadorių naujienos
    • Kauno naujienos
    • Klaipėdos naujienos
    • Pajūrio naujienos
    • Palangos naujienos
    • Panevėžio naujienos
    • Radviliškio naujienos
    • Raseinių naujienos
    • Šiaulių naujienos
    • Varėnos naujienos
    • Vilniaus naujienos
  • Naujienos Lietuvoje
    • Kriminalai
    • Politika
  • Pasaulio naujienos
    • Ukrainos naujienos
  • Sporto naujienos
  • Įdomybės
  • Technologijos ir Mokslas
    • Kriptovaliutos
    • Dirbtinis intelektas
    • Metaverse
    • SpaceX
  • Gyvenimo būdas
    • Sveikata
    • Maistas ir Receptai
    • Muzika ir Filmai
    • Kelionės
    • Namai ir Statybos
    • Gyvūnai
    • Stilius ir Grožis
    • Psichologija
    • Šeima
    • Laisvalaikis
    • Įdomybės
    • Transportas
  • Verslo žinios
  • Miestai
    • Alytaus naujienos
    • Kaišiadorių naujienos
    • Kauno naujienos
    • Klaipėdos naujienos
    • Pajūrio naujienos
    • Palangos naujienos
    • Panevėžio naujienos
    • Radviliškio naujienos
    • Raseinių naujienos
    • Šiaulių naujienos
    • Varėnos naujienos
    • Vilniaus naujienos
Karščiausios naujienos šiandien
No Result
View All Result

Padėti kompiuterinio matymo ir kalbos modeliams suprasti, ką mato

Paskelbė Naujienų portalas Tiksaviems
2023-09-14
in Be kategorijos
Skaitymo laikas: 7 min.
517
A A
0
Padėti kompiuterinio matymo ir kalbos modeliams suprasti, ką mato

MIT mokslininkai sukūrė naują anotuotą sintetinį vaizdų duomenų rinkinį, kuriame vaizduojami įvairūs scenarijai, kurie gali būti naudojami siekiant padėti mašininio mokymosi modeliams suprasti scenos sąvokas. Nuotraukoje pavaizduota scena iš sintetinių duomenų rinkinio, o išsamus teksto aprašymas sako: „Šioje scenoje yra dėžutė ir vienas žmogus. Jie yra pilies griuvėsiuose su senais akmenimis. Dėžė yra žmogaus kairėje. Dėžutė yra priešais žmogų. Žmogus šuolis sukasi. Žmogus yra vyriškos lyties. Žmogus dėvi juodus marškinėlius ir tamsiai mėlynus džinsus.” Galingi mašininio mokymosi algoritmai, žinomi kaip regėjimo ir kalbos modeliai, mokantys suderinti tekstą su vaizdais, davė puikių rezultatų, kai buvo paprašyta generuoti antraštes arba apibendrinti vaizdo įrašus.

Nors šie modeliai puikiai identifikuoja objektus, jiems dažnai sunku suprasti sąvokas, pvz., objekto atributus ar daiktų išdėstymą scenoje. Pavyzdžiui, vizijos ir kalbos modelis gali atpažinti puodelį ir stalą vaizde, bet nesuvokti, kad puodelis stovi ant stalo.

TAU TAIP PAT GALI PATIKTI

Saldumynų vartojimas nakčiai neigiamai veikia kraujospūdį: išvardytos 5 pasekmės

Vilniaus knygų mugė skaičiuoja ketvirtuosius karo Ukrainoje metus:  visada liks vieta, kurią palietė karas

Mokslininkai iš MIT, MIT-IBM Watson AI Lab ir kitur pademonstravo naują techniką, kuri naudoja kompiuterinius duomenis, padedančius regėjimo ir kalbos modeliams įveikti šį trūkumą.

Tyrėjai sukūrė sintetinį vaizdų duomenų rinkinį, kuriame vaizduojami įvairūs scenarijai, objektų išdėstymas ir žmogaus veiksmai kartu su išsamiais teksto aprašymais. Jie naudojo šį anotuotą duomenų rinkinį vizijos ir kalbos modeliams „pataisyti“, kad galėtų efektyviau išmokti sąvokas. Jų technika užtikrina, kad šie modeliai vis tiek gali tiksliai prognozuoti, kai mato tikrus vaizdus.

Išbandę koncepcijos supratimo modelius, mokslininkai nustatė, kad jų technika padidino tikslumą iki 10%. Tai galėtų patobulinti sistemas, kurios automatiškai subtitrus vaizdo įrašams arba patobulinti modelius, kurie natūralia kalba pateikia atsakymus į klausimus apie vaizdus, ​​naudojant programas tokiose srityse kaip el. prekyba ar sveikatos priežiūra.

„Šiuo darbu mes peržengiame daiktavardžių ribas ta prasme, kad ne tik objektų pavadinimus, bet ir daugiau semantinės objekto sampratos ir visko aplink jį. Mūsų idėja buvo ta, kad mašininio mokymosi modelis mato objektus. daugelyje skirtingų išdėstymų jis geriau supras, kaip išdėstymas yra svarbus scenoje“, – sako Khaledas Shehada, Elektros inžinerijos ir informatikos katedros magistrantas ir straipsnio apie šią techniką bendraautoris.

Shehada parašė straipsnį kartu su pagrindine autorė Paola Cascante-Bonilla, informatikos magistrantė Rice universitete; Aude Oliva, MIT Schwarzman skaičiavimo koledžo strateginių pramonės įsipareigojimų direktorius, MIT-IBM Watson AI laboratorijos direktorius ir vyresnysis tyrėjas Kompiuterių mokslo ir dirbtinio intelekto laboratorijoje (CSAIL); vyresnysis autorius Leonidas Karlinskis, MIT-IBM Watson AI laboratorijos mokslo darbuotojas; ir kiti iš MIT, MIT-IBM Watson AI Lab, Georgia Tech, Rice universiteto, École des Ponts, Weizmann mokslo instituto ir IBM tyrimų. Pranešimas bus pristatytas Tarptautinėje kompiuterinės vizijos konferencijoje, vyksiančioje Paryžiuje spalio 2–6 d.

Dėmesys objektams

Regėjimo ir kalbos modeliai paprastai išmoksta identifikuoti objektus scenoje ir gali nepaisyti objekto atributų, tokių kaip spalva ir dydis, arba padėties santykių, pvz., kuris objektas yra ant kito objekto.

Taip yra dėl metodo, kuriuo šie modeliai dažnai mokomi, vadinamo kontrastiniu mokymusi. Šis mokymo metodas apima modelio privertimą numatyti vaizdų ir teksto atitikimą. Lyginant natūralius vaizdus, ​​kiekvienos scenos objektai dažniausiai sukelia ryškiausius skirtumus. (Galbūt viename paveikslėlyje pavaizduotas arklys lauke, o antrame – burlaivis ant vandens.)

„Kiekvieną vaizdą galima išskirtinai apibrėžti vaizde esančiais objektais. Taigi, kai atliekate kontrastinį mokymąsi, problemą išspręstumėte vien sutelkus dėmesį į daiktavardžius ir objektus. Kodėl modelis turėtų daryti ką nors kitaip?” sako Karlinskis.

Tyrėjai siekė sušvelninti šią problemą naudodami sintetinius duomenis, kad patikslintų vizijos ir kalbos modelį. Tikslaus derinimo procesas apima modelio, kuris jau buvo išmokytas pagerinti konkrečią užduotį, koregavimą.

Jie naudojo kompiuterį, kad automatiškai sukurtų sintetinius vaizdo įrašus su įvairia 3D aplinka ir objektais, tokiais kaip baldai ir bagažas, ir pridėjo žmonių avatarus, kurie sąveikavo su objektais.

Naudodami atskirus šių vaizdo įrašų kadrus, jie sugeneravo beveik 800 000 fotorealistiškų vaizdų ir kiekvieną suporavo su išsamia antrašte. Tyrėjai sukūrė metodiką, kaip anotuoti kiekvieną vaizdo aspektą, kad būtų aiškiai ir nuosekliai užfiksuoti objekto atributai, padėties santykiai ir žmogaus bei objekto sąveika tankiuose antraštėse.

Kadangi tyrėjai kūrė vaizdus, ​​jie galėjo kontroliuoti objektų išvaizdą ir padėtį, taip pat žmonių avatarų lytį, drabužius, pozas ir veiksmus.

„Sintetiniai duomenys suteikia daug įvairovės. Turėdami tikrus vaizdus, ​​galite neturėti daug dramblių kambaryje, bet su sintetiniais duomenimis, jei norite, kambaryje su žmogumi iš tikrųjų galėtumėte turėti rožinį dramblį”, – sakė Cascante. – sako Bonilla.

Sintetiniai duomenys turi ir kitų privalumų. Juos generuoti pigiau nei tikrus duomenis, tačiau vaizdai yra labai fotorealistiški. Jie taip pat išsaugo privatumą, nes vaizduose nerodomi jokie tikri žmonės. Kadangi duomenis kompiuteris sukuria automatiškai, jie gali būti greitai generuojami didžiuliais kiekiais.

Naudodami skirtingus fotoaparato požiūrio taškus arba šiek tiek pakeisdami objektų padėtis ar atributus, mokslininkai sukūrė duomenų rinkinį su daug įvairesniu scenarijų įvairove, nei būtų galima rasti natūraliame duomenų rinkinyje.

Sureguliuokite, bet nepamirškite

Tačiau tiksliai suderinus modelį su sintetiniais duomenimis, kyla pavojus, kad modelis gali „pamiršti“ tai, ko išmoko, kai iš pradžių buvo apmokytas naudojant tikrus duomenis.

Tyrėjai taikė keletą metodų, kad išvengtų šios problemos, pavyzdžiui, pakoregavo sintetinius duomenis, kad spalvos, apšvietimas ir šešėliai labiau atitiktų natūralių vaizdų spalvas. Jie taip pat pakoregavo modelio vidinį darbą, kad dar labiau sumažintų užmaršumą.

Jų sintetinis duomenų rinkinys ir tikslinimo strategija pagerino populiarių regėjimo ir kalbos modelių gebėjimą tiksliai atpažinti sąvokas iki 10%. Kartu modeliai nepamiršo to, ko jau buvo išmokę.

Dabar, kai jie parodė, kaip sintetiniai duomenys gali būti naudojami šiai problemai išspręsti, mokslininkai nori nustatyti būdus, kaip pagerinti šių duomenų vizualinę kokybę ir įvairovę, taip pat pagrindinę fiziką, dėl kurios sintetinės scenos atrodo tikroviškos. Be to, jie planuoja išbandyti mastelio keitimo ribas ir ištirti, ar modelio tobulinimas pradeda plisti naudojant didesnius ir įvairesnius sintetinių duomenų rinkinius.

Daugiau informacijos: Peržengti daiktavardžių ribas naudojant vizijos ir kalbos modelius naudojant sintetinius duomenis. olivalab.mit.edu/Papers/going_beyond_nouns.pdf

Ši istorija iš naujo paskelbta „MIT News“ (web.mit.edu/newsoffice/), populiarios svetainės, kurioje pateikiamos naujienos apie MIT tyrimus, inovacijas ir mokymą, dėka.

Citata: Pagalba kompiuterinės regos ir kalbos modeliams suprasti, ką mato (2023 m., rugsėjo 13 d.), gauta 2023 m. rugsėjo 13 d. iš https://techxplore.com/news/2023-09-vision-language.html

Šis dokumentas yra saugomas autorių teisių. Išskyrus bet kokius sąžiningus sandorius privačių studijų ar mokslinių tyrimų tikslais, jokia dalis negali būti atkuriama be raštiško leidimo. Turinys pateikiamas tik informaciniais tikslais.

Dalintis211Dalintis132Siųsti
Sekantis
Muskas, Zuckerbergas ir technologijų sunkiasvoriai susirenka į AI forumą Vašingtone

Muskas, Zuckerbergas ir technologijų sunkiasvoriai susirenka į AI forumą Vašingtone

Parašykite komentarą Atšaukti atsakymą

El. pašto adresas nebus skelbiamas. Būtini laukeliai pažymėti *

Sutinku su taisyklėmis ir nuostatomis bei privatumo politika.

Naujausi komentarai

  • Buvusi koncerte apie Žolinių ir Svėdasų 522-ojo gimtadienio šventė
  • Negali būti apie Pasipiktino mamos elgesiu Nidos kavinėje: kur valgau – ten kakoju, kitą kartą galima ant stalo
  • Kipras apie Pasipiktino mamos elgesiu Nidos kavinėje: kur valgau – ten kakoju, kitą kartą galima ant stalo
  • EleanorViolet Violet apie Mes ne triušiukai su skeltom lupytėm ir ne ožkytės, kad salotų lapus valgyti prie cepelinų, blynų, košių
  • Ka apie Kodėl vis daugiau lietuvių perka Bitcoin

Tema

  • Gyvenimo būdas
    • Gyvūnai
    • Kelionės
    • Laisvalaikis
    • Maistas ir Receptai
    • Muzika ir Filmai
    • Namai ir Statybos
    • Psichologija
    • Šeima
    • Stilius ir Grožis
    • Sveikata
    • Transportas
    • Žmonės
  • Horoskopai
  • Įdomybės
  • Kriminalai
  • Miestai
    • Alytaus naujienos
    • Kaišiadorių naujienos
    • Kauno naujienos
    • Klaipėdos naujienos
    • Pajūrio naujienos
    • Palangos naujienos
    • Panevėžio naujienos
    • Radviliškio naujienos
    • Šiaulių naujienos
    • Varėnos naujienos
    • Vilniaus naujienos
  • Naujausios
  • Naujienos Lietuvoje
  • Pasaulio naujienos
  • Politika
  • Pranešimai spaudai
  • Sporto naujienos
  • Technologijos ir Mokslas
    • Dirbtinis intelektas
    • Kriptovaliutos
    • Metaverse
    • SpaceX
  • Ukrainos naujienos
  • Verslo žinios

Partneriai

  • Zinoti.lt
  • Kosmetika | Pickcartline
  • AOGX | Ark of Genesis
  • CBDnutzen.de
  • Maisto papildai | Boostexter.com
  • Reidas Official
  • OHOHO.lt

Tiksaviems yra karščiausių naujienų šiandien portalas, kurio tikslas - pateikti savo skaitytojams naujienas iš viso pasaulio. Apžvelgiame viską - nuo politinių naujienų iki gyvenimo būdo turinio.

Naujienos

  • Saldumynų vartojimas nakčiai neigiamai veikia kraujospūdį: išvardytos 5 pasekmės
  • Vilniaus knygų mugė skaičiuoja ketvirtuosius karo Ukrainoje metus:  visada liks vieta, kurią palietė karas
  • Seime diskutuota, kaip pagerinti kompleksinių paslaugų teikimą savivaldybėse

Kategorijos

Naujausi komentarai

  • Buvusi koncerte apie Žolinių ir Svėdasų 522-ojo gimtadienio šventė
  • Negali būti apie Pasipiktino mamos elgesiu Nidos kavinėje: kur valgau – ten kakoju, kitą kartą galima ant stalo
  • Kipras apie Pasipiktino mamos elgesiu Nidos kavinėje: kur valgau – ten kakoju, kitą kartą galima ant stalo
  • Reklama
  • Apie mus
  • Privatumo politika
  • Kontaktai

© 2025 Tiksaviems - Karščiausios naujienos šiandien. Visos teisės saugomos. Ukmergės žinios - Jonavos žinios - German News - Spain News - Travels

Sveiki sugrįžę!

Prisijungti su Google
Arba

Prisijunkite

Pamiršote slaptažodį?

Retrieve your password

Please enter your username or email address to reset your password.

Turite paskyrą? Prisijunkite
Tvarkyti sutikimą
Siekdami teikti geriausią patirtį, įrenginio informacijai saugoti ir (arba) pasiekti naudojame tokias technologijas kaip slapukus. Jei sutiksime su šiomis technologijomis, galėsime apdoroti duomenis, tokius kaip naršymo elgsena arba unikalūs ID šioje svetainėje. Nesutikimas arba sutikimo atšaukimas gali neigiamai paveikti tam tikras funkcijas ir funkcijas.
Funkcinis Visada aktyvus
Techninė saugykla arba prieiga yra griežtai būtina siekiant teisėto tikslo – sudaryti sąlygas naudotis konkrečia paslauga, kurios aiškiai paprašė abonentas arba naudotojas, arba tik tam, kad būtų galima perduoti ryšį elektroninių ryšių tinklu.
Parinktys
Techninė saugykla arba prieiga yra būtina teisėtam tikslui išsaugoti nuostatas, kurių neprašo abonentas ar vartotojas.
Statistika
Techninė saugykla arba prieiga, kuri naudojama tik statistiniais tikslais. Techninė saugykla arba prieiga, kuri naudojama tik anoniminiais statistikos tikslais. Be teismo šaukimo, jūsų interneto paslaugų teikėjo savanoriško įsipareigojimo ar papildomų įrašų iš trečiosios šalies, vien šiuo tikslu saugoma ar gauta informacija paprastai negali būti naudojama jūsų tapatybei nustatyti.
Rinkodara
Techninė saugykla arba prieiga reikalinga norint sukurti naudotojo profilius reklamai siųsti arba sekti vartotoją svetainėje ar keliose svetainėse panašiais rinkodaros tikslais.
  • Tvarkyti parinktis
  • Tvarkyti paslaugas
  • Tvarkyti {vendor_count} pardavėjus
  • Skaitykite daugiau apie šiuos tikslus
Peržiūrėti nuostatas
  • {title}
  • {title}
  • {title}
No Result
View All Result
  • Naujausios
  • Naujienos Lietuvoje
  • Pasaulio naujienos
  • Ukrainos naujienos
  • Politika
  • Verslo žinios
  • Kriminalai
  • Gyvenimo būdas
  • Laisvalaikis
  • Gyvūnai
  • Kelionės
  • Technologijos ir Mokslas
    • Kriptovaliutos
    • Dirbtinis intelektas
    • Metaverse
    • SpaceX
  • Maistas ir Receptai
  • Muzika ir Filmai
  • Namai ir Statybos
  • Psichologija
  • Šeima
  • Stilius ir Grožis
  • Sveikata
  • Transportas
  • Žmonės
  • Horoskopai
  • Įdomybės
  • Miestai
    • Alytaus naujienos
    • Kaišiadorių naujienos
    • Kauno naujienos
    • Klaipėdos naujienos
    • Pajūrio naujienos
    • Palangos naujienos
    • Panevėžio naujienos
    • Radviliškio naujienos
    • Raseinių naujienos
    • Šiaulių naujienos
    • Varėnos naujienos
    • Vilniaus naujienos
  • Pranešimai spaudai
  • Sporto naujienos
Reklamos įkainiai
Kontaktai

© 2025 Tiksaviems - Karščiausios naujienos šiandien. Visos teisės saugomos. Ukmergės žinios - Jonavos žinios - German News - Spain News - Travels