• Naujausi
Naujas Metodas Pagreitina Duomenų Gavimą Didžiulėse Duomenų Bazėse

Naujas Metodas Pagreitina Duomenų Gavimą Didžiulėse Duomenų Bazėse

prieš 9 mėnesiai
Vilniuje Statomi Grupinio Gyvenimo Namai: žmonės Su Negalia Gyvens Oriau Ir Savarankiškiau

Vilniuje Statomi Grupinio Gyvenimo Namai: žmonės Su Negalia Gyvens Oriau Ir Savarankiškiau

prieš 6 val
„Grand Prix Klaipėda 2023“ Turnyre – 23 Klaipėdiečių Medaliai

„Grand Prix Klaipėda 2023“ Turnyre – 23 Klaipėdiečių Medaliai

prieš 7 val
„Maniežo Taurės“ Varžybose – Mūsų Lengvaatlečių Pergalių Lietus

„Maniežo Taurės“ Varžybose – Mūsų Lengvaatlečių Pergalių Lietus

prieš 7 val
Numatyti nauji reikalavimai pavežėjams, taksi vairuotojams, vežimo organizatoriams ir taksi dispečerinėms

Numatyti nauji reikalavimai pavežėjams, taksi vairuotojams, vežimo organizatoriams ir taksi dispečerinėms

prieš 7 val
Ekologinių Danijos ūkių Sėkmės Paslaptis: Dėmesys Efektyvumui, Inovacijoms Ir Vartotojų Pasitikėjimas

Ekologinių Danijos ūkių Sėkmės Paslaptis: Dėmesys Efektyvumui, Inovacijoms Ir Vartotojų Pasitikėjimas

prieš 7 val
Nuo Kitų Metų Pradžios – Didesnės Socialinės Išmokos

Nuo Kitų Metų Pradžios – Didesnės Socialinės Išmokos

prieš 8 val
EIMIN: Didesnis Duomenų Prieinamumas Ir Pakartotinis Naudojimas Leistų Sutaupyti Daugiau Kaip 4 Mln. Eurų Valstybės Lėšų

EIMIN: Didesnis Duomenų Prieinamumas Ir Pakartotinis Naudojimas Leistų Sutaupyti Daugiau Kaip 4 Mln. Eurų Valstybės Lėšų

prieš 8 val
Gydymo įstaigos gaus daugiau lėšų už suteiktas paslaugas, medikai – didesnius atlyginimus

Gydymo įstaigos gaus daugiau lėšų už suteiktas paslaugas, medikai – didesnius atlyginimus

prieš 8 val
„Parsinešk Kalėdas į Savo Namus“ – Gruodžio 19 D. Visoje Lietuvoje Miškininkai Gyventojams Dovanos Eglių Ir Pušų šakas

„Parsinešk Kalėdas į Savo Namus“ – Gruodžio 19 D. Visoje Lietuvoje Miškininkai Gyventojams Dovanos Eglių Ir Pušų šakas

prieš 9 val
Nuo kitų metų gegužės – nauji reikalavimai pavežėjams, taksi vairuotojams, vežimo organizatoriams ir taksi dispečerinėms

Nuo kitų metų gegužės – nauji reikalavimai pavežėjams, taksi vairuotojams, vežimo organizatoriams ir taksi dispečerinėms

prieš 9 val
Policija Sulaikė Prabangų BMW – Paaiškėjo, Kad Lenkijoje Vogto Automobilio Vairuotojas Turi Apie 400 Administracinių Teisės Pažeidimų

Policija Sulaikė Prabangų BMW – Paaiškėjo, Kad Lenkijoje Vogto Automobilio Vairuotojas Turi Apie 400 Administracinių Teisės Pažeidimų

prieš 10 val
Antano Baranausko Literatūrinė Premija Skirta Mokslininkui Skirmantui Valentui

Antano Baranausko Literatūrinė Premija Skirta Mokslininkui Skirmantui Valentui

prieš 11 val
Karščiausios naujienos šiandien
No Result
View All Result
Reklamos įkainiai
Kontaktai
  • Naujienos lietuvoje
  • Pasaulio naujienos
  • Politika
  • Verslas
  • Kriminalai
  • Sporto naujienos
  • Technologijos ir Mokslas
    • Metaverse
    • SpaceX
    • Dirbtinis intelektas
  • Gyvenimo būdas
    • Sveikata
    • Maistas ir Receptai
    • Muzika ir Filmai
    • Kelionės
    • Namai ir Statybos
    • Gyvūnai
    • Stilius ir Grožis
    • Psichologija
    • Šeima
    • Laisvalaikis
  • Įdomybės
  • Naujienos lietuvoje
  • Pasaulio naujienos
  • Politika
  • Verslas
  • Kriminalai
  • Sporto naujienos
  • Technologijos ir Mokslas
    • Metaverse
    • SpaceX
    • Dirbtinis intelektas
  • Gyvenimo būdas
    • Sveikata
    • Maistas ir Receptai
    • Muzika ir Filmai
    • Kelionės
    • Namai ir Statybos
    • Gyvūnai
    • Stilius ir Grožis
    • Psichologija
    • Šeima
    • Laisvalaikis
  • Įdomybės
No Result
View All Result
Karščiausios naujienos šiandien
No Result
View All Result
Pagrindinis Technologijos ir Mokslas Dirbtinis intelektas

Naujas Metodas Pagreitina Duomenų Gavimą Didžiulėse Duomenų Bazėse

Paskelbė TikSaviems
2023-03-13
in Dirbtinis intelektas
Skaitymo laikas: 7 mins read
28 1
A A
0
Naujas Metodas Pagreitina Duomenų Gavimą Didžiulėse Duomenų Bazėse

Maišos naudojimas yra pagrindinė daugelio internetinių duomenų bazių, pvz., bibliotekos katalogo ar el. prekybos svetainės, operacija. Maišos funkcija generuoja kodus, kurie tiesiogiai nustato vietą, kurioje bus saugomi duomenys. Taigi, naudojant šiuos kodus, lengviau rasti ir gauti duomenis.

Tačiau kadangi tradicinės maišos funkcijos kodus generuoja atsitiktinai, kartais du duomenų vienetai gali būti maišomi su ta pačia verte. Tai sukelia susidūrimus – ieškodamas vieno elemento vartotojas atkreipia dėmesį į daug duomenų su ta pačia maišos verte. Norint rasti tinkamą, užtrunka daug ilgiau, todėl paieška lėtėja ir našumas sumažėja.

TAU TAIP PAT GALI PATIKTI

Užkardyta Daktaro „Aiskauda“ Veikla (Video)

Pastebėkite skirtumą: ar per 17 sekundžių galite pastebėti 6 skirtumus tarp dviejų nuotraukų?

Tam tikri maišos funkcijų tipai, vadinami tobulomis maišos funkcijomis, yra skirti pateikti duomenis taip, kad būtų išvengta susidūrimų. Tačiau juos sukurti kiekvienam duomenų rinkiniui užtrunka daug laiko ir apskaičiuojant reikia daugiau laiko nei tradicinėms maišos funkcijoms.

Kadangi maiša naudojama daugelyje programų, nuo duomenų bazės indeksavimo iki duomenų glaudinimo iki kriptografijos, greitos ir veiksmingos maišos funkcijos yra labai svarbios. Taigi mokslininkai iš MIT ir kitur nusprendė išsiaiškinti, ar jie galėtų panaudoti mašininį mokymąsi, kad sukurtų geresnes maišos funkcijas.

Jie nustatė, kad tam tikrose situacijose naudojant išmoktus modelius, o ne tradicines maišos funkcijas, gali atsirasti perpus mažiau susidūrimų. Šie išmokti modeliai sukuriami duomenų rinkinyje paleidžiant mašininio mokymosi algoritmą, kad būtų užfiksuotos konkrečios charakteristikos. Komandos eksperimentai taip pat parodė, kad išmokti modeliai dažnai buvo efektyvesni skaičiavimo požiūriu nei tobulos maišos funkcijos.

„Šiame darbe mes nustatėme, kad kai kuriose situacijose galime rasti geresnį kompromisą tarp maišos funkcijos skaičiavimo ir susidūrimų, su kuriais susidursime. Tokiose situacijose maišos funkcijos skaičiavimo laikas gali būti šiek tiek padidintas, tačiau tuo pačiu metu jos susidūrimai gali labai sumažėti“, – sako Ibrahimas Sabekas, kompiuterių mokslo ir dirbtinio intelekto MIT duomenų sistemų grupės postdoc. Laboratorija (CSAIL).

Jų tyrimas, kuris bus pristatytas 2023 m. tarptautinėje labai didelių duomenų bazių konferencijoje, parodo, kaip maišos funkcija gali būti sukurta taip, kad būtų žymiai pagreitinta paieška didžiulėje duomenų bazėje. Pavyzdžiui, jų technika galėtų pagreitinti skaičiavimo sistemas, kurias mokslininkai naudoja DNR, aminorūgščių sekoms ar kitai biologinei informacijai saugoti ir analizuoti.

Sabekas yra bendras šio straipsnio autorius su Elektros inžinerijos ir informatikos katedros (EECS) absolventu Kapilu Vaidya. Prie jų prisijungia bendraautoriai Dominick Horn, Miuncheno technikos universiteto magistrantas; Andreasas Kipfas, MIT postdoc; Michaelas Mitzenmacheris, Harvardo Johno A. Paulsono inžinerijos ir taikomųjų mokslų mokyklos kompiuterių mokslų profesorius; ir vyresnysis autorius Timas Kraska, MIT EECS docentas ir duomenų, sistemų ir AI laboratorijos direktorius.

Sumaišyti

Atsižvelgiant į duomenų įvestį arba raktą, tradicinė maišos funkcija generuoja atsitiktinį skaičių arba kodą, atitinkantį lizdą, kuriame bus saugomas tas raktas. Paprastas pavyzdys: jei į 10 lizdų reikia įdėti 10 klavišų, funkcija kiekvienai įvestiei generuotų sveikąjį skaičių nuo 1 iki 10. Labai tikėtina, kad du klavišai atsidurs tame pačiame lizde ir sukels susidūrimus.

Puikios maišos funkcijos suteikia alternatyvą be susidūrimų. Tyrėjai suteikia šiai funkcijai papildomų žinių, pvz., apie laiko tarpsnių, į kuriuos turi būti įdėta, skaičių. Tada jis gali atlikti papildomus skaičiavimus, kad išsiaiškintų, kur įdėti kiekvieną klavišą, kad būtų išvengta susidūrimų. Tačiau šie papildomi skaičiavimai apsunkina funkcijos kūrimą ir sumažina jos efektyvumą.

„Mums buvo įdomu, jei žinome daugiau apie duomenis – kad jie bus gauti iš tam tikro platinimo – ar galime panaudoti išmoktus modelius maišos funkcijai sukurti, kuri iš tikrųjų gali sumažinti susidūrimų skaičių? Vaidya sako.

Duomenų paskirstymas rodo visas galimas duomenų rinkinio reikšmes ir tai, kaip dažnai kiekviena reikšmė atsiranda. Paskirstymas gali būti naudojamas apskaičiuojant tikimybę, kad tam tikra reikšmė yra duomenų pavyzdyje.

Tyrėjai paėmė nedidelį pavyzdį iš duomenų rinkinio ir naudojo mašininį mokymąsi, kad apytiksliai apskaičiuotų duomenų pasiskirstymo formą arba duomenų paskirstymą. Tada išmoktas modelis naudoja aproksimaciją, kad nuspėtų rakto vietą duomenų rinkinyje.

Jie nustatė, kad išmoktus modelius buvo lengviau sukurti ir juos paleisti greičiau nei tobulas maišos funkcijas ir kad jie sukėlė mažiau susidūrimų nei naudojant tradicines maišos funkcijas, jei duomenys paskirstomi nuspėjamu būdu. Tačiau jei duomenys nenuspėjamai paskirstomi, nes tarpai tarp duomenų taškų per daug skiriasi, naudojant išmoktus modelius gali atsirasti daugiau susidūrimų.

„Galime turėti daug duomenų įvesties, o tarpai tarp nuoseklių įvesties duomenų labai skiriasi, todėl gana sunku išmokti modelį, leidžiantį užfiksuoti šių įvesties duomenų pasiskirstymą“, – aiškina Sabekas.

Mažiau susidūrimų, greitesni rezultatai

Kai duomenys buvo paskirstomi nuspėjamai, išmokti modeliai gali sumažinti susidūrimo raktų santykį duomenų rinkinyje nuo 30 procentų iki 15 procentų, palyginti su tradicinėmis maišos funkcijomis. Jie taip pat sugebėjo pasiekti geresnį pralaidumą nei tobulos maišos funkcijos. Geriausiais atvejais išmokti modeliai sutrumpino veikimo laiką beveik 30 procentų.

Tyrinėdami išmoktų modelių naudojimą maišai, mokslininkai taip pat nustatė, kad pralaidumui didžiausią įtaką turėjo antrinių modelių skaičius. Kiekvienas išmoktas modelis sudarytas iš mažesnių linijinių modelių, kurie apytiksliai apskaičiuoja skirtingų duomenų dalių pasiskirstymą. Naudojant daugiau antrinių modelių, išmoktas modelis sukuria tikslesnį apytikslį apskaičiavimą, tačiau tam reikia daugiau laiko.

„Esant tam tikram submodelių slenksčiui, jūs gaunate pakankamai informacijos, kad sukurtumėte aproksimaciją, kurios jums reikia maišos funkcijai. Tačiau po to tai nepadės didesnio susidūrimų mažinimo“, – sako Sabekas.

Remdamiesi šia analize, mokslininkai nori naudoti išmoktus modelius, kad sukurtų kitų tipų duomenų maišos funkcijas. Jie taip pat planuoja ištirti išmoktą maišą duomenų bazėms, į kurias galima įterpti arba ištrinti duomenis. Kai duomenys atnaujinami tokiu būdu, modelis turi atitinkamai keistis, tačiau modelio keitimas išlaikant tikslumą yra sudėtinga problema.

„Norime paskatinti bendruomenę naudoti mašininį mokymąsi pagrindinėse duomenų struktūrose ir algoritmuose. Bet kokia pagrindinė duomenų struktūra suteikia mums galimybę naudoti mašininį mokymąsi, kad užfiksuotume duomenų ypatybes ir pagerintume našumą. Dar daug ką galime ištirti“, – sako Sabekas.

„Maišos ir indeksavimo funkcijos yra daugelio duomenų bazės funkcijų pagrindas. Atsižvelgiant į vartotojų ir naudojimo atvejų įvairovę, nėra vieno visiems tinkančio maišymo, o išmokti modeliai padeda pritaikyti duomenų bazę konkrečiam vartotojui. Šis dokumentas yra puiki subalansuota šių naujų metodų pagrįstumo analizė. Jame puikiai kalbama apie privalumus ir trūkumus, taip pat padeda mums suprasti, kada galima tikėtis, kad tokie metodai veiks gerai“, – sako Murali Narayanaswamy. pagrindinis „Amazon“ mašininio mokymosi mokslininkas, kuris nedalyvavo šiame darbe. „Tokių patobulinimų tyrinėjimas yra įdomi mokslinių tyrimų sritis tiek akademinėje bendruomenėje, tiek pramonėje, o šiame darbe parodytas griežtumas yra labai svarbus, kad šie metodai turėtų didelį poveikį.

Šį darbą iš dalies palaikė „Google“, „Intel“, „Microsoft“, JAV nacionalinis mokslo fondas, JAV oro pajėgų tyrimų laboratorija ir JAV oro pajėgų dirbtinio intelekto greitintuvas.

Dalintis14Dalintis9Siųsti
Sekantis
Premjerė pasveikino Jo Šventenybę Popiežių Pranciškų pontifikato 10-mečio proga

Premjerė pasveikino Jo Šventenybę Popiežių Pranciškų pontifikato 10-mečio proga

Parašykite komentarą Atšaukti atsakymą

El. pašto adresas nebus skelbiamas. Būtini laukeliai pažymėti *

Sutinku su taisyklėmis ir nuostatomis bei privatumo politika.

Naujausi komentarai

  • Petras. apie ES klimato ataskaita: rugsėjis sumušė karščio rekordus; 2023-ieji – karščiausių metų tempas
  • Cha apie „Quad“ FM išreiškė nepritarimą Rusijos ir Šiaurės Korėjos ginklų sandoriui
  • Matas D apie Europos centrinis bankas didina palūkanų normas, nes infliacija vis dar sparčiai auga ir gali būti „per didelė per ilgai“
  • Tomas apie Europos centrinis bankas didina palūkanų normas, nes infliacija vis dar sparčiai auga ir gali būti „per didelė per ilgai“
  • Jonis apie Ursula von der Leyen: Ukrainos ateitis slypi ES, įsipareigojo 30 šalių blokui

Naujienos

Vilniuje Statomi Grupinio Gyvenimo Namai: žmonės Su Negalia Gyvens Oriau Ir Savarankiškiau

Vilniuje Statomi Grupinio Gyvenimo Namai: žmonės Su Negalia Gyvens Oriau Ir Savarankiškiau

06/12/2023
„Grand Prix Klaipėda 2023“ Turnyre – 23 Klaipėdiečių Medaliai

„Grand Prix Klaipėda 2023“ Turnyre – 23 Klaipėdiečių Medaliai

06/12/2023
„Maniežo Taurės“ Varžybose – Mūsų Lengvaatlečių Pergalių Lietus

„Maniežo Taurės“ Varžybose – Mūsų Lengvaatlečių Pergalių Lietus

06/12/2023

Partneriai

  • CBD Aliejus
  • CBDnutzen.de
  • Skyrybos Lietuvoje
  • Mobellex

Tiksaviems yra karščiausių naujienų šiandien portalas, kurio tikslas - pateikti savo skaitytojams naujienas iš viso pasaulio. Apžvelgiame viską - nuo politinių naujienų iki gyvenimo būdo turinio.

Naujienos

  • Vilniuje Statomi Grupinio Gyvenimo Namai: žmonės Su Negalia Gyvens Oriau Ir Savarankiškiau
  • „Grand Prix Klaipėda 2023“ Turnyre – 23 Klaipėdiečių Medaliai
  • „Maniežo Taurės“ Varžybose – Mūsų Lengvaatlečių Pergalių Lietus

Kategorijos

Naujausi komentarai

  • Petras. apie ES klimato ataskaita: rugsėjis sumušė karščio rekordus; 2023-ieji – karščiausių metų tempas
  • Cha apie „Quad“ FM išreiškė nepritarimą Rusijos ir Šiaurės Korėjos ginklų sandoriui
  • Matas D apie Europos centrinis bankas didina palūkanų normas, nes infliacija vis dar sparčiai auga ir gali būti „per didelė per ilgai“
  • Reklama
  • Apie mus
  • Privatumo politika
  • Kontaktai

© 2023 Tiksaviems - Naujienos šiandien. Visos teisės saugomos. 24Newsy.com - 365Nachrichten.de - EntreNosotros.es - Ukmergės žinios - Jonavos žinios - SharkLinker

No Result
View All Result
  • Naujienos lietuvoje
  • Pasaulio naujienos
  • Politika
  • Verslas
  • Kriminalai
  • Sporto naujienos
  • Technologijos ir Mokslas
    • Metaverse
    • SpaceX
    • Dirbtinis intelektas
  • Gyvenimo būdas
    • Sveikata
    • Maistas ir Receptai
    • Muzika ir Filmai
    • Kelionės
    • Namai ir Statybos
    • Gyvūnai
    • Stilius ir Grožis
    • Psichologija
    • Šeima
    • Laisvalaikis
  • Įdomybės
Reklamos įkainiai

© 2023 Tiksaviems - Naujienos šiandien. Visos teisės saugomos. 24Newsy.com - 365Nachrichten.de - EntreNosotros.es - Ukmergės žinios - Jonavos žinios - SharkLinker

Sveiki sugrįžę!

Prisijunkite

Pamiršote slaptažodį?

Retrieve your password

Please enter your username or email address to reset your password.

Turite paskyrą? Prisijunkite