Kreditas: Pixabay / CC0 viešasis domenas Kiekvieną kartą, kai mokslininkas atlieka eksperimentą, socialinis mokslininkas atlieka apklausą arba humanitarinis mokslininkas analizuoja tekstą, jie generuoja duomenis. Mokslas remiasi duomenimis – be jų neturėtume stulbinančių Jameso Webbo kosminio teleskopo vaizdų, ligų prevencinių vakcinų ar evoliucinio medžio, atsekančio visos gyvybės kilmę.
Ši stipendija sukuria neįsivaizduojamą kiekį duomenų – taigi, kaip mokslininkai tai seka? Ir kaip jie užtikrina, kad jį galėtų naudoti ir žmonės, ir mašinos?
Norėdami tobulinti ir tobulinti mokslą, mokslininkai turi sugebėti atkurti kitų duomenis arba sujungti duomenis iš kelių šaltinių, kad išmoktų ką nors naujo.
Bet koks dalijimasis reikalauja valdymo. Jei kaimynui reikia pasiskolinti įrankį ar ingredientą, turite žinoti, ar juos turite ir kur laikote. Tyrimo duomenys gali būti ant absolvento nešiojamojo kompiuterio, palaidoti profesoriaus USB kolekcijoje arba visam laikui išsaugoti internetinėje duomenų saugykloje.
Aš esu informacijos mokslininkas, tyrinėjantis kitus mokslininkus. Tiksliau, aš tyrinėju, kaip mokslininkai galvoja apie tyrimų duomenis ir būdus, kaip jie sąveikauja su savo ir kitų duomenimis. Taip pat moku studentus, kaip tvarkyti savo ar kitų duomenis taip, kad jie pagerintų žinias.
Tyrimo duomenų valdymas
Tyrimų duomenų valdymas – tai mokslo sritis, kurioje daugiausia dėmesio skiriama duomenų atradimui ir pakartotiniam naudojimui. Kaip sritis, ji apima tyrimų duomenų paslaugas, išteklius ir kibernetinę infrastruktūrą. Pavyzdžiui, vieno tipo infrastruktūra, duomenų saugykla, suteikia tyrėjams vietą, kur saugoti savo duomenis ilgalaikiam saugojimui, kad kiti galėtų juos rasti. Trumpai tariant, tyrimo duomenų valdymas apima duomenų gyvavimo ciklą nuo lopšio iki kapo iki reinkarnacijos kitame tyrime.
Prieinami ir naudojami duomenys gali padėti mokslininkams atkurti ankstesnius rezultatus. Tai yra svarbi mokslinio proceso dalis, kaip paaiškinama šiame TED-Ed vaizdo įraše. Tinkamas tyrimų duomenų valdymas taip pat leidžia mokslininkams naudoti jau esančius duomenis, o ne prisiminti jau esamus duomenis, o tai taupo laiką ir išteklius.
Didėjant mokslo politizavimui, daugelis nacionalinių ir tarptautinių mokslo organizacijų padidino atskaitomybės ir skaidrumo standartus. Federalinės agentūros ir kiti pagrindiniai mokslinių tyrimų finansuotojai, pavyzdžiui, Nacionaliniai sveikatos institutai, dabar teikia pirmenybę tyrimų duomenų valdymui ir reikalauja, kad mokslininkai turėtų duomenų valdymo planą, kad galėtų gauti lėšų.
Mokslininkai ir duomenų valdytojai gali dirbti kartu, kad pakeistų mokslininkų naudojamas sistemas, kad būtų lengviau rasti ir išsaugoti duomenis. Visų pirma, integravus AI, šie duomenys gali tapti labiau prieinami ir pakartotinai naudojami.
Dirbtinai protingas duomenų valdymas
Daugelis šių naujų mokslinių tyrimų duomenų valdymo standartų taip pat atsiranda dėl to, kad AI, įskaitant mašininį mokymąsi, vis dažniau naudojami duomenimis pagrįstose srityse. Dėl dirbtinio intelekto labai pageidautina, kad bet kokius duomenis būtų galima apdoroti mašinomis, ty juos galėtų naudoti mašinos be žmogaus įsikišimo. Dabar mokslininkai mašinas gali vertinti ne tik kaip įrankius, bet ir kaip potencialius savarankiškus duomenų pakartotinius naudotojus ir bendradarbius.
Raktas į mašininius duomenis yra metaduomenys. Metaduomenys yra aprašai, kuriuos mokslininkai nustato savo duomenims ir gali apimti tokius elementus kaip kūrėjas, data, aprėptis ir tema. Minimalūs metaduomenys yra minimalūs, tačiau teisingi ir išsamūs standartizuoti metaduomenys daro duomenis naudingesnius tiek žmonėms, tiek įrenginiams.
Reikia daugybės tyrimų duomenų tvarkytojų ir bibliotekininkų, kad mašininiu būdu valdomi duomenys taptų realybe. Šie informacijos specialistai stengiasi palengvinti mokslininkų ir sistemų bendravimą, užtikrindami bendrinamų duomenų kokybę, išsamumą ir nuoseklumą.
FAIR duomenų principai, kuriuos 2016 m. sukūrė tyrėjų grupė FORCE11 ir naudojami visame pasaulyje, pateikia gaires, kaip mašinoms ir žmonėms pakartotinai naudoti duomenis. FAIR duomenys yra randami, pasiekiami, sąveikūs ir pakartotinai naudojami – tai reiškia, kad jie turi patikimus ir išsamius metaduomenis.
Anksčiau aš tyrinėjau, kaip mokslininkai atranda ir pakartotinai naudoja duomenis. Pastebėjau, kad mokslininkai, ieškodami duomenų, linkę naudoti protinius sparčiuosius klavišus – pavyzdžiui, jie gali grįžti į pažįstamus ir patikimus šaltinius arba ieškoti tam tikrų pagrindinių terminų, kuriuos vartojo anksčiau. Idealiu atveju mano komanda galėtų sukurti šį ekspertų sprendimų priėmimo procesą ir pašalinti kuo daugiau šališkumo, kad patobulintų AI. Šių protinių nuorodų automatizavimas turėtų sumažinti daug laiko reikalaujančių reikalų ieškant reikiamų duomenų.
Duomenų valdymo planai
Tačiau vis dar yra vienas tyrimų duomenų valdymo elementas, kurio dirbtinis intelektas negali perimti. Duomenų valdymo planuose aprašoma, ką, kur, kada, kodėl ir kas tvarko tyrimų duomenis. Mokslininkai juos užpildo ir apibrėžia tyrimų duomenų valdymo vaidmenis ir veiklą tyrimo metu ir ilgai po jo. Jie atsako į tokius klausimus kaip: „Kas atsakingas už ilgalaikį išsaugojimą“, „Kur išliks duomenys“, „Kaip apsaugoti savo duomenis“ ir „Kas už visa tai moka?
Dotacijų pasiūlymams beveik visoms finansavimo agentūroms įvairiose šalyse dabar reikia duomenų valdymo planų. Šie planai rodo mokslininkams, kad jų duomenys yra vertingi ir pakankamai svarbūs, kad bendruomenė galėtų dalytis. Be to, planai padeda finansavimo agentūroms sekti tyrimus ir ištirti bet kokį galimą nusižengimą. Tačiau svarbiausia, kad jie padeda mokslininkams užtikrinti, kad jų duomenys būtų prieinami daugelį metų.
Padarius visus tyrimų duomenis kiek įmanoma SĄŽININGUS ir atvirus, bus pagerintas mokslinis procesas. O turint prieigą prie daugiau duomenų, atsiranda galimybė labiau pagrįstoms diskusijoms apie tai, kaip skatinti ekonomikos plėtrą, gerinti gamtos išteklių valdymą, stiprinti visuomenės sveikatą, kaip atsakingai ir etiškai kurti technologijas, kurios pagerintų gyvenimą. Visam intelektui, dirbtiniam ar kitokiam, bus naudingas geresnis tyrimų duomenų organizavimas, prieiga ir naudojimas.
Šis straipsnis iš naujo paskelbtas iš The Conversation pagal Creative Commons licenciją. Skaitykite originalų straipsnį.
Citata: AI ir nauji standartai žada padaryti mokslinius duomenis naudingesnius, nes jie bus pakartotinai naudojami ir pasiekiami (2023 m. rugpjūčio 22 d.), gauta 2023 m. rugpjūčio 22 d. iš https://techxplore.com/news/2023-08-ai-standards-scientific-reusable -pasiekiama.html
Šis dokumentas yra saugomas autorių teisių. Išskyrus bet kokius sąžiningus sandorius privačių studijų ar mokslinių tyrimų tikslais, jokia dalis negali būti atkuriama be raštiško leidimo. Turinys pateikiamas tik informaciniais tikslais.