Terminology
Here is a list of terminology used in data management. The list is in the alphabetical order with the english word first, followed by the Estonian translation and the explanation of the term. This list was compiled together using the help of ETAG and University of Tartu Library. If you have any additions or reparations for the list, please contact us to let us know.
Analytics – analüütika
Analüüsimiseks kasutatavad statistilised ja visualiseeritavad tehnikad, mis on kasutusel andmetest oluliste mustrite leidmiseks, tõlgendamiseks ning edasi andmiseks.
Anonymisation – anonüümimine/anonümiseerimine
Teabest kõikide jälgede kaotamine, mis võiksid viia isikute tuvastamiseni. Kui pseudonüümimine ja krüptimine on tagasipööratav umbisikustamine, siis anonüümimine tähendab tagasipööramatut ehk lõplikku umbisikustamist. See tähendab, et ühtegi isikustavat dokumenti/faili ei tohi enam eksisteerida.
Application program interface (API) – rakendustarkvara liides
Arvutiprogrammides olevate alamprogrammide rutiinide, protokollide ja tööriistade komplektid, mille abil saab töövooge luua. Ülesandeks on lihtsustada tarkvara kasutamist, andes ette programmi plokid, mida programmeerijad kasutavad lõpliku töövoo koostamisel. Antud süsteem võimaldab lisaks suuremat paindlikkust ja analüüsimisvõimet tegelemaks andmetega. Näiteks, kombineerides API RDF-iga (ressursi kirjelduste tarkvararaamistik), on võimalik eri asukohtades olevad andmed linkida (ehk ühes kohas asuvate andmete uuendamisel sätestatakse automaatselt ka teises asukohas olevad andmed). Vt. lingitud andmed.
Article processing charge (APC) – avaldamistasu
Peamiselt avatud juurdepääsuga publikatsiooni avaldamisega seotud kulud, sh sisuline ja keeleline toimetamine, formaadi korrektuur, linkide lisamine jms. Siiski võivad avaldamistasu nõuda ka piiratud ligipääsuga ajakirjad. Kõrgetasemeliste ajakirjade artikli avaldamistasu on enamasti 1000–3000 eurot. Vt. kuldne avatud juurdepääs.
Big data – suurandmed
Andmed, mis on sedavõrd suure mahuga või nii keerulised, et nende töötlemiseks ei piisa tavapärastest vahenditest ja ressurssidest (näiteks sotsiaalmeedia andmed). Suurandmeid kirjeldavad 10 põhiomadust (The Big Vs): maht (volume), kiirus (velocity), sort (variety), varieeruvus (variability), õigsus (veracity), kehtivus (validity), haavatavus (vulnerability), volatiilsus (volatility), visualiseeritavus (visualisation), väärtus (value).
Cookbook/handbook – käsiraamat
Valdkonna spetsiifiline teadmiste või juhendite kogum, mis on ette nähtud teemaga tutvumiseks, tundma õppimiseks ja mõistete lahti seletamiseks. Üldjuhul sisaldab ka parimaid tavasid, mis on antud valdkonnas kasutusel; ning soovitatud programmide loendit, mis antud valdkonnas on soovituslikud.
CoreTrustSeal – usalduse pitser andmebaasile
Sertifikaat, mis antakse andmebaasile, mis suudab tõestada et nad on jätkusuutlikud ja usaldusväärsed. CoreTrustSeal märgis kehtib kolm aastat.
Data architecture – andmete arhitektuur
Organisatsioonisisene andmete kogumise, ladustamise, korralduse, integratsiooni ja kasutamise taristu, mida reguleeritakse mudelite, strateegiate, reeglite ja standarditega. Selle peamiseks ülesandeks on ametliku lähenemisviisi soovitamine andmevoo loomisele ja haldamisele ning selle töötlemiseks organisatsiooni IT-süsteemides ja rakendustes.
Data archive – andmete arhiiv
Keskkond, mis võimaldab andmeid hoiustada nii pika- kui ka lühiajaliselt. See on indekseeritud ning andmete leidmine ja kättesaamine on selgelt kirjeldatud.
Data backup – andmete varundamine
Andmetest varukoopiate tegemine, tänu millele on võimalik hilisemalt andmeid taastada.
Data format (file format) – andmete failivorming
Andmete struktureerimis- ja paigutusviis failis, andes andmetele (tekst, graafika, foto, video, audio) sellise kuju, et arvuti oleks võimeline neid töötlema. Arvuti tunneb ära faili lõpus oleva, peale punkti asuva sümbolite lühendi (failinime laiendi) ning saab aru, millise programmiga on võimalik faili loetavaks teha.
Data governance – andmete haldamine kõrgemal tasemel
Andmete haldamise toetamine andmespetsialisti abiga, riiklike poliitikate, protseduuride, standardite ja juhtivate tavade järgimise abil.
Data integrity – andmete terviklikkus
Andmed peavad pärinema autentsest allikast ning peab olema veendumus, et need ei ole muutunud ja/või neid ei ole hiljem ilma loata muudetud kogu andmete elutsükli jooksul.
Data jargon – andmeteaduse släng
Spetsiifiline sõnavara, mida kasutatakse andmete kohta.
Data literacy – andmete kirjaoskus
Võimekus lugeda, aru saada, luua ja kommunikeerida andmeid kui informatsiooni. See tähendab et mõistetakse, mida andmed püüavad öelda, täpselt nii nagu autor on seda mõelnud. Peamiselt koosneb viiest alustalast ja oskusest: andmete leidmine, lugemine, töötlemine, analüüsimine ning argumenteerimine.
Data Management Plan (DMP) – andmehaldusplaan
Uurimistöö juurde kuuluv kava, milles kirjeldatakse, milliseid andmeid uurimistöö projekti käigus toodetakse ja/või kogutakse, kuidas neid hallatakse, säilitatakse ja millistele andmetele võimaldatakse juurdepääs. Andmehaldusplaani eesmärgiks on kirjeldada kogu andmehalduse protsessi projekti jooksul ja peale projekti lõppemist. Andmehaldusplaan esitatakse koos uurimisprojekti taotlusega ning kasutatakse/täiendatakse kogu projekti vältel.
Data manager (DM) – andmehaldur
Organisatsioonis inimene, kes vastutab igapäevaselt andmete kogumise, haldamise ja analüüsimise eest vastavalt seatud plaanidele ning protseduuridele.
Data owner – andmete omanik
Andmete omamine on seaduslike õiguste omamine ja täielik kontroll ühe andmefaili või andmeelementide komplekti üle. See määratleb ja annab teavet andmete õigusjärgse omaniku ning rakendatud omamise, kasutamise ja levitamise poliitika kohta.
Data preservation – andmete säilitamine
Andmete hoiustamise sellisel viisil, mis kindlustab, et andmed ei kaoks juhuslikult ning need oleks kergesti leitavad tänu heale metaandmete kirjeldusele. Soovides hoiustada andmeid pikemaajaliselt, peab lisaks võtma arvesse ka failivormingut, mis on tulevikukindel. Lisaks peab vastutama ka kõigi võimalike manipulatsioonide eest, et antud faile ei oleks ühelgi hetkel ilma loata muudetud.
Data privacy – andmete privaatsus
Kindlaks määratud normid, kirjeldades kes, milleks ning mis tingimustel võib andmeid kasutada.
Data Protection Impact Assessment (DPIA) – andmekaitse mõju hindamine
GDPR artikkel 35 ütleb, et kui tegeletakse isikuandmetega, peab teostama andmekaitse mõjuhinnangu. Selle puhul hinnatakse “füüsiliste isikute õigusi ja vabadusi ohustava riski päritolu, olemust, eripära ja tõsidust”. Selle hinnangu tulemust tuleb võtta arvesse, kui hakatakse isikuandmete töötlemiseks vajalikke meetmeid kindlaks määrama.
Data protection officer (DPO) – andmekaitsespetsialist (AKS)
Asutuses spetsiaalselt määratud inimene, kes korraldab, et andmete töötlemine üksuses toimuks nõuetekohaselt. Ta teeb koostööd erinevate alamüksuste vahel, nõustab ja koolitab töötajaid andmekaitset puudutavatel teemadel ning on kontaktisikuks Andmekaitse Inspektsioonile (AKI).
Data provenance – andmete päritolu
Metaandmed, mis kirjeldavad andmete päritolu, muutusi tehtud andmetes ning detailid, mis näitavad andmete usaldusväärsust või kehtivust.
Data publishing – andmete avaldamine
Andmete või andmekogumike koostamine avalikuks kasutamiseks, tehes need kättesaadavaks kõigile soovijatele. See praktika on avatud teaduse liikumise lahutamatu osa.
Data repository – andmete repositoorium ehk andmekogu
Publikatsioonide ja andmete pikaajalise stabiilse säilitamise keskkond ja taristu.
Data scientist – andmeteadlane
Teadlane, kelle töö on valdkondade ülene, kasutades erinevaid tehnikaid ja lähenemisi, et saada teadmisi ja sügavamat arusaamist struktureeritud ja struktureerimata andmetest. Peamiselt tegeletakse andmekaeve ja suurandmetega (big data).
Data steward (DS) – andmespetsialist
Organisatsioonis inimene, kes vastutab organisatsiooni andmete üldise halduse eest (andmete kvaliteet, kasutatavus, eesmärkidele vastavus).
Data tweeps – andme säutsud
Platvormil Twitter edastatud sõnumid, mis on seotud andmetega ja andmehaldusega.
Dataset – andmekogum
Andme-elementidest koosnev hulk. Kõige sagedamini vastab andmekogum ühele andmebaasi tabelile või andmemaatriksile.
Digital Object Identifier (DOI) – digitaalse objekti identifikaator
Numbritest ja tähtedest koosnev unikaalne kood artiklitele ja/või dokumentidele.
E-infrastructure – e-taristu
Unikaalsed infotehnoloogiatel põhinevad taristud, mis võimaldavad kasutajatele lihtsa ja turvalise internetipõhise juurdepääsu teadustööks vajalikele ressurssidele, tööriistadele, meetoditele ja vahenditele, aidates sellega kaasa teadustegevuse veelgi komplekssemaks, globaalsemaks ja multidistsiplinaarsemaks muutumisele. E-taristud võivad olla näiteks suure võimsuse ja jõudlusega andmevõrgud (nt GÉANT), hajutatud arvutiinfrastruktuurid (võrgud ja pilved), superarvutusinfrastruktuurid, teadusandmeid koondavad ja talletavad infrastruktuurid ning nendega kaasnevad teenused (nt ELIXIR).
Embargo period – embargoperiood
Kirjastaja nõutud periood, mille jooksul ei tohi publikatsiooni täisteksti teha avalikult kättesaadavaks. Enamus avatud juurdepääsu regulatsioone sätestavad, et eelretsenseeritud teadusajakirjade artiklite puhul tuleks avatud juurdepääs tagada kohe publitseerimisel, kuid mitte hiljem kui 12 kuud pärast esmast publitseerimist sotsiaal- ja humanitaarteadustes ja maksimaalselt 6 kuud teistes teadusvaldkondades. Juhtivad teaduskirjastused standardlepingutes autoritega sageli sellised õiguseid teadusartiklite repositooriumites avaldamiseks ei anna, enamasti nõutakse pikemat viivitust avatud juurdepääsu andmisel. Vt. roheline avatud juurdepääs.
Encryption – krüptimine
Edastatava/hoitava teabe sisu kättesaamatuks muutmine. Lihtsaim viis krüptimiseks on ID-kaardiga krüptimine, krüptitud faile saavad avada vaid kindla isikukoodiga ID-kaardi valdajad.
FACT principles – FACT printsiibid
Akronüüm, mis viitab järgmistele põhimõtetele:
- Fair – õiglane
- Accurate – täpne
- Confidential – konfidentsiaalne
- Transparent – läbinähtav
Erinevalt FAIR printsiipidest, kirjeldavad FACT printsiibid rohkem teaduse fundamentaalseid põhimõtteid:
- Eelarvamusteta andmeteadus – kuidas vältida ebaõiglasi järjeldusi, isegi kui need on tõesed?
- Aimamata (juhupakkumistel baseeruv) andmeteadus – kuidas vastata küsimustele garanteeritud täpsusega?
- Konfidentsiaalsust tagav andmeteadus – kuidas vastata küsimustele saladusi’ paljastamata?
- Läbipaistev andmeteadus – kuidas selgitada vastuseid, et need muutuksid vaieldamatuks?
FAIR principles – FAIR printsiibid
Akronüüm, mis viitab järgmistele põhimõtetele:
- Findable – leitavad
- Accessible – ligipääsetavad
- Interoperable – koostalitlusvõimelised/ristkasutatavad
- Re-usable – taaskasutavad
Avatud teaduse andmete põhiprintsiibid. FAIR printsiibile vastavus tähendab, et andmed peaks olema kergesti leitavad, kõigile inimestele kättesaadavad, peaksid olema kergesti kasutatavad mitmetel platvormidel ning andmeid peaks olema alati võimalik taaskasutada.
Free cultural work – vaba kultuuriteos
Teos, sh teaduspublikatsioon, mille litsentsitingimused lubavad piiranguteta kasutamist ja jagamist igasugustel eesmärkidel. Vaba kultuuriteose definitsioonile vastavad CC BY ja CC BY-SA litsentsid, kuid mitte nt CC BY-NC, mis ei luba kasutamist ärilisel eesmärgil (vt https://creativecommons.org/freeworks).
General Data Protection Regulation (GDPR) – isikuandmete kaitse üldmäärus (IKÜM) või lihtsalt (andmekaitse) üldmäärus
Euroopa tasemel kindlaks määratud seadused ja määrused, mis kaitsevad eurooplaste ja Euroopas teostatud andmetöötluses käideldud isikute isikuandmeid. Üldmäärus hakkas kehtima 2018. aastal maikuus. Vt. https://www.aki.ee/et ja https://gdpr.eu/
Gold open access – kuldne avatud juurdepääs
Publikatsioon on kirjastuse veebilehel viivituseta ja lõplikul kujul kõigile tasuta kättesaadav. Kirjastamiskulud võivad olla publikatsiooni autorite kanda (vt artikliavaldamistasu) või toetab ajakirja väljaandmist mõni asutus või organisatsioon, nt ülikool, erialaliit või teaduste akadeemia. Enamiku Eesti teadusajakirjade puhul on kasutuses viimati nimetatud mudel ning autorid nendes ajakirjades avaldamistasu maksma ei pea. Kuldse avatud juurdepääsuga publikatsioonide täpsemad kasutustingimused pannakse paika konkreetse litsentsiga. Enamus avatud juurdepääsuga artikleid kasutavad nn Creative Commons litsentse. Selliseid publikatsioone on lubatud lõplikul kujul ka ise arhiveerida, talletades koopiat institutsionaalses (nt ülikooli digiarhiiv), riiklikus (nt ETIS) või rahvusvahelises repositooriumis (nt ArXiv ja PubMed Central).
Green open access – roheline avatud juurdepääs
Autor arhiveerib avaldatud teadusartikli või retsenseeritud käsikirja institutsionaalses (nt ülikooli digiarhiiv), riiklikus (nt ETIS) või rahvusvahelises repositooriumis (nt ArXiv ja PubMed Central), mille kaudu muutub see kõigile kättesaadavaks. Kirjastuste ja ajakirjade lõikes võivad isearhiveerimise tingimused olla erinevad. Enamasti rakendub kirjastaja nõudel embargoperiood, st isearhiveerimine on lubatud mitte varem kui 6–12 kuud peale artikli esmailmumist. Üldjuhul ei ole lubatud artikli lõpliku versiooni (vt trükifail) isearhiveerimine. Rohelise avatud juurdepääsu puhul autorid avaldamistasu ei maksa. Kirjastuste tegevuskulud kaetakse ajakirjade jt publikatsioonide tellimuste ja lisateenuste kaudu, mille eest tasuvad raamatukogud ja teadusasutused.
Informed consent – teadlik ehk informeeritud nõusolek
Otsusvõimelise inimese vabatahtlik nõusolek selleks, et temaga või temasse otseselt puutuvat (näiteks tema andmetega) midagi tehakse, kui ta seda andes on teadlik selle tegevuse olemusest ja eesmärgist ning selle võimalikest tagajärgedest. Nõusolek peab olema vabalt antud, spetsiifiline, informeeritud ja üheselt mõistetav. Lisaks, tänapäeval tuleb nõustuda mitte ainult uurimisprojektis osalemisega, vaid ka andmete arhiveerimisega ja jagamisega. Vajaduse korral peaksid nõusolekuvormid käsitlema andmete jagamise võimalust, andmete edaspidist avaldamist (sealhulgas hoidlas hoidmist) või andmete pikaajalist säilitamist taasesitamise tagamiseks.
Infrastructure data steward – infrastruktuuri andmespetsialist
Organisatsioonis inimene, kelle peamiseks ülesandeks on sobitada ette määratud poliitikad ja teaduse nõuded sobivateks IT-lahendusteks ja tööriistadeks. Lisaülesanneteks võivad olla IT-infrastruktuuri lahenduste rakendamine, andmetele ja tarkvarale ligipääsu määramine ning praktiliste ülesannete teostamine uurimisprojektis.
Linked data – lingitud/seostatud andmed
Internetti lisatud andmed, mis on omavahel seostatud (tavaliselt ühesuunaliste hüperviidetega). Seostamiseks kasutatakse veebis hüperteksti edastusprotokolli RDF- ja URI-tehnoloogiaid ning nende kirjeldamiseks luuakse ja kasutatakse ontoloogiaid. Lingitud andmete vahelised seosed ei ole mõeldud inimestele lugemiseks, vaid on loodud nii, et neid oleks lihtne automaatselt arvutitega töödelda ja moodustada suuremaid andmemassiive (andmebaase), millest infot pärida.
Long-term preservation – andmete pikaajaline säilitamine
Andmete hoiustamine sellisel viisil, mis võimaldab neid kasutada tulevikus.
Machine readability – masinloetavus
Failivorming, mis on struktureeritud selliselt, et tarkvararakendused suudavad spetsiifilisi andmeid, sealhulgas üksikuid faktiväiteid, ja nende sisemist struktuuri kergesti tuvastada, ära tunda ja välja lugeda.
Metadata – metaandmed
Objekti (publikatsioon, andmed jne) kirjeldamiseks kasutatav standardiseeritud informatsioonihulk. Üldiselt on nõutav autorlus, pealkiri, institutsioon, avaldamise aeg jpm.
Ontology – ontoloogia
Jagatud sõnavarad kirjeldamaks kindla ala mõisteid ning kategooriaid ja nendevahelisi suhteid.
Open access – avatud juurdepääs
Elektrooniline piiranguteta juurdepääs teadusinformatsioonile. Rahvusvaheliste kommertsalustel teaduskirjastuste tegevus põhineb seni valdavalt tellimustel põhineval ärimudelil (lugeja, raamatukogu või riik maksab) ning lõpptulemuse, teaduspublikatsioonide tasuta jagamist ei toimu. Avatud juurdepääsu poliitikate survel ning ka uusi sissetulekuvõimalusi nähes on juhtivad teaduskirjastused loonud uusi teadusväljaandeid, mis kasutavad kuldse avatud juurdepääsu ärimudelit (autor maksab reeglina avaldamistasu). Enamasti tuumikväljaannete ärimudelit ei ole muudetud, samas on loodud nn hübriidväljaannete autoritele võimalus artiklid „vabaks osta“. Hübriidväljaannete puhul on aga oht, et maksumaksja raha kulutatakse topelt – nii väljaannete tellimiseks raamatukogude kaudu kui artiklite avaldamiseks grandirahadest. Teadusväljaannete litsentsitingimustest ja isearhiveerimise reeglitest annab ülevaate SHERPA/ROMEO register (http://www.sherpa.ac.uk/romeo).
Open Data – avaandmed, avatud teadusandmed
Teadlaste, uurimisrühmade, uurimisasutuste või avaliku sektori poolt loodud ja teadustöös kasutatavad andmed, mis on tehtud elektrooniliselt vabalt kättesaadavaks kõigile inimestele. See tähendab, et andmeid saab taas-kasutada tasusid maksmata (tasuta; free-of-charge) ja ilma litsentsipiiranguteta (copyright restrictions).
Open licence – avatud sisulitsents
Publikatsioonid ja (teadus)andmed on üldjuhul autoriõiguse kaitse all ning avatud juurdepääs peab olema vastava litsentsiga kehtestatud (Creative Commons: CC-Zero, CC BY-SA jt; vt täpsem info http://www.hitsa.ee/teenused/autorioigused ja http://creativecommons.org).
Open methodology – avatud metodoloogia
Avalik ja vaba juurdepääs teadusuuringu läbiviimisel kasutatud meetoditele, vahenditele ja analüüsile.
Open peer review – avatud eelretsenseerimine
Teadusliku kvaliteedi tagamine läbipaistva ja jälgitava eelhindamise protsessiga.
Open researcher and contributor ID (ORCID) – avatud teadlase ja kaasautori ID
Iga teadlase unikaalne kood Internetis, millega saab siduda oma artikleid ja muid teadustööga seotud andmeid.
Open science – avatud teadus
Tähistab vaba juurdepääsu elektroonilisele teadusinformatsioonile, esmajoones publikatsioonidele ja teadusandmetele, mille loomiseks ja avaldamiseks on kasutatud avalikke vahendeid (ETag). Avatud teaduse eesmärk on muuta teadusuuringud avatud, globaalseks, loovaks ning koostööl põhinevaks, kasutades tänapäevaseid e-taristuid. Avatud teaduse kontseptsioon muudab teadusuuringud efektiivsemaks ja läbipaistvamaks, suurendab koostööd teadlaste ja teadusvaldkondade vahel, soodustab innovatsiooni ning on seega kasulik ühiskonnale.
Open source – avatud lähtekood
Avalik ja vaba juurdepääs tarkvaratoote algtekstidele.
Open source software – avatud lähtekoodiga tarkvara
Lähtekood ja sellega seonduv dokumentatsioon on kõigile kasutajatele vabalt kättesaadav nii tutvumiseks kui muutmiseks.
Peer review – eelretsenseerimine
Avaldamisele eelnev publikatsiooni sõltumatu hindamine vähemalt ühe vastava ala eksperdi poolt.
Persistent identifier (PID) – püsiidentifikaator
Ajas püsiv viide digitaalsele ressursile, mida kasutatakse publikatsioonide ja andmehulkade (aga ka muude digitaalsete objektide) otsimiseks, tuvastamiseks ja linkimiseks. See töötab isegi siis, kui objekti/ressursi esialgne asukoht on muutunud. PID lingib uue objekti asukohaga, muutmata enda aadressi. Näiteks ISBN (monograafiad), Handle ID (repositooriumid), DOI (publikatsioonid ja andmehulgad).
Personal data – isikuandmed
Teave inimese ehk füüsilise isiku (andmesubjekti) kohta, millega teda saab otse või kaudselt tuvastada: nimi, isikukood, asukohateave, võrguidentifikaatorid (tunnused, mis sidevõrgus aitavad viia konkreetse isikuni), samuti füüsilised, geneetilised, vaimsed, majanduslikud, kultuurilised ja mistahes muud tuvastamist võimaldavad tunnused ja nende kombinatsioonid. Isikuandmete töötlemine on andmetega tehtav mistahes toiming: kogumine, korrastamine, säilitamine, muutmine, lugemine, kasutamine, edastamine, ühendamine, kustutamine jne.
Policy data steward – strateegia/raamistiku andmespetsialist
Organisatsioonis inimene, kelle peamiseks ülesandeks on strateegiate arendamine ja andmehalduse tavade rakendamine, töötades tihedalt koos teiste tippjuhtide, poliitika kujundajate ja rahastajatega, luues sobivaid andmehaldusteenuseid ja infrastruktuuri. Selleks omab häid teadmisi nii kohalikest kui ka Euroopa tasemel olevatest nõuetest, reeglitest ja seadustest ning oskab neid tõlkida praktilisteks soovitusteks.
Post-print – järel-print
Artiklimustand, mis on eelretsenseerimise läbinud.
Preferred format – eelistatud failiformaat
Failitüübid, mida peetakse praegusel ajahetkel võimalikult tulevikukindlaks, st et on kergesti kasutatavad ka tulevikus.
Pre-print – eeltrükk
Artiklimustand, mis ei ole läbinud eelretsenseerimist.
Pre-registration – eel-registreerimine
Enne uurimistöö algust registreeritakse uurimise hüpotees, uurimistöö plaan, metodoloogia ja andmeanalüüsi skeem. Näiteks ETAGi PRG granditaotlus. Sarnane kliinilise uuringu registreerimisele, aga põhjalikum. Vt. Registered Reports (https://www.cos.io)
Pseudonymisation – pseudonüümimine/pseudonümiseerimine*
See tähendab äratuntavate isikuandmete asendamist varjunimede, numbrikoodide ja muude tunnustega, mida asjassepuutumatud isikud ei oska ilma mõistliku ressursikuluga ära arvata. Inimesed, kelle kohta antud andmed käivad, on siiski taas indentifitseeritavad, kasutades selleks identifitseerimisdokumenti (dokumenti, kus on kirjas mis andmed millega asendati).
Publisher’s PDF – trükifail
Viimane trükieelne publikatsiooni versioon, mis on läbinud eelretsenseerimise ja kus kõik detailid on lõplikult paigas.
Resource decription framework (RDF) – ressursi kirjelduse raamistik
RDF abiga defineeritakse digitaalsete objektide vahelised seosed. Esiteks, kõik digitaalsed objektid saavad ühtse ressursi identifikaator (URI; Uniform Resource Identifier), mis määratleb konkreetse allika asukoha ja lähenemise. Paljudel juhtudel on URI URL aadress. Iga digitaalne objekt on järgnevalt lingitud teiste objektidega RDF kolmikute kaudu. Lihtsustatult, RDF kolmik ütleb, et objekt X on seoses Y objektiga Z. Selliselt seoste esitamise viisi nimetatakse ka lingitud andmeteks.
Reproducibility – taasesitatavus
Uurimisandmed ja koodid tehakse kättesaadavaks, et teised saaksid jõuda samade tulemusteni, nagu väidetakse teaduslikes väljundites. Replitseeritavus (teadusmetoodika kordamine, et jõuda sarnaste järeldusteni) on tihedalt seotud taasesitatavusega. Need mõlemad kontseptsioonid on empiiriliste uuringute põhielemendid.
Research communication – teaduskommunikatsioon
Komplekssete uurimistulemuste tõlgendamine või tõlkimise protsess lihtsasse formaati või konteksti, mida suudaksid ka teised peale valdkonna ekspertide mõista.
Research data – uurimistöö andmed/teadusandmed
Kõik andmed, mis on loodud või kogutud uurimistöö käigus. Samas tuleb arvesse võtta, et teadusandmeteks ei muutu andmed, mis on kogutud muul otstarbel, kuid võivad leida rakendust teadustöös (nt keskkonnaseire andmestik).
Research data lifecycle – uurimistöö andmete elutsükkel
Uurimiseks kasutatavate andmete käsitlemise voog, alates teadustöö planeerimisest kuni andmete jagamise ja taaskasutamiseni välja. Üldiselt koosneb 7-st peamisest etapist, mida kasutatakse ka andmehaldusplaani koostamisel: teadustöö ja kogutavate andmete planeerimine, andmete kogumine, töötlemine, analüüs, säilitamine, jagamine ja taaskasutamine.
Research data management – uurimistöö andmete haldamine
Andmete aktiivne organiseerimine ja hooldamine kogu uurimistöö vältel ning andmete korrektne hoiustamine pärast uurimistöö lõppu.
Research data steward – teadustöö andmespetsialist
Organisatsioonis inimene, kelle peamiseks ülesandeks on teadlaste otsene nõustamine andmehalduse valdkonnas, vaadates, et järgitakse institutsionaalseid nõuded ja soovitusi. Lisaülesandena võib koostada valdkonna spetsiifilisi või projekti spetsiifilisi suuniseid ning töötada ka otse projektide kallal.
Scientific publication – teaduspublikatsioon
Eelretsenseeritud teadusartikkel või teaduslik üksikväljaanne, mis on kättesaadav kas täistekstina (paberkandjal või elektrooniliselt) või refereerituna/indekseerituna erialastes andmebaasides ja referaatajakirjades.
Self-archiving – isearhiveerimine
Vt. roheline avatud juurdepääs.
Sensitive personal data – eri liiki isikuandmed
Andmed, millest ilmneb rassiline või etniline päritolu, poliitilised vaated, usulised või filosoofilised veendumused või ametiühingusse kuulumine, geneetilised andmed, isiku kordumatuks tuvastamiseks kasutatavad biomeetrilised andmed, terviseandmed ja andmeid seksuaalelu ja seksuaalse sättumuse kohta.
Short-term preservation – lühiajaline andmete säilitamine
Stakeholder – huvipool
Asjast huvitatud isik, asjaosaline, osanik, huvipool. Isik, kes on huvitatud millegi käekäigust või sellest, milline otsus langetatakse, sest see puudutab tema heaolu.
Text and Data Mining (TDM) – teksti- ja andmekaeve
Automaatne protsess, mille abil saab suurtest andmehulkadest leida kasulikku infot ja sündmuse mustreid. Koosneb andmete eeltöötlusest, andmekaevest ja järeltöötlusest.
Trusted digital repository (TDR) – usaldusväärne digitaalne hoidla
Sertifitseeritud hoidla, mis on loodud tagama hoiustatud andmetele usaldusväärse ja jätkusuutliku juurdepääsu. TDR-sid võib sertifitseerida kolmel tasemel: põhisertifikaat koos CoreTrustSeal-i sertifikaadiga; laiendatud sertifikaat pärast seda, kui hoidla teostab ISO 16363 (või DIN 31644) kohase eneseauditi; ja vormingusertifikaat lisaks laiendatud sertifikaadile peale täiendava välise auditi ja sertifitseerimist ISO 16363 või DIN 3164410.
Uniform resource identifier (URI) – ühtne ressursi identifikaator
Andmetele ühtse tuvastamise märgi lisamine võimaldab andmeid kergemini leida ning neid omavahel võrrelda.
Virtual Research Environment (VRE) – virtuaalne uurimiskeskkond
VRE ühendab ühes keskkonnas erinevaid andmehalduse tööriistu, toetades teadlaste töövoogu ja turvalist töökeskkonda.
Vocabulary – sõnavara
Metaandmete kirjeldamiseks kasutatav standardiseeritud ja organiseeritud sõnavara.
Work package – tööpakett
Tööjaotuse struktuuri väikseim komponent. Tööpakett luuakse, kui jagatakse üldine eesmärk väiksemateks eesmärkideks/komponentideks. Tööpakett on loodud, kui töö eesmärke ei saa enam järgmisteks alltulemusteks või käegakatsutavateks projekti tulemusteks jagada. Tööpakett on viis mõista nii kulusid kui ka kestvust ning hallata neid kergesti.