Terminology

Here is a list of terminology used in data management. The list is in the alphabetical order with the english word first, followed by the estonian translation and the explanation of the term. This list was compiled together using the help of ETAg and University of Tartu Library. If you have any additions or reparations for the list, please contact us to let us know.

 

Analytics - analüütika. Analüüsimiseks kasutatavad statistilised ja visualiseeritavad tehnikad, mis on kasutusel andmetest oluliste mustrite leidmiseks, tõlgendamiseks ning edasi andmiseks. 

Anonymisation - anonüümimine/anonümiseerimine. Teabest kõikide jälgede kaotamine, mis võiksid viia isikute tuvastamiseni. Kui pseudonüümimine ja krüptimine on tagasipööratav umbisikustamine, siis anonüümimine tähendab tagasipööramatut ehk lõplikku umbisikustamist. See tähendab, et ühtegi isikustavat dokumenti/faili ei tohi enam eksisteerida. 

Application program interface (API) - rakendustarkvara liides. Arvutiprogrammides olevate alamprogrammide rutiinide, protokollide ja tööriistade komplektid, mille abil saab töövooge luua. Ülesandeks on lihtsustada tarkvara kasutamist, andes ette programmi plokid, mida programmeerijad kasutavad lõpliku töövoo koostamisel. Antud süsteem võimaldab lisaks suuremat paindlikkust ja analüüsimisvõimet tegelemaks andmetega. Näiteks, kombineerides API RDF-iga (ressursi kirjelduste tarkvararaamistik), on võimalik eri asukohtades olevad andmed linkida (ehk ühes kohas asuvate andmete uuendamisel sätestatakse automaatselt ka teises asukohas olevad andmed).  Vt lingitud andmed. 

Article processing charge (APC) - avaldamistasu. Peamiselt avatud juurdepääsuga publikatsiooni avaldamisega seotud kulud, sh sisuline ja keeleline toimetamine, formaadi korrektuur, linkide lisamine jms. Siiski võivad avaldamistasu nõuda ka piiratud ligipääsuga ajakirjad. Kõrgetasemeliste ajakirjade artikli avaldamistasu on enamasti 1000–3000 eurot. Vt. kuldne avatud juurdepääs.

Big data - suurandmed. Andmed, mis on sedavõrd suure mahuga või nii keerulised, et nende töötlemiseks ei piisa tavapärastest vahenditest ja ressurssidest (näiteks sotsiaalmeedia andmed). Suurandmeid kirjeldavad 10 põhiomadust (The Big Vs): maht (volume), kiirus (velocity), sort (variety), varieeruvus (variability), õigsus (veracity), kehtivus (validity), haavatavus (vulnerability), volatiilsus (volatility), visualiseeritavus (visualisation), väärtus (value). 

Cookbook/handbook - käsiraamat. Valdkonna spetsiifiline teadmiste või juhendite kogum, mis on ette nähtud teemaga tutvumiseks, tundma õppimiseks ja mõistete lahti seletamiseks. Üldjuhul sisaldab ka parimaid tavasid, mis on antud valdkonnas kasutusel; ning soovitatud programmide loendit, mis antud valdkonnas on soovituslikud.  

CoreTrustSeal - usalduse pitser andmebaasile. Sertifikaat, mis antakse andmebaasile, mis suudab tõestada et nad on jätkusuutlikud ja usaldusväärsed. CoreTrustSeal märgis kehtib kolm aastat. 

Data architecture - andmete arhitektuur. Organisatsioonisisene andmete kogumise, ladustamise, korralduse, integratsiooni ja kasutamise taristu, mida reguleeritakse mudelite, strateegiate, reeglite ja standarditega. Selle peamiseks ülesandeks on ametliku lähenemisviisi soovitamine andmevoo loomisele ja haldamisele ning selle töötlemiseks organisatsiooni IT-süsteemides ja rakendustes. 

Data archive - andmete arhiiv. Keskkond, mis võimaldab andmeid hoiustada nii pika- kui ka lühiajaliselt. See on indekseeritud ning andmete leidmine ja kättesaamine on selgelt kirjeldatud. 

Data backup - andmete varundamine. Andmetest varukoopiate tegemine, tänu millele on võimalik hilisemalt andmeid taastada. 

Data format (file format) - andmete failivorming. Andmete struktureerimise- ja paigutusviis failis, andes andmetele (tekst, graafika, foto, video, audio) sellise kuju, et arvuti oleks võimeline neid töötlema. Arvuti tunneb ära faili lõpus oleva, peale punkti asuva sümbolite lühendi (failinime laiendi) ning saab aru, millise programmiga on võimalik faili loetavaks teha. 

Data governance - andmete haldamine kõrgemal tasemel. Andmete haldamise toetamine andmespetsialisti abiga, riiklike poliitikate, protseduuride, standardite ja juhtivate tavade järgimise abil. 

Data integrity - andmete terviklikkus. Andmed peavad pärinema autentsest allikast ning peab olema veendumus, et need ei ole muutunud ja/või neid ei ole hiljem ilma loata muudetud kogu andmete elutsükli jooksul.

Data jargon - andmeteaduse släng. Spetsiifiline sõnavara, mida kasutatakse andmete kohta. 

Data literacy - andmete kirjaoskus. Võimekus lugeda, aru saada, luua ja kommunikeerida andmeid kui informatsiooni. See tähendab et mõistetakse, mida andmed püüavad öelda, täpselt nii nagu autor on seda mõelnud. Peamiselt koosneb viiest alustalast ja oskusest: andmete leidmine, lugemine, töötlemine, analüüsimine ning argumenteerimine. 

Data Management Plan (DMP) - andmehaldusplaan. Uurimistöö juurde kuuluv kava, milles kirjeldatakse, milliseid andmeid uurimistöö projekti käigus toodetakse ja/või kogutakse, kuidas neid hallatakse, säilitatakse ja millistele andmetele võimaldatakse juurdepääs. Andmehaldusplaani eesmärgiks on kirjeldada kogu andmehalduse protsessi projekti jooksul ja peale projekti lõppemist. Andmehaldusplaan esitatakse koos uurimisprojekti taotlusega ning kasutatakse/täiendatakse kogu projekti vältel.

Data manager (DM) - andmehaldur. Organisatsioonis inimene, kes vastutab igapäevaselt andmete kogumise, haldamise ja analüüsimise eest vastavalt seatud plaanidele ning protseduuridele. 

Data owner - andmete omanik. Andmete omamine on seaduslike õiguste omamine ja täielik kontroll ühe andmefaili või andmeelementide komplekti üle. See määratleb ja annab teavet andmete õigusjärgse omaniku ning rakendatud omamis-, kasutamise ja levitamise poliitika kohta. 

Data preservation - andmete säilitamine. Andmete hoiustamise sellisel viisil, mis kindlustab, et andmed ei kaoks juhuslikult ning need oleks kergesti leitavad tänu heale metaandmete kirjeldusele. Soovides hoiustada andmeid pikemaajaliselt, peab lisaks võtma arvesse ka failivormingut, mis on tulevikukindel. Lisaks peab vastutama ka kõigi võimalike manipulatsioonide eest, et antud faile ei oleks ühelgi hetkel ilma loata muudetud.  

Data privacy - andmete privaatsus. Kindlaks määratud normid, kirjeldades kes, milleks ning mis tingimustel võib andmeid kasutada. 

Data Protection Impact Assessment (DPIA) - andmekaitse mõju hindamine. GDPR artikkel 35 ütleb, et kui tegeletakse isikuandmetega, peab teostama andmekaitse mõjuhinnangu. Selle puhul hinnatakse “füüsiliste isikute õigusi ja vabadusi ohustava riski päritolu, olemust, eripära ja tõsidust”. Selle hinnangu tulemust tuleb võtta arvesse, kui hakatakse isikuandmete töötlemiseks vajalikke meetmeid kindlaks määrama. 

Data protection officer (DPO) - andmekaitsespetsialist (AKS). Asutuses spetsiaalselt määratud inimene, kes korraldab, et andmete töötlemine üksuses toimuks nõuetekohaselt. Ta teeb koostööd erinevate alamüksuste vahel, nõustab ja koolitab töötajaid andmekaitset puudutavatel teemadel ning on kontaktisikuks Andmekaitse Inspektsioonile (AKI). https://www.aki.ee/et 

Data provenance - andmete päritolu. Metaandmed, mis kirjeldavad andmete päritolu, muutusi tehtud andmetes ning detailid, mis näitavad andmete usaldusväärsust või kehtivust. 

Data publishing - andmete avaldamine. Andmete või andmekogumike koostamine avalikuks kasutamiseks, tehes need kättesaadavaks kõigile soovijatele. See praktika on avatud teaduse liikumise lahutamatu osa. 

Data repository - andmete repositoorium ehk andmekogu. Publikatsioonide ja andmete pikaajalise stabiilse säilitamise keskkond ja taristu.

Data scientist - andmeteadlane. Teadlane, kelle töö on valdkondade ülene, kasutades erinevaid tehnikaid ja lähenemisi, et saada teadmisi ja sügavamat arusaamist struktureeritud ja struktureerimata andmetest. Peamiselt tegeletakse andmekaeve ja suurandmetega (big data). 

Data steward (DS) - andmespetsialist. Organisatsioonis inimene, kes vastutab organisatsiooni andmete üldise halduse eest (andmete kvaliteet, kasutatavus, eesmärkidele vastavus).

Data tweeps - andme säutsud. Platvormil Twitter edastatud sõnumid, mis on seotud andmetega ja andmehaldusega. 

Dataset - andmekogum. Andme-elementidest koosnev hulk. Kõige sagedamini vastab andmekogum ühele andmebaasi tabelile või andmemaatriksile.

Digital Object Identifier (DOI) - digitaalse objekti identifikaator. Numbritest ja tähtedest koosnev unikaalne kood artiklitele ja/või dokumentidele. 

E-infrastructure - e-taristu. Unikaalsed infotehnoloogiatel põhinevad taristud, mis võimaldavad kasutajatele lihtsa ja turvalise internetipõhise juurdepääsu teadustööks vajalikele ressurssidele, tööriistadele, meetoditele ja vahenditele, aidates sellega kaasa teadustegevuse veelgi komplekssemaks, globaalsemaks ja multidistsiplinaarsemaks muutumisele. E-taristud võivad olla näiteks suure võimsuse ja jõudlusega andmevõrgud (nt GÉANT), hajutatud arvutiinfrastruktuurid (võrgud ja pilved), superarvutusinfrastruktuurid, teadusandmeid koondavad ja talletavad infrastruktuurid ning nendega kaasnevad teenused (nt ELIXIR).

Embargo period - embargoperiood. Kirjastaja nõutud periood, mille jooksul ei tohi publikatsiooni täisteksti teha avalikult kättesaadavaks. Enamus avatud juurdepääsu regulatsioone sätestavad, et eelretsenseeritud teadusajakirjade artiklite puhul tuleks avatud juurdepääs tagada kohe publitseerimisel, kuid mitte hiljem kui 12 kuud pärast esmast publitseerimist sotsiaal- ja humanitaarteadustes ja maksimaalselt 6 kuud teistes teadusvaldkondades. Juhtivad teaduskirjastused standardlepingutes autoritega sageli sellised õiguseid teadusartiklite repositooriumites avaldamiseks ei anna, enamasti nõutakse pikemat viivitust avatud juurdepääsu andmisel. Vt. roheline avatud juurdepääs.

Encryption - krüptimine. Edastatava/hoitava teabe sisu kättesaamatuks muutmine. Lihtsaim viis krüptimiseks on ID-kaardiga krüptimine, krüptitud faile saavad avada vaid kindla isikukoodiga ID-kaardi valdajad.

FACT principles (Fair, Accurate, Confidential, Transparent) - FACT printsiibid (õiglane, täpne, konfidentsiaalne, läbinähtav). Erinevalt FAIR printsiipidest, kirjeldavad FACT printsiibid rohkem teaduse fundamentaalseid põhimõtteid. Eelarvamusteta andmeteadus - kuidas vältida ebaõiglasi järjeldusi, isegi kui need on tõesed? Aimamata (juhupakkumistel baseeruv) andmeteadus - kuidas vastata küsimustele garanteeritud täpsusega? Konfidentsiaalsust tagav andmeteadus - kuidas vastata küsimustele saladusi paljastamata? Läbipaistev andmeteadus - kuidas selgitada vastuseid, et need muutuksid vaieldamatuks? https://doi.org/10.1007/s12599-017-0487-z

FAIR principles (Findable, Accessible, Interoperable, Re-usable) - FAIR printsiibid (leitavad, ligipääsetavad, koostalitlusvõimelised/ristkasutatavad, taaskasutavad). Avatud teaduse andmete põhiprintsiibid. FAIR printsiibile vastavus tähendab, et andmed peaks olema kergesti leitavad, kõigile inimestele kättesaadavad, peaksid olema kergesti kasutatavad mitmetel platvormidel ning andmeid peaks olema alati võimalik taaskasutada. 

Free cultural work - vaba kultuuriteos. Teos, sh teaduspublikatsioon, mille litsentsitingimused lubavad piiranguteta kasutamist ja jagamist igasugustel eesmärkidel. Vaba kultuuriteose definitsioonile vastavad CC BY ja CC BY-SA litsentsid, kuid mitte nt CC BY-NC, mis ei luba kasutamist ärilisel eesmärgil (vt https://creativecommons.org/freeworks).

General Data Protection Regulation (GDPR) - isikuandmete kaitse üldmäärus (IKÜM) või lihtsalt (andmekaitse) üldmäärus. Euroopa tasemel kindlaks määratud seadused ja määrused, mis kaitsevad eurooplaste ja Euroopas teostatud andmetöötluses käideldud isikute isikuandmeid. Üldmäärus hakkas kehtima  2018. aastal maikuus. https://www.aki.ee/et https://gdpr.eu/ 

Gold open access - kuldne avatud juurdepääs. Publikatsioon on kirjastuse veebilehel viivituseta ja lõplikul kujul kõigile tasuta kättesaadav. Kirjastamiskulud võivad olla publikatsiooni autorite kanda (vt artikli avaldamistasu) või toetab ajakirja väljaandmist mõni asutus või organisatsioon, nt ülikool, erialaliit või teaduste akadeemia. Enamiku Eesti teadusajakirjade puhul on kasutuses viimati nimetatud mudel ning autorid nendes ajakirjades avaldamistasu maksma ei pea. Kuldse avatud juurdepääsuga publikatsioonide täpsemad kasutustingimused pannakse paika konkreetse litsentsiga. Enamus avatud juurdepääsuga artikleid kasutavad nn Creative Commons-i litsentse. Selliseid publikatsioone on lubatud lõplikul kujul ka isearhiveerida, talletades koopiat institutsionaalses (nt ülikooli digiarhiiv), riiklikus (nt ETIS) või rahvusvahelises repositooriumis (nt ArXiv, PubMed Central).

Green open access - roheline avatud juurdepääs. Autor arhiveerib avaldatud teadusartikli või retsenseeritud käsikirja institutsionaalses (nt ülikooli digiarhiiv), riiklikus (nt ETIS) või rahvusvahelises repositooriumis (nt ArXiv, PubMed Central), mille kaudu muutub see kõigile kättesaadavaks. Kirjastuste ja ajakirjade lõikes võivad isearhiveerimise tingimused olla erinevad. Enamasti rakendub kirjastaja nõudel embargoperiood, st isearhiveerimine on lubatud mitte varem kui 6-12 kuud peale artikli esmailmumist. Üldjuhul ei ole lubatud artikli lõpliku versiooni (vt trükifail) isearhiveerimine. Rohelise avatud juurdepääsu puhul autorid avaldamistasu ei maksa. Kirjastuste tegevuskulud kaetakse ajakirjade jt publikatsioonide tellimuste ja lisateenuste kaudu, mille eest tasuvad raamatukogud ja teadusasutused.

Informed consent - teadlik ehk informeeritud nõusolek. Otsusvõimelise inimese vabatahtlik nõusolek selleks, et temaga või temasse otseselt puutuvat (näiteks tema andmetega) midagi tehakse, kui ta seda andes on teadlik selle tegevuse olemusest ja eesmärgist ning selle võimalikest tagajärgedest. Nõusolek peab olema vabalt antud, spetsiifiline, informeeritud ja üheselt mõistetav. Lisaks, tänapäeval tuleb nõustuda mitte ainult uurimisprojektis osalemisega, vaid ka andmete arhiveerimisega ja jagamisega. Vajaduse korral peaksid nõusolekuvormid käsitlema andmete jagamise võimalust, andmete edaspidist avaldamist (sealhulgas hoidlas hoidmist) või andmete pikaajalist säilitamist taasesitamise tagamiseks. 

Infrastructure data steward - infrastruktuuri andmespetsialist. Organisatsioonis inimene, kelle peamiseks ülesandeks on sobitada ette määratud poliitikad ja teaduse nõuded sobivateks IT-lahendusteks ja tööriistadeks. Lisaülesanneteks võivad olla IT-infrastruktuuri lahenduste rakendamine, andmetele ja tarkvarale ligipääsu määramine ning praktiliste ülesannete teostamine uurimisprojektis. 

Linked data - lingitud/seostatud andmed. Internetti lisatud andmed, mis on omavahel seostatud (tavaliselt ühesuunaliste hüperviidetega). Seostamiseks kasutatakse veebis hüperteksti edastusprotokolli RDF- ja URI-tehnoloogiaid ning nende kirjeldamiseks luuakse ja kasutatakse ontoloogiaid. Lingitud andmete vahelised seosed ei ole mõeldud inimestele lugemiseks, vaid on loodud nii, et neid oleks lihtne automaatselt arvutitega töödelda ja moodustada suuremaid andmemassiive (andmebaase), millest infot pärida. 

Long-term preservation - andmete pikaajaline säilitamine. Andmete hoiustamine sellisel viisil, mis võimaldab neid kasutada tulevikus. 

Machine readability - masinloetavus. Failivorming, mis on struktureeritud selliselt, et tarkvararakendused suudavad spetsiifilisi andmeid, sealhulgas üksikuid faktiväiteid, ja nende sisemist struktuuri kergesti tuvastada, ära tunda ja välja lugeda.

Metadata - metaandmed. Objekti (publikatsioon, andmed jne) kirjeldamiseks kasutatav standardiseeritud informatsioonihulk. Üldiselt on nõutav autorlus, pealkiri, institutsioon, avaldamise aeg jpm.

Ontology - ontoloogia. Jagatud sõnavarad kirjeldamaks kindla ala mõisteid ning kategooriaid ja nendevahelisi suhteid. 

Open access - avatud juurdepääs. Elektrooniline piiranguteta juurdepääs teadusinformatsioonile. Rahvusvaheliste kommertsalustel teaduskirjastuste tegevus põhineb seni valdavalt tellimustel põhineval ärimudelil (lugeja, raamatukogu või riik maksab) ning lõpptulemuse, teaduspublikatsioonide tasuta jagamist ei toimu. Avatud juurdepääsu poliitikate survel ning ka uusi sissetulekuvõimalusi nähes on juhtivad teaduskirjastused loonud uusi teadusväljaandeid, mis kasutavad kuldse avatud juurdepääsu ärimudelit (autor maksab reeglina avaldamistasu). Enamasti tuumikväljaannete ärimudelit ei ole muudetud, samas on loodud nn hübriidväljaannete autoritele võimalus artiklid „vabaks osta“. Hübriidväljaannete puhul on aga oht, et maksumaksja raha kulutatakse topelt – nii väljaannete tellimiseks raamatukogude kaudu kui artiklite avaldamiseks grandirahadest. Teadusväljaannete litsentsitingimustest ja isearhiveerimise reeglitest annab ülevaate SHERPA/ROMEO register (http://www.sherpa.ac.uk/romeo ). 

Open Data - avaandmed, avatud teadusandmed. Teadlaste, uurimisrühmade, uurimisasutuste või avaliku sektori poolt loodud ja teadustöös kasutatavad andmed, mis on tehtud elektrooniliselt vabalt kättesaadavaks kõigile inimestele. See tähendab, et andmeid saab taas-kasutada tasusid maksmata (tasuta; free-of-charge) ja ilma litsentsipiiranguteta (copyright restrictions)

Open licence - avatud sisulitsents. Publikatsioonid ja (teadus)andmed on üldjuhul autoriõiguse kaitse all ning avatud juurdepääs peab olema vastava litsentsiga kehtestatud (Creative Commons: CC-Zero, CC BY-SA jt; täpsem info http://www.hitsa.ee/teenused/autorioigused , http://creativecommons.org).

Open methodology - avatud metodoloogia. Avalik ja vaba juurdepääs teadusuuringu läbiviimisel kasutatud meetoditele, vahenditele ja analüüsile.

Open peer review - avatud eelretsenseerimine. Teadusliku kvaliteedi tagamine läbipaistva ja jälgitava eelhindamise protsessiga.

Open researcher and contributor ID (ORCID) - avatud teadlase ja kaasautori ID. Iga teadlase unikaalne kood Internetis, millega saab siduda oma  artikleid ja muid teadustööga seotud andmeid. 

Open science - avatud teadus. Tähistab vaba juurdepääsu elektroonilisele teadusinformatsioonile, esmajoones publikatsioonidele ja teadusandmetele, mille loomiseks ja avaldamiseks on kasutatud avalikke vahendeid (ETag). Avatud teaduse eesmärk on muuta teadusuuringud avatud, globaalseks, loovaks ning koostööl põhinevaks, kasutades tänapäevaseid e-taristuid. Avatud teaduse kontseptsioon muudab teadusuuringud efektiivsemaks ja läbipaistvamaks, suurendab koostööd teadlaste ja teadusvaldkondade vahel, soodustab innovatsiooni ning on seega kasulik ühiskonnale. 

Open source - avatud lähtekood. Avalik ja vaba juurdepääs tarkvaratoote algtekstidele. 

Open source software - avatud lähtekoodiga tarkvara. Lähtekood ja sellega seonduv dokumentatsioon on kõigile kasutajatele vabalt kättesaadav nii tutvumiseks kui muutmiseks. 

Peer review - eelretsenseerimine. Avaldamisele eelnev publikatsiooni sõltumatu hindamine vähemalt ühe vastava ala eksperdi poolt.

Persistent identifier (PID) - püsiidentifikaator. Ajas püsiv viide digitaalsele ressursile, mida kasutatakse publikatsioonide ja andmehulkade (aga ka muude digitaalsete objektide) otsimiseks, tuvastamiseks ja linkimiseks. See töötab isegi siis, kui objekti/ressursi esialgne asukoht on muutunud. PID lingib uue objekti asukohaga, muutmata enda aadressi. Näiteks ISBN (monograafiad), Handle ID (repositooriumid), DOI (publikatsioonid ja andmehulgad).

Personal data - isikuandmed. Teave inimese ehk füüsilise isiku (andmesubjekti) kohta, millega teda saab otse või kaudselt tuvastada: nimi, isikukood, asukohateave, võrguidentifikaatorid (tunnused, mis sidevõrgus aitavad viia konkreetse isikuni), samuti füüsilised, geneetilised, vaimsed, majanduslikud, kultuurilised ja mistahes muud tuvastamist võimaldavad tunnused ja nende kombinatsioonid. Isikuandmete töötlemine on andmetega tehtav mistahes toiming: kogumine, korrastamine, säilitamine, muutmine, lugemine, kasutamine, edastamine, ühendamine, kustutamine jne.

Policy data steward - strateegia/raamistiku andmespetsialist. Organisatsioonis inimene, kelle peamiseks ülesandeks on strateegiate arendamine ja andmehalduse tavade rakendamine, töötades tihedalt koos teiste tippjuhtide, poliitika kujundajate ja rahastajatega, luues sobivaid andmehaldusteenuseid ja infrastruktuuri. Selleks omab häid teadmisi nii kohalikest kui ka Euroopa tasemel olevatest nõuetest, reeglitest ja seadustest ning oskab neid tõlkida praktilisteks soovitusteks. 

Post-printjärel-print. Artiklimustand, mis on eelretsenseerimise läbinud. 

Preferred format - eelistatud failiformaat. Failitüübid, mida peetakse praegusel ajahetkel võimalikult tulevikukindlaks, st et on kergesti kasutatavad ka tulevikus. 

Pre-printeeltrükk. Artiklimustand, mis ei ole läbinud eelretsenseerimist.

Pre-registration - eel-registreerimine. Enne uurimistöö algust registreeritakse uurimise hüpotees, uurimistöö plaan, metodoloogia ja andmeanalüüsi skeem. Näiteks ETAGi PRG granditaotlus. Sarnane kliinilise uuringu registreerimisele, aga põhjalikum. Registered Reports (cos.io)

Pseudonymisation - pseudonüümimine/pseudonümiseerimine. See tähendab äratuntavate isikuandmete asendamist varjunimede, numbrikoodide ja muude tunnustega, mida asjassepuutumatud isikud ei oska ilma mõistliku ressursikuluga ära arvata. Inimesed, kelle kohta antud andmed käivad, on siiski taas indentifitseeritavad, kasutades selleks identifitseerimisdokumenti (dokumenti, kus on kirjas mis andmed millega asendati). 

Publisher’s PDF - trükifail. Viimane trükieelne publikatsiooni versioon, mis on läbinud eelretsenseerimise ja kus kõik detailid on lõplikult paigas.

Resource decription framework (RDF) - ressursi kirjelduse raamistik. RDF abiga defineeritakse digitaalsete objektide vahelised seosed. Esiteks, kõik digitaalsed objektid saavad ühtse ressursi identifikaator (URI; Uniform Resource Identifier), mis määratleb konkreetse allika asukoha ja lähenemise. Paljudel juhtudel on URI URL aadress. Iga digitaalne objekt on järgnevalt lingitud teiste objektidega RDF kolmikute kaudu. Lihtsustatult, RDF kolmik ütleb, et objekt X on seoses Y objektiga Z. Selliselt seoste esitamise viisi nimetatakse ka lingitud andmeteks. 

Reproducibility - taasesitatavus. Uurimisandmed ja koodid tehakse kättesaadavaks, et teised saaksid jõuda samade tulemusteni, nagu väidetakse teaduslikes väljundites. Replitseeritavus (teadusmetoodika kordamine, et jõuda sarnaste järeldusteni) on tihedalt seotud taasesitatavusega. Need mõlemad kontseptsioonid on empiiriliste uuringute põhielemendid. 

Research communication - teaduskommunikatsioon. Komplekssete uurimistulemuste tõlgendamine või tõlkimise protsess lihtsasse formaati või konteksti, mida suudaksid ka teised peale valdkonna ekspertide mõista. 

Research data - uurimistöö andmed/teadusandmed. Kõik andmed, mis on loodud või kogutud uurimistöö käigus. Samas tuleb arvesse võtta, et teadusandmeteks ei muutu andmed, mis on kogutud muul otstarbel, kuid võivad leida rakendust teadustöös (nt keskkonnaseire andmestik).

Research data lifecycle - uurimistöö andmete elutsükkel. Uurimiseks kasutatavate andmete käsitlemise voog, alates teadustöö planeerimisest kuni andmete jagamise ja taaskasutamiseni välja. Üldiselt koosneb 7-st peamisest etapist, mida kasutatakse ka andmehaldusplaani koostamisel: teadustöö ja kogutavate andmete planeerimine, andmete kogumine, töötlemine, analüüs, säilitamine, jagamine ja taaskasutamine. 

Research data management - uurimistöö andmete haldamine. Andmete aktiivne organiseerimine ja hooldamine kogu uurimistöö vältel ning andmete korrektne hoiustamine pärast uurimistöö lõppu. 

Research data steward - teadustöö andmespetsialist. Organisatsioonis inimene, kelle peamiseks ülesandeks on teadlaste otsene nõustamine andmehalduse valdkonnas, vaadates, et järgitakse institutsionaalseid nõuded ja soovitusi. Lisaülesandena võib koostada valdkonna spetsiifilisi või projekti spetsiifilisi suuniseid ning töötada ka otse projektide kallal. 

Scientific publication - teaduspublikatsioon. Eelretsenseeritud teadusartikkel või teaduslik üksikväljaanne, mis on kättesaadav kas täistekstina (paberkandjal või elektrooniliselt) või refereerituna/indekseerituna erialastes andmebaasides ja referaatajakirjades.

Self-archiving - isearhiveerimine. Vt roheline avatud juurdepääs.

Sensitive personal data - eri liiki isikuandmed. Andmed, millest ilmneb rassiline või etniline päritolu, poliitilised vaated, usulised või filosoofilised veendumused või ametiühingusse kuulumine, geneetilised andmed, isiku kordumatuks tuvastamiseks kasutatavad biomeetrilised andmed, terviseandmed ja andmeid seksuaalelu ja seksuaalse sättumuse kohta.

Short-term preservation - lühiajaline andmete säilitamine

Stakeholder - huvipool. Asjast huvitatud isik, asjaosaline, osanik, huvipool. Isik, kes on huvitatud millegi käekäigust või sellest, milline otsus langetatakse, sest see puudutab tema heaolu. 

Text and Data Mining (TDM) - teksti- ja andmekaeve. Automaatne protsess, mille abil saab suurtest andmehulkadest leida kasulikku infot ja sündmuse mustreid. Koosneb andmete eeltöötlusest, andmekaevest ja järeltöötlusest.

Trusted digital repository (TDR) - usaldusväärne digitaalne hoidla. Sertifitseeritud hoidla, mis on loodud tagama hoiustatud andmetele usaldusväärse ja jätkusuutliku juurdepääsu. TDR-sid võib sertifitseerida kolmel tasemel: põhi sertifikaat koos Core Trust Seal-i sertifikaadiga; laiendatud sertifikaat pärast seda, kui hoidla teostab ISO 16363 (või DIN 31644) kohase eneseauditi; ja vormingusertifikaat lisaks laiendatud sertifikaadile peale täiendava välise auditi ja sertifitseerimist ISO 16363 või DIN 3164410. 

Uniform resource identifier (URI) - ühtne ressursi identifikaator. Andmetele ühtse tuvastamise märgi lisamine võimaldab andmeid kergemini leida ning neid omavahel võrrelda. 

Virtual Research Environment (VRE) - virtuaalne uurimiskeskkond. VRE ühendab ühes keskkonnas erinevaid andmehalduse tööriistu, toetades teadlaste töövoogu ja turvalist töökeskkonda. 

Vocabulary - sõnavara. Metaandmete kirjeldamiseks kasutatav standardiseeritud ja organiseeritud sõnavara. 

Work package - tööpakett. Tööjaotuse struktuuri väikseim komponent. Tööpakett luuakse, kui jagatakse üldine eesmärk väiksemateks eesmärkideks/komponentideks. Tööpakett on loodud, kui töö eesmärke ei saa enam järgmisteks alltulemusteks või käegakatsutavateks projekti tulemusteks jagada. Tööpakett on viis mõista nii kulusid kui ka kestvust ning hallata neid kergesti.