Základní informace

  • Definice otevřených výzkumných dat

    Otevřená výzkumná data jsou data, která dokládají výsledky vědeckého výzkumu, jsou bez omezení přístupná komukoli v prostředí internetu.

    Při definování, co to jsou výzkumná data, lze uplatnit obecný popis pro otevřená data (ve smyslu veřejných, vládních dat).

    Data jsou otevřená, pokud splňují podmínku:

    • úplnosti
    • strojové čitelnosti
    • snadné dostupnosti při vynaložení minima možných nákladů pro uživatele
    • zpřístupnění za jasně definovaných podmínek
    • opětovného užití dat s minimem omezení
    • dodržení používaných standardů

    V oblasti výzkumu lze doporučit principy otevřeného přístupu k výzkumných datům:

    1. FAIR
    2. Joint Declaration of Data Citation Principles

Principy otevřeného přístupu k výzkumným datům

  • FAIR Data Principles

    Základní informace

    Pro vědu, která je postavená na obrovské produkci dat, je největší výzvou, jak zajistit, aby lidé a stroje mohli zkoumat, přistupovat, analyzovat vzniklá data, jejich algoritmy a procesy. Principy FAIR poskytují sadu instrukcí, jak otevřenost dat zajistit.

    Data mají být:

    • Findable (vyhledatelná)
    • Accessible (dostupná)
    • Interoperable (interoperabilní)
    • Re-usable (opětovně využitelná) 

    Findable (vyhledatelnost)


    F1. (meta)data jsou globálně unikátní persistentní.
    F2. data jsou popsána dostatečnými metadaty.
    F3. (meta)data jsou registrována a nebo indexována ve vyhledávacích zdrojích.
    F4. metadata specifikují identifikátor.

    Accessible (dostupnost)

    A1 (meta)data jsou dostupná pomocí jejich identifikátorů při použití standardních komunikačních protokolů.
    A1.1 protokol je otevřený, zdarma, univerzálně použitelný.
    A1.2 protokol dovoluje autentizaci a autorizaci, kde je to nezbytné.
    A2 metadata jsou dostupná, i když samotná data nejsou již k dispozici.

    Interoperable (interoperabilita)

    I1. (meta)data používají formální, dostupný, sdílený, široce aplikovatelný jazyk k reprezentaci znalostí.
    I2. (meta)data používají vokabuláře, které podporují FAIR principy.
    I3. (meta)data zahrnují reference na další (meta)data.

    Re-usable (opětovné použití)

    R1. meta(data) mají množství správných a relevantních atributů.
    R1.1. (meta)data jsou zveřejňována pod jasnou a dostupnou uživatelskou licencí.
    R1.2. (meta)data jsou spojena se svým původem.
    R1.3. (meta)data dodržují převládající standardy svého oboru, vědní komunity.

    WILKINSON, Mark D., Michel DUMONTIER, IJsbrand Jan AALBERSBERG, Gabrielle APPLETON, Myles AXTON, Arie BAAK, Niklas BLOMBERG, Jan-Willem BOITEN, Luiz Bonino DA SILVA SANTOS, et al. The FAIR Guiding Principles for scientific data management and stewardship. Scientific Data [online]. 2016, 3, 160018- [cit. 2018-02-12]. DOI: 10.1038/sdata.2016.18. ISSN 2052-4463. Dostupné z: http://www.nature.com/articles/sdata201618

  • Joint Declaration of Data Citation Principles

    Základní informace

    Data Citation Principles zahrnují důvody, funkce a prvky citování. Tyto principy zohledňují dvojí potřebu vytváření citací, které jsou čitelné jak pro stroje, tak lidi.

    Principy mají doporučující charakter, bez ambice určovat jejich implementaci pro všechny různorodé případy.

    1. Importance (Důležitost)

    Data mají být považovana za legitimní, citovatelný výstup výzkumu na stejné úrovni, jako jsou vytvářeny jiné záznamy vědeckých výsledků, např. publikace.

    2. Credit and Attribution (Autorství)

    Citování dat má umožnit přiřadit autorství všem tvůrcům dat. 

    3. Evidence (doložitelnost)

    Ve vědecké literatuře, kde jakákoli tvrzení stojí na datech, by měla být tato data citována.

    4. Unique Identification (unikátní identifikace)

    Citace dat by měla obsahovat standardní metodu, kterou daná vědecká komunita používá pro persistentní, globálně jednoznačnou strojovou identifikaci.

    5. Access (Přístup)

    Citace dat by měla umožnit přístup k datům, přidruženým metadatům, dokumentaci, kódu a jiným materiálům jak pro člověka, tak pro strojové čtení.

    6. Persistence (Trvalost)

    Unikátní identifikátory, metadata popisující data, by měly být persistentní (trvalé podoby), měly by persistentní i po zániku dat, která popisují.

    7. Specificity and Verifiability (specifičnost a verifikace)

    Citace dat by měla umožnit identifikaci, přístupnost, verifikaci specifických dat, která podporují určité tvrzení. Citace nebo metadata by měly obsahovat informace o původu, verzi dat v době jejich citování.

    8. Interoperability and Flexibility (interoperabilita a flexibilita)

    Metody citování dat by měly být dostatečně flexibilní tak, aby pokryly potřeby vědních disciplín, zároveň by měly splnit požadavky na interoperabilitu dat mezi vědními obory.

    Data Citation Synthesis Group: Joint Declaration of Data Citation Principles. Martone M. (ed.) San Diego CA: FORCE11; 2014 https://doi.org/10.25490/a97f-egyk

Výhody otevřených výzkumných dat

  • Výhody otevřených výzkumných dat
    • na základě údajů z výzkumu je možné výsledky ověřit a kriticky zkoumat
    • je možné se vyhnout zbytečnému opakování výzkumu
    • údaje mohou být analyzovány v plném rozsahu a využity v navazujících projektech
    • díky sdílení údajů z výzkumu je možné urychlit výzkumný proces
    • sloučením výzkumných údajů z různých zdrojů je možné dojít k novým poznatkům
    • z pohledu nákladů na výzkum je efektivnější vytvářet a využívat datové soubory na základě spolupráce

Datové repozitáře, časopisy, projekty, portály, iniciativy

Užitečné informační zdroje

Council on Library and Information Resources. Research data management principles, practices, and prospects [online]. Washington: CLIR, 2013 [vid. 2013-12-11]. ISBN 978-1-932326-47-5. Dostupné z: http://www.clir.org/pubs/reports/pub160/pub160.pdf

GOODMAN, Alyssa, Alberto PEPE, Alexander W. BLOCKER, Christine L. BORGMAN, Kyle CRANMER, Merce CROSAS, Rosanne DI STEFANO, Yolanda GIL, Paul GROTH, et al. Ten Simple Rules for the Care and Feeding of Scientific Data. PLoS Computational Biology [online]. 2014, 10(4), e1003542- [cit. 2018-02-12]. DOI: 10.1371/journal.pcbi.1003542. ISSN 1553-7358. Dostupné z: http://dx.plos.org/10.1371/journal.pcbi.1003542

PIWOWAR, Heather A. a Todd J. VISION. Data reuse and the open data citation advantage. PeerJ [online]. 2013, 1, e175- [cit. 2018-02-12]. DOI: 10.7717/peerj.175. ISSN 2167-8359. Dostupné z: https://peerj.com/articles/175

Opening up Scientific Data, Neelie Kroes, Vice-President of the European Commission responsible for the Digital Agenda, Launch of the Research Data Alliance/Stockholm, 18 March 2013