-
Definice otevřených výzkumných dat
Otevřená výzkumná data jsou data, která dokládají výsledky vědeckého výzkumu a jsou bez omezení přístupná komukoli v prostředí internetu.
Při definování, co to jsou výzkumná data, lze uplatnit obecný popis pro otevřená data (ve smyslu veřejných, vládních dat).
Data jsou otevřená, pokud splňují podmínku:
- úplnosti
- strojové čitelnosti
- snadné dostupnosti při vynaložení minima možných nákladů pro uživatele
- zpřístupnění za jasně definovaných podmínek
- opětovného užití dat s minimem omezení
- dodržení používaných standardů
V oblasti výzkumu lze doporučit principy otevřeného přístupu k výzkumných datům:
- FAIR
- Joint Declaration of Data Citation Principles
-
FAIR Data Principles
Základní informace
Pro vědu, která je postavená na obrovské produkci dat, je největší výzvou, jak zajistit, aby lidé a stroje mohli zkoumat, přistupovat, analyzovat vzniklá data, jejich algoritmy a procesy. Principy FAIR poskytují sadu instrukcí, jak otevřenost dat zajistit.
Data mají být:
- Findable (vyhledatelná)
- Accessible (dostupná)
- Interoperable (interoperabilní)
- Re-usable (opětovně využitelná)
Findable (vyhledatelnost)
F1. (meta)data jsou globálně unikátní persistentní.
F2. data jsou popsána dostatečnými metadaty.
F3. (meta)data jsou registrována a nebo indexována ve vyhledávacích zdrojích.
F4. metadata specifikují identifikátor.Accessible (dostupnost)
A1 (meta)data jsou dostupná pomocí jejich identifikátorů při použití standardních komunikačních protokolů.
A1.1 protokol je otevřený, zdarma, univerzálně použitelný.
A1.2 protokol dovoluje autentizaci a autorizaci, kde je to nezbytné.
A2 metadata jsou dostupná, i když samotná data nejsou již k dispozici.Interoperable (interoperabilita)
I1. (meta)data používají formální, dostupný, sdílený, široce aplikovatelný jazyk k reprezentaci znalostí.
I2. (meta)data používají vokabuláře, které podporují FAIR principy.
I3. (meta)data zahrnují reference na další (meta)data.Re-usable (opětovné použití)
R1. meta(data) mají množství správných a relevantních atributů.
R1.1. (meta)data jsou zveřejňována pod jasnou a dostupnou uživatelskou licencí.
R1.2. (meta)data jsou spojena se svým původem.
R1.3. (meta)data dodržují převládající standardy svého oboru, vědní komunity.WILKINSON, Mark D., Michel DUMONTIER, IJsbrand Jan AALBERSBERG, Gabrielle APPLETON, Myles AXTON, Arie BAAK, Niklas BLOMBERG, Jan-Willem BOITEN, Luiz Bonino DA SILVA SANTOS, et al. The FAIR Guiding Principles for scientific data management and stewardship. Scientific Data [online]. 2016, 3, 160018- [cit. 2018-02-12]. DOI: 10.1038/sdata.2016.18. ISSN 2052-4463. Dostupné z: http://www.nature.com/articles/sdata201618 -
Joint Declaration of Data Citation Principles
Základní informace
Data Citation Principles zahrnují důvody, funkce a prvky citování. Tyto principy zohledňují dvojí potřebu vytváření citací, které jsou čitelné jak pro stroje, tak lidi.
Principy mají doporučující charakter, bez ambice určovat jejich implementaci pro všechny různorodé případy.
1. Importance (Důležitost)
Data mají být považovana za legitimní, citovatelný výstup výzkumu na stejné úrovni, jako jsou vytvářeny jiné záznamy vědeckých výsledků, např. publikace.
2. Credit and Attribution (Autorství)
Citování dat má umožnit přiřadit autorství všem tvůrcům dat.
3. Evidence (doložitelnost)
Ve vědecké literatuře, kde jakákoli tvrzení stojí na datech, by měla být tato data citována.
4. Unique Identification (unikátní identifikace)
Citace dat by měla obsahovat standardní metodu, kterou daná vědecká komunita používá pro persistentní, globálně jednoznačnou strojovou identifikaci.
5. Access (Přístup)
Citace dat by měla umožnit přístup k datům, přidruženým metadatům, dokumentaci, kódu a jiným materiálům jak pro člověka, tak pro strojové čtení.
6. Persistence (Trvalost)
Unikátní identifikátory, metadata popisující data, by měly být persistentní (trvalé podoby), měly by persistentní i po zániku dat, která popisují.
7. Specificity and Verifiability (specifičnost a verifikace)
Citace dat by měla umožnit identifikaci, přístupnost, verifikaci specifických dat, která podporují určité tvrzení. Citace nebo metadata by měly obsahovat informace o původu, verzi dat v době jejich citování.
8. Interoperability and Flexibility (interoperabilita a flexibilita)
Metody citování dat by měly být dostatečně flexibilní tak, aby pokryly potřeby vědních disciplín, zároveň by měly splnit požadavky na interoperabilitu dat mezi vědními obory.
Data Citation Synthesis Group: Joint Declaration of Data Citation Principles. Martone M. (ed.) San Diego CA: FORCE11; 2014 https://doi.org/10.25490/a97f-egyk
-
Výhody otevřených výzkumných dat
- na základě údajů z výzkumu je možné výsledky ověřit a kriticky zkoumat
- je možné se vyhnout zbytečnému opakování výzkumu
- údaje mohou být analyzovány v plném rozsahu a využity v navazujících projektech
- díky sdílení údajů z výzkumu je možné urychlit výzkumný proces
- sloučením výzkumných údajů z různých zdrojů je možné dojít k novým poznatkům
- z pohledu nákladů na výzkum je efektivnější vytvářet a využívat datové soubory na základě spolupráce
-
Datové repozitáře a portály
- BioFresh data portal
- CESSDA, Consortium of European Social Science Data Archives
- CERN OpenData Portal, přístupový bod k výzkumných datům pro vzdělávání
i výzkum vytvářeným prostřednictvím výzkumu prováděného vCERNu - DANS, Data Archiving and Networked Services
- DataONE – Data Observation Network for Earth
- Dryad, mezinárodní úložiště
dat souvisejících s recenzovanými vědeckýmipublikacemi - EUDAT (European Data Infrastructure)
- EPOS, European Plate Observing System, European Research Infrastructure on Earthquakes, Volcanoes, Surface Dynamics and Tectonics
- KNB – The Knowledge Network for Biocomplexity
- PANGAEA, Data Publisher for Earth & Environmental Science
- RunMyCode, open platform for disseminating the code and data associated with published results, and enabling independent and public cloud-based verification of methods and findings
- Research Data Australia – a discovery service for Australian research data
- re3data.org, Registry of Research Data Repositories
- TreeBASE
- World Bank Open Data
-
Datové časopisy
- Biodiversity Data Journal (BDJ)
- CODATA: Data Science Journal, a peer-reviewed, open access, electronic journal publishing papers on the management of data and databases in Science and Technology; viz též Data Science Journal
- Dataset Papers in Science, a
peer reviewed , open access journal that is designed to provide fast peer review process for all submitted dataset papers (Hindawi) - F1000 Research
- GigaScience, an online open-access open-data journal
- Hearth System Science Data (ESSD)
- Journal of Open Archaeology Data (JOAD)
- Scientific Data, a new open-access, online-only publication for descriptions of scientifically valuable datasets (Nature)
- Ubiquity Press metajournals
-
Portály dat veřejné zprávy (open government data)
- Australian National Data Service: Publishing and Sharing Sensitive Data
- data.gov.au, find, access and reuse public datasets from the Australian Government
- European Union Open Data Portal, a single point of access to a growing range of data produced by the institutions and other bodies of the European Union.
- Open Data Census
- Swedish National Data Service (SND)
- UK Data Service
- Otevřená data v ČR: Portál otevřených dat
-
Iniciativy, projekty
- CODATA, International Council for
Science : Committee on Data for Science and Technology - EOSC, European Open Science Cloud -
informace Evropskékomise ke strategii - cloudové služby proevropskou otevřenou vědu,realizaci EOSC řešíprojekt EOSC-hub - EOSC-hub, Integrating and managing services for the European Open Science Cloud -
projekt zprogramu H2020,realizace vletech 2018-2021 - DataCite, Helping you to find, access, and reuse research data
- Data Citation Index (Thomson Reuters)
- The Dataverse Network
- Denton Declaration: An Open Data Manifesto
- Digital Curation Centre (DCC)
- Linked Data
- ODIN; ORCID and DataCite Interoperability Network
- OECD Principles and Guidelines for Access to Research Data from Public Funding
- Open Data Institute
- Open Knowledge Foundation
- Open Data – An Introduction
- CKAN; powerful data management system that makes data accessible – by providing tools to streamline publishing, sharing, finding and using data
- Open Data Commons
- Panton Principles, Principles for Open Data in Science
- Policy-making for Research Data in Repositories: A Guide (PDF)
- RECODE, Policy RECommendations for Open Access to Research Data in Europe
- Research Data Alliance, RDA | Research Data Sharing without barriers
- RDA Europe
- Knowledge Exchange: Sowing the seed: Incentives and Motivations for Sharing Research Data, a researcher's perspective; viz též Interviews of incentives for sharing research data.
- The Value of Research Data, Metrics for datasets from a cultural and technical point of view
- CODATA, International Council for
Užitečné informační zdroje
Council on Library and Information Resources. Research data management principles, practices, and prospects [online]. Washington: CLIR, 2013 [vid. 2013-12-11]. ISBN 978-1-932326-47-5. Dostupné z: https://www.clir.org/pubs/reports/pub160/
GOODMAN, Alyssa, Alberto PEPE, Alexander W. BLOCKER, Christine L. BORGMAN, Kyle CRANMER, Merce
PIWOWAR, Heather A. a Todd J. VISION. Data reuse and the open data citation advantage. PeerJ [online]. 2013, 1, e175- [cit. 2018-02-12]. DOI: 10.7717/peerj.175. ISSN 2167-8359. Dostupné z: https://peerj.com/articles/175