Offene Daten (Open Data)


Bei den meisten wissenschaftlichen Publikationen wird nur ein kleiner Teil der experimentellen während der Forschung erhobenen Daten in der finalen Publikation veröffentlicht. Allerdings kann die Wissenschaft davon profitieren, wenn die gesamten Daten eines Projektes im Manuskript öffentlich zur Verfügung gestellt werden. Dabei sollten die Daten frei und ohne Beschränkungen im Internet unter einer geeigneten Public Domain Lizenz zugänglich sein, um sie für andere Zwecke wiederverwenden zu können (Panton Principles).1.

Ein weitere Schritt wäre es, Daten sofort zur veröffentlichen, sobald sie generiert wurden. Hierfür gibt es heutzutage mehrere Möglichkeiten: Der schnellste Weg ist, den Datensatz direkt in digitalen Lagerstätten (Repositories) zu hinterlegen. Bekannte Repositorien sind z.B. Dryad, Zenodo, Figshare. Eine Anlaufstelle für solche Repositories ist die Registry of Research Data Repositories.

Eine zweite Möglichkeit besteht darin, eine Datenpublikation zu veröffentlichen, die hauptsächlich aus dem Datensatz und dessen Beschreibung des Datensatzes besteht, im Besonderen mit Informationen dazu, wie und wo dieser erhoben wurde. Analysen bzw. Interpretation der Daten werden in diesen Publikationen nicht durchgeführt, können aber in einem nachfolgenden Manuskript veröffentlicht werden. Mehrere naturwissenschaftliche Journals bieten dazu Möglichkeiten, z.B. Scientific Data der Nature Publishing Group  oder GigaScience von BMC.

Weitere Open-Science-Themen:

 

Anmerkungen   [ + ]

1. Panton Principles, Principles for open data in science. Murray-Rust, Peter; Neylon, Cameron; Pollock, Rufus; Wilbanks, John; (19 Feb 2010). Retrieved [24 Nov 2015] from http://pantonprinciples.org/