CaosDB Max Planck Digital Library Project
CaosDB is an open source research data management system (RDMS) which was developed by the Research Group Biomedical Physics. This page informs about a project funded by the Max Planck Digital Library with the following aims:
- Extend the research data management system CaosDB and prepare it for intergroup usage at the MPI for Dynamics and Self-Organization
- Improve documentation of interfaces and clients and creation of tutorials
- Enable more scientists internal and external to the Max Planck Society to benefit from the advantages of CaosDB
Project Information (German)
Titel: CaosDB – Dokumentation, erweiterte Softwareschnittstellen und Performance-Charakterisierung eines semantischen Forschungsdaten-Management-Systems für heterogene wissenschaftliche Umgebungen
Projektverantwortlicher: Stefan Luther
Projektdauer: 2 Jahre
Abstract: Deutsche Version / Englische Version
Improving data management is one of the major challenges in all scientific fields. While there is a broadly accepted consensus about the aims and principles (e.g. FAIR data principles) there is a serious deficit of tools and established workflows tageted at their implementation. A special challenge is posed by the dynamic nature of scientific work rendering classical data management systems impractical. Often they are too specialized, not prepared for coninuous changes of data models or too generic to meet individual requirements.
The Open-Source software CaosDB is targeted at the integration and management of a high variety of complex data during the complete life-cycle, including data acquisition, data analysis, publishing and archival. Its unique semantic and dynamic data model does not only allow for powerful searches and reliable automatation, but also the flexible adaption of data structures by the end user.
The aim of the proposed project is to extend the research data management system CaosDB and prepare it for intergroup usage at the MPI for Dynamics and Self-Organization. This does not only include the technical implementation, installation and connection to existing data processing facilities, but also the training of scientific staff and data management representative. During the project, the documentation of interfaces and clients will be improved and tutorials will be created, enabling a higher number of scientists internal and external to the Max Planck Society to benefit from the advantages of CaosDB. Finally a performance evaluation will be conducted that paves the way to turn CaosDB into a generally accepted tool for high throughput data analysis.
Wissenschaftliches Datenmanagement steht heute mehr denn je im Fokus. Während man sich einerseits über die Ziele und Prizipien relativ einig ist (z.B. FAIR-Principles) so fehlt es in der Praxis häufig doch an Werkzeugen um diese umzusetzen. Mit seiner sehr dynamischen Natur ist der Wissenschaftsbetrieb eine große Herausforderung für klassische Datenbanken. Sie sind oft zu spezialisiert und nicht auf ständige Anpassungen von Datenstrukturen ausgelegt oder zu generisch um individuellen Bedürfnissen gerecht zu werden.
Die Open-Source-Software CaosDB bietet die Möglichkeit, vielfältigste Daten während ihres gesamten Lebenszyklus von der Aufnahme, über die Weiterverarbeitung und Veröffentlichung bis zu Archivierung abzubilden. Das semantische Datenmodell erlaubt dabei nicht nur mächtige Suchfunktionen und verlässliche Automatisierung der Datenverarbeitung, sondern auch das flexible Anpassen der Strukturen durch die Nutzer.
Im Rahmen dieses Projektes wird das Forschungsdatenmanagementsystem CaosDB für den arbeitsgruppenübergreifenden Einsatz am MPI für Dynamik und Selbstorganisation erweitert. Dazu gehören sowohl die technische Umsetzung der Installation und der Einbindung in die Datenverarbeitung als auch die Schulung der wissenschaftlichen NutzerInnen und verantwortlichen Datenmanagementbeauftragten. In diesem Zuge werden auch die Dokumentation der Schnittstellen und Clients verbessert und Tutorials erstellt, damit eine noch größere Zahl von WissenschaftlerInnen auch außerhalb der Max-Planck-Gesellschaft die Vorteile von CaosDB nutzen können. Zudem findet eine Performanceanalyse statt, um die Entwicklung von CaosDB zu einem geeigneten und allgemeinverfügbaren Werkzeug für Hochdurchsatzdatenanalyse voranzutreiben.
More resources on the MPDL Project
- Link to MPDL project page (Max Planck internal only):
More resources on CaosDB:
- Official Webpage:
- Article about CaosDB:
- Sourcecode, Wiki and Documentation:
- Slides from a recent talk
- CaosDB page on this website