Data Science – Expertise für Big Data Analyse
Der systematische Zugang zu digitalen Datenbeständen wird für neue wissenschaftliche Erkenntnisse und damit für Innovationen und den Technologietransfer immer wichtiger. Zukunftsfelder wie Maschinelles Lernen oder Künstliche Intelligenz (KI) sind auf entsprechende Datengrundlagen angewiesen. Die reine Datengewinnung, sogenannte Rohdaten, bringt die Wissenschaft allerdings nicht voran. Entscheidend ist, die Nutzbarkeit der Forschungsdaten zu verbessern. Das Wissenschaftsministerium fördert den Aufbau von vier leistungsstarken Science Data Centers, d. h. Forschungsdatenzentren, in Baden-Württemberg.
Projekte:
Ziel des Projektes ist der Auf- und Ausbau von Science Data Centers, im Rahmen derer neue digitale Methoden der Erfassung, Speicherung und Auswertung von Daten entwickelt werden. In Zusammenarbeit mit den Anwendern aus Wissenschaft und Wirtschaft werden die Zentren methodische Konzepte zur Aufbereitung und Analyse der Daten erarbeiten und die Aus- und Weiterbildung für die digitale datengetriebene Forschung vorantreiben.
Auf diese Weise wird ermöglicht, dass Data Science und die digitale datengetriebene Forschung in Baden-Württemberg nachhaltig etabliert wird. Davon profitiert der Wissenschaftsstandort Baden-Württemberg, der in ausgewählten Bereichen eine Spitzenstellung in der jeweiligen digital-datengetriebenen Forschung einnehmen kann, und der Wirtschaftsstandort Baden-Württemberg.
Das Wissenschaftsministerium fördert folgende Science Data Centers:
- BERD-Center – Business and Economic Research Data Center (Universität Mannheim und Zentrum für Europäische Wirtschaftsforschung Mannheim)
- BioDATEN – Bioinformatics DATa Environment (Universitäten Tübingen, Freiburg, Heidelberg, Deutsches Krebsforschungszentrum Heidelberg (DKFZ) und European Molecular Biology Laboratory Heidelberg (EMBL))
- MoMaF – Science Data Center für Molekulare MaterialForschung (Karlsruher Institut für Technologie, Hochschule Karlsruhe – Technik und Wirtschaft und FIZ Karlsruhe – Leibniz-Institut für Informationsinfrastruktur GmbH)
- NDLZL Nachhaltiger DatenLebensZyklus Literatur (Deutsches Literaturarchiv Marbach und Universität Stuttgart)
In den neuen Datenzentren arbeiten Wissenschaftlerinnen und Wissenschaftler eng mit den Mitarbeiterinnen und Mitarbeitern der Rechenzentren und Bibliotheken zusammen, um den Zugang und die Nutzung von digitalen Datenbeständen zu vereinfachen. Die Daten werden auch durch Big Data Analysis erschlossen – hierbei analysieren hochleistungsfähige Rechner große Mengen unstrukturierter Daten und werten diese u. a. mithilfe der Methoden des maschinellen Lernens aus.
Die Science Data Centers erstellen außerdem Angebote für die Aus- und Weiterbildung im Bereich datengetriebene Forschung und Entwicklung, denn in allen Institutionen, Unternehmen und Behörden werden für den sinnvollen Einsatz und die richtige Anwendung der generierten Daten auch die notwendigen Kenntnisse benötigt.