Höchstleistungsrechnen, Datenintensives Rechnen und Data Intensive Computing

Die Landesstrategie zu High Performance Computing (HPC) und Data Intensive Computing (DIC) stellt einen wesentlichen Beitrag des Wissenschaftsministeriums zur Digitalisierungsstrategie digital@bw des Landes dar. Aus Sicht der Deutschen Forschungsgemeinschaft hat die HPC/DIC-Landesinitiative „einen wegweisenden Modellcharakter“ mit Vorbildcharakter für andere Länder.
Projekte:
Seit mehr als vier Jahrzenten bildet und stärkt das wissenschaftliche Rechnen mit Simulationen auf High Performance Computing (HPC) Systemen die Brücke zwischen den zwei klassischen Säulen der Wissenschaft: Theorie und Experiment. Maßgeblich bekräftigt durch die bis jetzt exponentiell wachsende Leistungsfähigkeit von HPC-Systemen, wird heute „Simulation“ als dritte Säule der modernen Wissenschaft bezeichnet. „Computational Science“ ermöglicht es Theoretikern und Praktikern, Modelle von komplexen Phänomenen und neue Theorien zu entwickeln und zu überprüfen, um anschließend neue Informationen, Innovationen und Erkenntnisse in Forschungsthemen zu gewinnen, die mit traditionellen Methoden aus unterschiedlichsten Gründen nicht erzielt werden können. Daher ist Simulation und Computational Science zur einer Disziplin mit einer einzigartigen Charakteristik gereift: Sie eröffnet und ermöglicht Forschungsmöglichkeiten, wenn Experimente unmöglich, zu kosten- oder zeitintensiv oder zu gefährlich sind (z. B. in den Themenfeldern Klima, Energie, Umwelt, Gesundheit und Mobilität).
Für den Zeitraum von 2017 bis 2024 ist es das Ziel, die erfolgreiche Strategie des Landes für HPC zu einer integrierten Strategie für HPC und DIC weiterzuentwickeln und damit ein wesentliches Alleinstellungsmerkmal des Landes in der Unterstützung der Wissenschaften zu erhalten und auszubauen. Dazu wird am Höchstleistungsrechenzentrum Stuttgart (HLRS) eine Weiterführung des baden-württembergischen Engagements für Tier-0 und Tier-1 im Gauss Centre for Supercomputing (GCS) und über GCS auch im europäischen Kontext verfolgt. Am Steinbuch Centre for Computing (SCC) wird in Abstimmung mit dem HLRS die Tier-2 Versorgung und die Unterstützung von Data Intensive Computing weiterentwickelt und ausgebaut und im Idealfall im Rahmen des Nationalen Hochleistungsrechnen (NHR) eingebracht.
An fünf Universitätsstandorten (Freiburg, Heidelberg/Mannheim, Tübingen, Ulm, KIT) wird die Basisversorgung mittels Rechenclustern für den HPC-Einstieg betrieben. Für eine optimale landesweite Unterstützung der Anwender sind die einzelnen Standorte hierfür auf spezifische Fachdisziplinen spezialisiert und versorgen im Rahmen ihres Profils die entsprechenden Nutzergruppen im gesamten Land:
- Freiburg: Cluster für die Fächer Materialwissenschaften, Mikrosystemtechnik, Neurowissenschaften und Partikelphysik
- Heidelberg/Mannheim: Cluster für die Fächer Molekulare Lebenswissenschaften, Medizin, Physik der weichen Materie sowie Wirtschafts- und Sozialwissenschaften
- Tübingen: Cluster für die Fächer Astrophysik, Bioinformatik und Geowissenschaften
- Ulm: Cluster für die Fächer theoretische Chemie, Quantenphysik und Physik der kondensierten Materie
- Karlsruhe/KIT: Grundversorgung weiterer Fächer
Neben der bereits beschriebenen Unverzichtbarkeit des Hoch- und Höchstleistungsrechnens und der Weiterentwicklung der dreistufigen HPC-Pyramide für die Wettbewerbsfähigkeit Deutschlands in zahlreichen Wissenschaftsfeldern nennt der Wissenschaftsrat ferner als aktuellen Trend den rasch zunehmenden Einsatz von Data Analytics, also den Erkenntnisgewinn aus gemessenen oder anderweitig gewonnenen Daten. Diese neuen Aufgaben sind sehr rechenintensiv und erfordern eine leistungsfähige Verwaltung sehr großer Datenmengen. Hier spricht man von Data Intensive Computing (DIC).
Die dringende Erweiterung der HPC-Pyramide hinsichtlich Daten erfordert die Etablierung einer BaWü-Daten-Föderation auf Basis des BelWü-Hochschulnetzes und der Identitäts-Föderation bwIDM, mit engen Anbindungen an nationale und europäische Strukturen. Vorteile der Föderation sind mannigfaltig, darunter u. a. Beibehaltung der Datenhoheit, Korrelationsmöglichkeiten von interdisziplinären Daten (z. B. Umwelt & Energie für regenerative Energieformen wie Wind und Sonne), Verteilung der Langzeitarchivierung (Speicherung an zwei Orten zur Redundanzerhöhung), Replizierung der Daten zwecks besseren Zugriffsmöglichkeiten. Dazu besteht die Föderation im Wesentlichen aus drei Komponenten: Benutzerunterstützung, Daten-Management-Software und Datenmanagementsysteme. Die notwendige Ausstattung mit leistungsfähigen Datenmanagementsystemen zur Unterstützung des gesamten Data Life Cycles bis zur Archivierung muss bedarfsgerecht und kontinuierlich (einschließlich eines jährlichen Kapazitätsausbaus und Ersatzes veralteter Hardware) erfolgen; diese hardwaremäßige Ausstattung erfolgt im Wesentlichen durch den gemeinsamen Ausbau und die Weiterentwicklung des HPC Tier-2 und des HPC Tier-3. Die notwendige Daten-Management-Software zur Etablierung der Föderation und damit zur logischen Verbindung einzelner Datenmanagementsysteme kann aus bereits existierenden Initiativen in der Helmholtz Gemeinschaft (Programm Supercomputing & Big Data), auf nationaler Ebene (BMBF, DFG), auf europäischer Ebene (EUDAT) und international (Research Data Alliance) sowie aus dem Open-Source-Domain aber auch aus den aktuell geförderten E-Science Projekten des Wissenschaftsministeriums größtenteils verwendet werden.
Die Umsetzung der hier beschriebenen Maßnahmen wird dem Thema „simulations- und datenintensive Wissenschaften“ im Land Baden-Württemberg einen neuen Innovationsschub geben, der sowohl in der Wissenschaft als auch in der Wirtschaft sichtbar sein wird. Die damit geschaffenen Forschungsinfrastrukturen sollen hochschulartenübergreifend allen Wissenschaftlern im Land nach wissenschaftsgeleiteten Kriterien zur Verfügung stehen. Darüber hinaus sollen im Rahmen des Konzepts auch Politik und Gesellschaft eingebunden werden, um das Potential der computergestützten Simulation einerseits ins öffentliche Bewusstsein zu heben und es andererseits für politische und gesellschaftliche Prozesse besser zu nutzen.
Blickt man über die Landesgrenzen Baden-Württembergs hinaus, so gilt für HPC und DIC gleichermaßen: eine Integration in und Verzahnung mit nationalen und europäischen Strategien, Aktivitäten, Strukturen wie auch Perspektiven ist unumgänglich und zugleich zwingend notwendig – denn Wissenschaft macht nicht an Grenzen halt. Und so ist bereits heute das Land mit seinen beiden Zentren in Stuttgart (HLRS) und Karlsruhe (SCC) im HPC und DIC in Deutschland und Europa bestens etabliert und nimmt eine international führende Rolle ein, die es nun in den kommenden Jahren weiter zu stärken und auszubauen gilt.
Das in Baden-Württemberg geschaffene HPC-/DIC-Ökosystem stellt einen wesentlichen Baustein der digitalen Strategie des Landes Baden-Württemberg dar, indem es die Bereiche Rechner, Netze und Daten für die Forschung landesübergreifend abdeckt und gleichzeitig eine Verankerung der Landesstrategie in den nationalen und europäischen Gesamtstrategien ermöglicht hat.