22. Juli 2024
Promotion Johannes Lehrbach
CERN-Kooperation
Johannes Lehrbach aus der FIAS-Arbeitsgruppe von Volker Lindenstruth verteidigte seine Doktorarbeit am 5. Juli 2024. In seiner Promotion war er maßgeblich am Bau der Run 3-Recheninfrastruktur für die Ereignisverarbeitungsknoten (EPN) des ALICE-Experiments am CERN beteiligt.
Das ALICE-Experiment am Large Hadron Collider (LHC) der Europäischem Organisation für Kernforschung CERN wurde für den dritten Lauf (Run 3) aufgerüstet, um deutlich höhere Blei-Blei-Kollisionsraten aufzeichnen zu können. Dazu wurden die zentralen Detektoren mit neuen Sensoren ausgestattet, die Ausleseelektronik komplett neu entwickelt und das Rechenkonzept geändert. Durch das kontinuierliche Auslesen der Detektoren in Run 3 stiegen die Datenraten im Vergleich zu Run 2 um mehr als eine Größenordnung. Dies hatte direkte Auswirkungen auf das benötigte Netzwerk, die Rechenleistung und die allgemeine Infrastruktur.
Während der Dissertation wurde ein neues Rechenzentrum für die Ereignisverarbeitungsknoten (EPN) aufgebaut, das deutlich höhere Leistungsdichten in den Racks auch bei großen Lastschwankungen zuverlässig kühlen kann und damit leistungsfähigere Hardware mit mehreren Grafikkarten als Beschleuniger ermöglicht. Lehrbach und Kolleg:innen optimierten das InfiniBand-Netzwerk für Run 3 für die ALICE Datenraten, um die benötigten Bandbreiten zuverlässig zu erreichen und gleichzeitig die Kosten im Rahmen zu halten. Sie verbesserten den EPN-Cluster und die Serverkonfiguration für die ALICE-Software, um die maximale Leistung aus den Servern herauszuholen. Der Cluster wurde zweimal erweitert, um zusätzliche Rechenanforderungen zu erfüllen, die zu Beginn nicht bekannt waren. Dabei demonstrierten sie die gute Skalierbarkeit des Gesamtsystems.
Die während der Doktorarbeit implementierte Recheninfrastruktur einschließlich des Netzwerks hat sich bereits während des ALICE Run 3 bewährt. Diese Arbeit war essentiell für den Erfolg von ALICE und hat dazu beigetragen, dass Blei-Blei-Daten mit einer Kollisionsrate von knapp 50 kHz aufgezeichnet werden konnten und somit die ursprünglichen Designspezifikationen erfüllt wurden. Der EPN-Cluster stellte ausreichend Rechenleistung zur Verfügung, um eine komplette Online -Ereignisrekonstruktion mit etwa 800 Gigabyte pro Sekunde an Detektordaten durchzuführen. Die resultierenden komprimierten Daten von knapp 200 Gigabyte pro Sekunde wurden zuverlässig über das InfiniBand-Netzwerk des EPN-Clusters zum Ethernet-Netzwerk des Festplattenspeichers übertragen.
Der Doktorhut für Johannes Lehrbach, gestaltet vom FIAS/CERN-Team, faszinierte die Anwesenden: Er bestand aus einem kleinen Rechenzentrum mit interessanten Features; so konnte das Mobiltelefon aktive Statusmitteilungen anzeigen.