El Capitan (Supercomputer)

Supercomputer in den Vereinigten Staaten From Wikipedia, the free encyclopedia

El Capitan ist ein Exascale-Supercomputer, d. h. ein Supercomputer, der mindestens eine Trillion an Gleitkommaoperationen pro Sekunde durchführen kann. El Capitan ging im Jahr 2025 im Lawrence Livermore National Laboratory (LLNL) in Betrieb. Er basiert auf der EX Shasta-Architektur von Cray. In der 64. Ausgabe des TOP500-Rankings (November 2024) löste El Capitan den Supercomputer Frontier als schnellsten Supercomputer der Welt ab.

El Capitan ist das dritte von den Vereinigten Staaten eingesetzte Exascale-System. Es dient primär der National Nuclear Security Administration zur Simulation von physikalischen Reaktionen von Kernwaffen bzw. zur Wartung und Testung von US-amerikanischen Atomwaffen.[1][2]

Design

El Capitan nutzt insgesamt 11.039.616 CPU- und GPU-Kerne, bestehend aus 43.808 AMD EPYC 24C „Genoa“ Prozessoren der vierten Generation mit 24 Kernen und 1,8 GHz Taktfrequenz (1.051.392 Kerne) und 43.808 AMD Instinct MI300A GPUs (9.988.224 Recheneinheiten (je 228) mit insgesamt 639.246.336 Stream-Prozessoren (je 14.592)). Die MI300A besteht aus 24 Zen4-basierten CPU-Kernen und einer CDNA3-basierten GPU, die in einem einzigen organischen Gehäuse integriert sind, sowie 128 GB HBM3-Speicher.[3]

Die Blades sind über einen HPE Slingshot 64-Port-Switch mit einer Bandbreite von 12,8 Terabit/Sekunde miteinander verbunden. Gruppen von Blades sind in einer Dragonfly-Topologie mit maximal drei Hops zwischen je zwei Knoten verknüpft. Die Verkabelung erfolgt entweder optisch oder kupferbasiert und ist so angepasst, dass die Kabellänge minimiert wird. Die Gesamtverkabelung beträgt 145 km.

El Capitan nutzt eine APU-Architektur, bei der CPU und GPU über eine interne, kohärente On-Chip-Verbindung verbunden sind. El Capitan belegt eine Fläche von 700 m², was in etwa der Fläche von zwei Tennisplätzen entspricht.[4]

Es besteht aus mindestens 87 Rechenracks, darunter die schnellen „Rabbit“-NVM-Express-Speicherarrays und Rechenknoten. El Capitan verfügt über insgesamt 11.136 Knoten in flüssigkeitsgekühlten Cray-EX-Racks mit jeweils vier MI300A-Recheneinheiten und insgesamt 44.544 Geräten im gesamten System. Jedes Gerät verfügt über 128 GB HBM3-Hauptspeicher, der von den CPU- und GPU-Chiplets gemeinsam genutzt wird. Dieser taktet mit 5,2 GHz und bietet eine aggregierte Bandbreite von 5,3 TB/s für den Datenverkehr zwischen CPU- und GPU-Chiplets.[5]

Geschichte

El Capitan wurde im Rahmen der CORAL-2-Initiative des US-Energieministeriums bestellt und sollte Sierra, eine 2018 eingesetzte IBM/Nvidia-Maschine, ersetzen.[2] Das Lawrence Livermore National Laboratory (LLNL) arbeitete mit HPE Cray und AMD zusammen, um das System zu bauen.[6]

Drei El-Capitan-Prototypen – rzVernal, Tioga und Tenaya – waren so leistungsstark, dass sie im Juni 2023 in die TOP500-Liste der schnellsten Supercomputer aufgenommen wurden.[7] rzVernal erreichte 4,1 Petaflops.[8] Anfang Juli 2023 wurden die ersten Komponenten von El Capitan in Lawrence Livermore installiert; die vollständige Installation war für Mitte 2024 erwartet worden.[9]

Am 18. November 2024 wurde El Capitan in einen Testmodus versetzt; er wurde als schnellster Supercomputer der Welt mit einer Rechenleistung von 1,742 ExaFLOPS verifiziert.[10]

Im Februar 2025 wurde er offiziell im LLNL in Betrieb genommen. Das LLNL gab bekannt, dass der Bau des Supercomputers 600 Millionen US-Dollar gekostet hat.[2]

Einzelnachweise

Related Articles

Wikiwand AI