Desember 25, 2024

Review Bekasi

Temukan Berita & berita utama terbaru tentang INDONESIA. Dapatkan informasi lebih lanjut tentang INDONESIA

2 ExaFLOPS, puluhan ribu CPU dan GPU

2 ExaFLOPS, puluhan ribu CPU dan GPU

Argonne National Laboratory dan Intel mengatakan pada hari Kamis bahwa mereka telah menginstal semua 10.624 cipher dari superkomputer Aurora, sebuah mesin yang diumumkan pada tahun 2015 dengan sejarah yang tidak rata. Sistem menjanjikan untuk memberikan kinerja komputasi teoretis tertinggi pada 2 FP64 ExaFLOPS menggunakan kombinasi puluhan ribu CPU Xeon Max ‘Sapphire Rapids’ dengan memori HBM2E onboard ditambah GPU Max ‘Ponte Vecchio’ untuk pusat data. Sistem akan online akhir tahun ini.

“Aurora adalah penerapan GPU Seri Max pertama dari Intel, sistem berbasis CPU Xeon Max terbesar, dan kluster GPU terbesar di dunia,” kata Jeff McPhee, Wakil Presiden Perusahaan dan Manajer Umum Intel, Super Compute Group.

Superkomputer Aurora terlihat mengesankan, bahkan dari segi jumlahnya. Perangkat ini ditenagai oleh 21.248 prosesor tujuan umum dengan lebih dari 1,1 juta inti untuk beban kerja yang memerlukan tenaga kuda CPU tradisional dan 63.744 GPU komputasi yang melayani beban kerja AI dan HPC. Dari segi memori, Aurora memiliki memori HBM2E onboard 1,36 petabyte dan memori DDR5 19,9 petabyte yang digunakan oleh CPU selain HBM2E 8,16 petabyte yang dipegang oleh GPU Ponte Vecchi.

Aurora menggunakan 166 rak dengan masing-masing 66 bilah. Ini mencakup delapan baris dan menempati area yang setara dengan dua lapangan basket. Sementara itu, subsistem penyimpanan Aurora, yang menggunakan 1.024 node penyimpanan all-flash yang menyediakan penyimpanan 220TB dan bandwidth total 31TB/dtk, tidak dihitung. Saat ini, Argonne National Laboratory tidak merilis angka konsumsi daya resmi untuk Aurora atau subsistem penyimpanannya.

Superkomputer, yang akan digunakan untuk berbagai beban kerja mulai dari simulasi fusi nuklir hingga prediksi dan dari aerodinamika hingga penelitian medis, menggunakan arsitektur superkomputer Shasta HPE dengan koneksi Slingshot. Sementara itu, sebelum sistem melewati tes penerimaan ANL, itu akan digunakan untuk model AI generatif ilmiah skala besar.

Saat kami mengerjakan pengujian penerimaan, kami akan menggunakan Aurora untuk melatih beberapa model AI generatif open source skala besar untuk sains,” kata Rick Stevens, direktur laboratorium di Argonne National Laboratory. “Dengan lebih dari 60.000 GPU Intel Max, sistem I/O yang sangat cepat, dan sistem penyimpanan solid-state yang besar dan lengkap, Aurora adalah lingkungan yang sempurna untuk melatih model-model ini.

Meskipun bilah Aurora terpasang, superkomputer masih harus menjalani dan lulus serangkaian tes penerimaan, yang merupakan prosedur umum untuk superkomputer. Setelah berhasil dipindai dan dibawa online di akhir tahun, diharapkan dapat mencapai kinerja teoretis lebih dari 2 ExaFLOPS (dua miliar operasi floating point per detik). Dengan performa yang fenomenal diharapkan dapat mengamankan posisi pertama dalam daftar Top500.

Pemasangan superkomputer Aurora menandai beberapa pencapaian: ini adalah superkomputer pertama di industri dengan kinerja di atas 2 ExaFLOPS dan perangkat kelas ExaFLOPS pertama dari Intel. Akhirnya, ini menandai kesimpulan dari saga Aurora yang dimulai delapan tahun lalu saat perjalanan superkomputer telah mengalami banyak rintangan.

Awalnya terungkap pada tahun 2015, Aurora pada awalnya dimaksudkan untuk ditenagai oleh koprosesor Intel Xeon Phi dan diperkirakan akan mengirimkan sekitar 180 PetaFLOPS pada tahun 2018. Namun, Intel memutuskan untuk meninggalkan Xeon Phi demi modul komputasi pemrosesan grafis, yang menghasilkan perlu menegosiasi ulang perjanjian dengan Argonne National Laboratory untuk menyediakan sistem ExaFLOPS pada tahun 2021.

Pengiriman sistem lebih lanjut tertunda oleh komplikasi dengan ubin komputasi Ponte Vecchio karena penundaan simpul produksi 7nm Intel (sekarang dikenal sebagai Intel 4) dan kebutuhan untuk mendesain ulang ubin untuk teknologi proses N5 (kelas 5nm) TSMC. Intel akhirnya memperkenalkan produk pusat data GPU Max akhir tahun lalu, dan kini telah mengirimkan lebih dari 60.000 GPU tersebut ke ANL.