NVIDIA Ampere A100 250W TDP GPU Pada PCIe 4.0 Dibuat Untuk AI, Sains Data, dan Komputer Super Dilancarkan Dengan Prestasi 90 Peratus Dijanjikan Model 400W

Perkakasan / NVIDIA Ampere A100 250W TDP GPU Pada PCIe 4.0 Dibuat Untuk AI, Sains Data, dan Komputer Super Dilancarkan Dengan Prestasi 90 Peratus Dijanjikan Model 400W 2 minit membaca

Nvidia



NVIDIA secara rasmi melancarkan A100, GPU serasi PCIe 4.0 berdasarkan seni bina Ampere generasi seterusnya. Walaupun menampilkan profil TDP 250W yang lebih rendah, NVIDIA menjanjikan PCIe 4.0 Ampere A100 GPU akan dapat menawarkan hingga 90 peratus prestasi GPU 400W A100 HGX penuh. Varian ketiga untuk keluarga GPU Ampere A100 yang sedang berkembang, A100 PCIe dimaksudkan untuk pelayan yang menjalankan Artificial Intelligence (AI), Data Science, dan Supercomputing cluster.

NVIDIA mendedahkan varian PCI-Express 4.0 dari GPU A100. GPU berdasarkan seni bina mikro 7nm Ampere. Selain itu, syarikat itu juga mengumumkan beberapa sistem berkuasa A100 dari pengeluar pelayan terkemuka, termasuk Asus, Dell, Cisco, Lenovo, dan banyak lagi. Pemecut GPU 250W A100 PCIe 4.0 hampir sama dengan varian TDP 400W penuh, dan NVIDIA juga menjanjikan prestasi yang hampir sama walaupun terdapat penurunan profil TDP yang ketara.



NVIDIA A100 Ampere GPU Dalam PCIe 4.0 Form-Factor Dengan Konfigurasi GPU 400W A100 HGX yang Sama Tetapi Pada 250W:

NVIDIA telah mengumumkan pemecut GPU PCIe 4.0 A100 PCIe. GPU Ampere tersedia untuk pelbagai kes penggunaan industri dengan sistem mulai dari GPU A100 PCIe tunggal hingga pelayan yang menggunakan dua kad pada masa yang sama melalui saluran 12 NVLINK yang memberikan jumlah lebar jalur interkoneksi 600 GB / s. Pemecut GPU 250W TDP A100 PCIe tidak banyak berubah dari segi konfigurasi teras jika dibandingkan dengan GPU 400W A100 HGX.



GA100 GPU mempunyai spesifikasi varian 400W A100 HGX dengan teras 6912 CUDA yang disusun dalam 108 unit SM, 432 Tensor Cores, dan memori HBM2 40 GB yang memberikan lebar jalur memori yang sama sebanyak 1.55 TB / s (dibundarkan kepada 1.6 TB / s s). Walau bagaimanapun, menggunakan paket GPU di Standard PCIe 4.0 mempunyai kekurangannya sendiri untuk mengurangkan TDP dengan ketara. Ini dilaporkan bermaksud hukuman prestasi 10 hingga 50 peratus berdasarkan beban kerja. Lebih-lebih lagi, varian TDP 250W dari GPU A100 lebih sesuai untuk pecah pendek dan bukannya beban berterusan.

NVIDIA A100 Ampere GPU Dalam PCIe 4.0 Prestasi Bentuk-Faktor:

Oleh kerana pengurangan profil TDP yang ketara, dapat diandaikan bahawa kad tersebut akan menampilkan jam yang lebih rendah untuk mengimbangi input TDP yang kurang. Walau bagaimanapun, metrik prestasi yang dikeluarkan oleh NVIDIA benar-benar mengejutkan kerana ia hampir hampir dengan varian TDP 400W. Prestasi FP64 masih dinilai pada 9.7 / 19.5 TFLOP, prestasi FP32 dinilai pada 19.5 / 156/312 TFLOPs (Sparsity), prestasi FP16 dinilai pada 312/624 TFLOP (Sparsity), dan INT8 dinilai pada 624/1248 TOP ( Kekurangan).



Matematik sederhana menunjukkan, dan NVIDIA memberi jaminan, PCIe 4.0 250W A100 GPU berasaskan Ampere dapat memberikan 90 peratus prestasi kad A100 HGX (400W) dalam aplikasi pelayan teratas. Ini dibenarkan kerana memerlukan lebih sedikit masa untuk varian baru untuk menyelesaikan tugas-tugas di atas. Walau bagaimanapun, nombornya hanya boleh berlaku untuk selang waktu pendek sahaja. Dalam keadaan rumit, situasi yang memerlukan kemampuan GPU yang berterusan, GPU 250W PCIe 4.0 dapat memberikan prestasi dari mana saja hingga 90 persen hingga ke 50 persen prestasi GPU 400W A100 HGX.

Senibina mikro Ampere pasti akan menguntungkan A100 baru. NVIDIA menjanjikan sekurang-kurangnya peningkatan prestasi 20X berbanding pendahulunya yang berpangkalan di Volta. PCIe 4.0 A100 GPU mempunyai teknologi GPU multi-instance. Ini bermaksud satu A100 dapat dibahagikan kepada tujuh GPU berasingan untuk menangani tugas pengkomputeran yang berbeza. Walaupun ini meningkatkan segmentasi, ada NVLink generasi ke-3, yang membolehkan beberapa GPU digabungkan menjadi satu GPU gergasi.

Teg nvidia