Radeon Open Compute 'ROCm' Stack v3.1 Dilancarkan Dengan RAS Untuk Vega 7nm, Sokongan SLURM Untuk Pengurusan Sumber yang Lebih Baik, Tetapi Navi Masih Hilang

Perkakasan / Radeon Open Compute 'ROCm' Stack v3.1 Dilancarkan Dengan RAS Untuk Vega 7nm, Sokongan SLURM Untuk Pengurusan Sumber yang Lebih Baik, Tetapi Navi Masih Hilang 2 minit membaca

AMD Radeon



Versi baru Radeon Open Compute atau “ROCm” sekarang ada untuk muat turun. Radeon Open Compute v3.1 membawa beberapa ciri, tetapi anehnya, sokongan untuk AMD Navi dan juga GFX10 masih belum ada.

ROCm, platform sejagat yang paling banyak diterima untuk pengkomputeran dipercepat GPU, kini terdapat pada versi 3.1. Kemas kini terbaru ke platform modular yang membolehkan vendor perkakasan membina pemacu yang menyokong rangka ROCm merangkumi beberapa ciri yang dinanti-nantikan seperti sokongan RAS untuk 7nm Vega dan sokongan SLURM untuk GPU AMD. Walau bagaimanapun, untuk alasan yang belum diketahui, ROCm masih tidak mempunyai sokongan sepenuhnya untuk AMD Navi Architecture generasi akan datang.



Yang Baru Di Radeon ROCm v3.1:

Perubahan terbesar dan paling jelas dalam pemasangan baru Radeon ROCm v3.1 adalah dalam Struktur Direktori Pemasangan ROCm. Pemasangan baru toolkit ROCm memasang pakej di / pilih / rocm- folder. Sebelum ini, paket peralatan ROCm dipasang di / opt / rocm folder.



Versi baru ROCm telah meningkatkan sokongan Kebolehpercayaan, Kebolehcapaian, dan Kebolehgunaan (RAS) untuk GPU Vega 7nm. Kerja Vega 7nm ini mungkin di bawah mikroskop masih untuk Arcturus berasaskan Vega pemecut komputasi datang tahun ini. Sokongan ini merangkumi:



  • UMC RAS ​​- HBM ECC (suntikan ralat yang tidak dapat dibetulkan), pengunduran halaman, pemulihan RAS melalui GPU (BACO) reset
  • GFX RAS - GFX, MMHUB ECC (suntikan ralat yang tidak dapat diperbaiki), pemulihan RAS melalui GPU (BACO) reset
  • PCIE RAS - PCIE_BIF ECC (suntikan ralat yang tidak dapat dibetulkan), pemulihan RAS melalui GPU (BACO) reset

Radeon ROCm v3.1 juga mendapat Sokongan SLURM untuk GPU AMD. SLURM atau Simple Linux Utility for Resource Management adalah salah satu sistem pengurusan dan penjadualan pekerjaan yang sangat disukai dan mudah digunakan untuk kluster Linux. SLURM lebih disukai kerana sumber terbuka, toleransi kesalahan, dan sangat berskala.

Sistem ini kini dapat berinteraksi dengan baik dengan GPU AMD. Versi terbaru 20.02.0 SLURM merangkumi pemalam AMD yang membolehkan SLURM mengesan dan mengkonfigurasi GPU AMD secara automatik. Ia juga mengumpulkan dan melaporkan penggunaan tenaga cip grafik. Sokongan SLURM adalah tambahan yang berguna memandangkan peningkatan jumlah penggunaan super-pengkomputeran menggunakan Radeon GPU dan kelompok GPU AMD yang lebih besar.

Walaupun terdapat beberapa ciri, masih belum ada tanda-tanda sokongan GFX10 / Navi di ROCm. The Halaman GitHub untuk ROCm telah diperbaharui untuk mencerminkan semua perubahan, nota pemasangan, dan masalah yang diketahui.



Teg amd