Radeon Open Compute“ ROCm” Stackv3.1がRASFor Vega 7nmでリリースされ、SLURMがより優れたリソース管理をサポートしますが、Naviはまだありません

ハードウェア / Radeon Open Compute“ ROCm” Stackv3.1がRASFor Vega 7nmでリリースされ、SLURMがより優れたリソース管理をサポートしますが、Naviはまだありません 読んだ2分

AMD Radeon



Radeon OpenComputeまたは「ROCm」スタックの新しいバージョンがリリースされました 利用可能 ダウンロード用。 Radeon Open Compute v3.1にはかなりの数の機能がありますが、奇妙なことに、AMDNaviとGFX10のサポートはまだありません。

GPUアクセラレーションコンピューティングで最も広く受け入れられているユニバーサルプラットフォームであるROCmは、バージョン3.1になりました。ハードウェアベンダーがROCmフレームワークをサポートするドライバーを構築できるようにするモジュラープラットフォームの最新のアップデートには、7nmVegaのRASサポートやAMDGPUのSLURMサポートなどの待望の機能が含まれています。ただし、理由はまだ不明ですが、ROCmは次世代のAMDNaviアーキテクチャを完全にはサポートしていません。



Radeon ROCm v3.1の新機能:

Radeon ROCm v3.1の新規インストールにおける最大かつ最も明白な変更は、ROCmインストールディレクトリ構造にあります。 ROCmツールキットを新規インストールすると、パッケージが / opt / rocm- フォルダ。以前は、ROCmツールキットパッケージは / opt / rocm フォルダ。



ROCmの新しいバージョンでは、Vega 7nm GPUの信頼性、アクセシビリティ、および保守性(RAS)のサポートが強化されています。この7nmベガの作品は、おそらくまだ顕微鏡下にあります ベガベースの「Arcturus」 今年登場するコンピューティングアクセラレータ。サポートには次のものが含まれます。



  • UMC RAS – HBM ECC(修正不可能なエラーインジェクション)、ページのリタイア、GPU(BACO)リセットによるRASリカバリ
  • GFX RAS – GFX、MMHUB ECC(修正不可能なエラーインジェクション)、GPU(BACO)リセットによるRASリカバリ
  • PCIE RAS – PCIE_BIF ECC(修正不可能なエラーインジェクション)、GPU(BACO)リセットによるRASリカバリ

Radeon ROCm v3.1は、AMDGPUのSLURMサポートも取得します。 SLURMまたはSimpleLinux Utility for Resource Managementは、Linuxクラスター用の非常に好まれてすぐに使用できるクラスター管理およびジョブスケジューリングシステムの1つです。 SLURMは、オープンソースであり、フォールトトレラントであり、拡張性が高いため、推奨されます。

このシステムはAMDGPUとうまく相互作用できるようになりました。 SLURMの最新バージョン20.02.0には、SLURMがAMDGPUを自動的に検出して構成できるようにするAMDプラグインが含まれています。また、グラフィックチップのエネルギー消費量を収集して報告します。 SLURMのサポートは、RadeonGPUやその他の大規模なAMDGPUクラスターを使用したスーパーコンピューティングの展開が増えていることを考えると、便利な追加機能です。

いくつかの機能が含まれているにもかかわらず、ROCmでGFX10 / Naviがサポートされている兆候はまだありません。ザ・ ROCmのGitHubページ すべての変更、インストールに関する注意事項、および既知の問題を反映するように更新されました。



タグ amd