NvidiaRTコアとAMDRayアクセラレータの比較–説明

2018年の第1世代のRTXグラフィックスカードで、Nvidiaは、私たちが知っているように、ゲームの風景を変えるはずのまったく新しい機能を世界に紹介しました。第1世代のRTX2000シリーズグラフィックスカードは、新しいTuringアーキテクチャに基づいており、ゲームでのリアルタイムレイトレーシングのサポートをもたらしました。レイトレーシングは、プロの3Dアニメーションおよび合成分野にすでに存在していましたが、Nvidiaは、ゲームを変えるはずだった従来のラスタライズの代わりに、レイトレーシングテクノロジーを使用したゲームのリアルタイムレンダリングのサポートをもたらしました。ラスタライズは、レイトレーシングが複雑な計算を使用して、ゲーム環境で実際の生活と同じように光がどのように相互作用し、動作するかを正確に描写する一方で、ゲームをレンダリングする従来の手法です。レイトレーシングとラスタライズについて詳しく知ることができます このコンテンツで



Ray Traced Reflectionsは、ゲームにおけるレイトレーシングの最も目を楽しませてくれるアプリケーションです–画像:Nvidia

2018年、AMDはNvidiaのRTXシリーズのグラフィックスカードとそのレイトレーシング機能に答えがありませんでした。レッドチームは、Nvidiaの革新的な導入の準備ができていなかったため、チームグリーンと比較してトップ製品が大幅に不利になりました。 AMD RX 5700 XTは、499ドルのRTX 2070 Superのパフォーマンスに匹敵する、399ドルの価格の素晴らしいグラフィックカードでした。しかしAMDにとって最大の問題は、競争が彼らが持っていない技術を提供したという事実でした。これは、多様な機能セット、DLSSサポート、安定したドライバー、および全体的に優れたパフォーマンスと相まって、Turing対RDNAの生成に関して、Nvidia製品を大きな利点にしています。



レイトレーシングを備えたAMDRX6000シリーズ

2020年に早送りすると、AMDはついにNvidiaのトップ製品に戦いをもたらしました。 AMDはゲームでリアルタイムレイトレーシングのサポートを導入しただけでなく、Nvidiaのトップグラフィックスカードと非常に競争力のある3枚のグラフィックスカードもリリースしました。 AMD RX 6800、RX 6800 XT、およびRX 6900 XTは、それぞれNvidia RTX 3070、RTX 3080、およびRTX3090と直接対決しています。 AMDはついに製品スタックの最上位で再び競争力を持ち、消費者にとっても有望なニュースとなっています。



レイトレーシングは、AMDがこの世代に導入した重要な機能の1つです–画像:AMD



ただし、AMDにとっても完全にポジティブなわけではありません。 AMDはゲームでリアルタイムレイトレーシングのサポートを導入しましたが、レイトレーシングのパフォーマンスはレビューアと一般消費者の両方から温かい歓迎を受けました。これはAMDによるレイトレーシングの最初の試みであるため、理解できます。したがって、最初の試みで最高のレイトレーシングパフォーマンスを提供することを期待するのは少し不公平です。ただし、チューリングと現在のアンペールアーキテクチャで見たNvidiaの実装と比較した場合、AMDのレイトレーシング実装がどのように機能するかについて疑問が生じます。

NvidiaのRTXテクノロジースイート

AMDの試みがNvidiaの試みと比較して圧倒的であると思われる主な理由は、AMDが本質的にNvidiaに追いついており、レイトレーシングの実装を開発して完成させるのに多かれ少なかれ2年しかかからなかったためです。一方、Nvidiaは、製品スタックの最上部で競合する相手がいないため、このテクノロジーをはるかに長い間開発してきました。 Nvidiaは、AMDの前にレイトレーシングサポートを提供しただけでなく、テクノロジーを中心に構築されたより優れたサポートエコシステムも備えていました。

Nvidiaは、レイトレーシングを主な焦点としてRTX2000シリーズのグラフィックスカードを設計しました。これは、Turingアーキテクチャ自体の設計全体で明らかです。 NvidiaはCUDAコアの数を増やすだけでなく、レイトレーシングに必要な計算の大部分を処理する「RTコア」と呼ばれる特定の専用レイトレーシングコアも追加しました。 Nvidiaは、「ディープラーニングスーパーサンプリングまたはDLSS」と呼ばれるテクノロジーも開発しました。これは、ディープラーニングとAIを使用して、アップスケーリングと再構築のタスクを実行し、レイトレーシングのパフォーマンスの低下を補う素晴らしいテクノロジーです。 Nvidiaは、ディープラーニングやDLSSなどのAIタスクを支援するように設計されたGeForceシリーズカードに専用の「テンソルコア」も導入しました。それに加えて、Nvidiaはゲームスタジオとも協力して、パフォーマンスを最大化できるように、専用のNvidiaハードウェア用に今後のレイトレーシングゲームを最適化しました。



レイトレーシングでは、ゲーム内で光が実際の動作と同じように動作します–画像:Nvidia

NvidiaのRTコア

RTまたはレイトレーシングコアは、ゲームのリアルタイムレイトレーシングに関連する計算ワークロードを処理するために特別に設計されたNvidiaの専用ハードウェアコアです。レイトレーシング専用のコアを使用すると、ゲームの標準レンダリング専用のCUDAコアから多くのワークロードがオフロードされるため、コア使用率の飽和によってパフォーマンスが大きく影響を受けることはありません。 RTコアは、汎用性を犠牲にし、特別な計算またはアルゴリズムのための特別なアーキテクチャを備えたハードウェアを実装して、より高速な速度を実現します。

一般的に知られているより一般的なレイトレーシング加速アルゴリズムはBVHとレイパケットトレースであり、チューリングアーキテクチャの概略図にはBVH(バウンディングボリューム階層)トランスバーサルも記載されています。 RTコアは、ゲームのレイトレーシングレンダリングに関連するコマンドを識別して高速化するように設計されています。

RTコアの説明–画像:Nvidia

Nvidiaの元シニアGPUアーキテクトYuboZhangによると:

「[変換済み] RTコアは基本的にSMに専用パイプライン(ASIC)を追加して、光線と三角形の交点を計算します。 BVHにアクセスし、いくつかのL0バッファーを構成して、BVHおよび三角形のデータアクセスの遅延を減らすことができます。リクエストはSMによって行われます。命令が発行され、結果がSMのローカルレジスタに返されます。インターリーブされた命令と他の算術またはメモリIO命令は同時に実行できます。これはASIC固有の回路ロジックであるため、交差計算にシェーダーコードを使用する場合と比較して、パフォーマンス/ mm2を1桁向上させることができます。私はNVを離れましたが、チューリングアーキテクチャの設計に携わっていました。私は可変レートのカラーリングを担当しました。今リリースされるのを楽しみにしています。」

Nvidiaはまた、Turing Architectureホワイトペーパーで、RTコアが高度なノイズ除去フィルタリング、NVIDIA Researchによって開発された高効率のBVHアクセラレーション構造、およびRTX互換APIと連携して、単一のTuringGPUでリアルタイムのレイトレーシングを実現すると述べています。 RTコアはBVHを自律的にトラバースし、トラバーサルと光線/三角形の交差テストを加速することで、SMをオフロードし、別の頂点、ピクセルを処理し、シェーディング作業を計算できるようにします。 BVHの構築や再調整などの機能はドライバーによって処理され、光線の生成とシェーディングは新しいタイプのシェーダーを介してアプリケーションによって管理されます。これにより、SMユニットは他のグラフィックおよび計算作業を行うことができます。

AMDのレイアクセラレータ

AMDはRX6000シリーズでレイトレーシングレースに参加しました。これに伴い、この機能を支援するRDNA2アーキテクチャ設計にいくつかの重要な要素を導入しました。 AMDのRDNA2 GPUのレイトレーシングパフォーマンスを向上させるために、AMDはレイアクセラレータコンポーネントをコアコンピューティングユニット設計に組み込んでいます。これらのレイアクセラレータは、レイトレーシングに関連する計算ワークロードで標準の計算ユニットの効率を高めることになっています。

Ray Acceleratorsの機能の背後にあるメカニズムはまだ比較的あいまいですが、AMDはこれらの要素がどのように機能するかについての洞察を提供しています。 AMDによると、これらのRay Acceleratorは、Bounded Volume Hierarchy(BVH)構造をトラバースし、光線とボックス(および最終的には三角形)の交差を効率的に決定するという明確な目的を持っています。この設計は、PCゲームの業界標準であるDirectXレイトレーシング(MicrosoftのDXR)を完全にサポートしています。それに加えて、AMDは、専用のハードウェアに依存するのではなく、コンピュートベースのデノイザーを利用してレイトレースシーンの鏡面反射効果をクリーンアップします。これはおそらく、新しいコンピューティングユニットの混合精度機能に余分な圧力をかけるでしょう。

レイアクセラレータの説明–画像:AMD

Ray Acceleratorは、1秒あたり4つのバウンドボリュームボックス交差または1つの三角形交差を処理す​​ることもできます。これは、専用ハードウェアなしでレイトレースシーンをレンダリングするよりもはるかに高速です。 AMDのアプローチには大きな利点があります。それは、RDNA2のRTアクセラレータがカードのインフィニティキャッシュと相互作用できることです。多数の境界ボリューム構造を同時にキャッシュに格納できるため、データ管理およびメモリ読み取りセルからいくらかの負荷を取り除くことができます。

主な違い

RTコアとRayAcceleratorを比較するとすぐにわかる最大の違いは、どちらも機能はほぼ同じですが、RT Coreは単一の機能を持つ専用の個別のハードウェアコアであり、RayAcceleratorはその一部であるということです。 RDNA2アーキテクチャの標準的なコンピューティングユニット構造。それだけでなく、NvidiaのRTコアはAmpereを搭載した第2世代であり、内部で多くの技術的およびアーキテクチャ上の改善が行われています。これにより、NvidiaのRT Core実装は、AMDのRayAcceleratorsによる実装よりもはるかに効率的で強力なレイトレーシング手法になります。

すべてのコンピューティングユニットに単一のレイアクセラレータが組み込まれているため、AMD RX 6900 XTには80のレイアクセラレータ、6800 XTには72のレイアクセラレータ、RX6800には60のレイアクセラレータが組み込まれています。これらの数値は、単一の機能を念頭に置いて構築された専用コアであるため、NvidiaのRTコア番号と直接比較することはできません。 RTX3090は822を取得しますndGen RTコア、RTX3080は602を取得しますndGenRTコアとRTX3070は462を取得しますndGenRTコア。 Nvidiaは、これらすべてのカードに個別のTensorコアも備えており、機械学習やDLSSなどのAIアプリケーションに役立ちます。 記事上で

RDNA 2のすべてのコンピューティングユニットに組み込まれているレイアクセラレータが1つあります–画像:AMD

将来の最適化

この時点で、NvidiaとAMDのレイトレーシングの将来がどうなるかを言うのは難しいですが、現在の状況を分析することで、いくつかの知識に基づいた推測を行うことができます。執筆時点で、Nvidiaは、AMDの製品と直接比較した場合、レイトレーシングのパフォーマンスにおいてかなり重要なリードを保持しています。 AMDはRTの素晴らしいスタートを切りましたが、研究、開発、サポート、最適化の点でNvidiaよりも2年遅れています。 Nvidiaは、現在2020年にほとんどのレイトレーシングタイトルをロックインして、AMDがまとめたものよりも優れたNvidiaの専用ハードウェアを使用しています。これは、NvidiaのRTコアがAMDのレイアクセラレータよりも成熟していて強力であるという事実と相まって、現在のレイトレーシングの状況に関してAMDを不利な立場に置きます。

ただし、AMDは間違いなくここで止まりません。 AMDは、レイトレーシングのパフォーマンスを向上させる上で大いに役立つDLSSに代わるAMDに取り組んでいることをすでに発表しています。 AMDはまた、ゲームスタジオと協力して、ハードウェア向けに今後のゲームを最適化します。これは、AMDのRX6000シリーズカードが驚くほど優れたパフォーマンスを発揮するGodFallやDirt5などのタイトルで示されています。したがって、AMDのレイトレーシングサポートは、今後のタイトルやDLSS Alternativeのような今後のテクノロジーの開発により、ますます良くなることが期待できます。

そうは言っても、執筆時点では、NvidiaのRTX Suiteは強力すぎて、深刻なレイトレーシングパフォーマンスを探している人にとっては無視できません。私たちの標準的な推奨事項は、レイトレーシングを購入決定の重要な要素と考える人のために、AMDのRX6000シリーズよりもNvidiaの新しいRTX3000シリーズのグラフィックスカードです。これは、AMDの将来の製品、および時間の経過とともにドライバーとゲームの最適化の両方が改善されることで変わる可能性があります。

RTXとDLSSの両方をサポートする今後のゲーム–画像:Nvidia

最後の言葉

AMDは、RDNA2アーキテクチャに基づくRX6000シリーズのグラフィックスカードの導入により、ついにレイトレーシングシーンに飛び込みました。直接レイトレーシングベンチマークでNvidiaのRTX3000シリーズカードに勝るものはありませんが、AMD製品は、レイトレーシングをあまり気にしないゲーマーにアピールする可能性のある非常に競争力のあるラスタライズパフォーマンスと印象的な価値を提供します。ただし、AMDは、いくつかの重要なステップをすばやく連続して実行することで、レイトレーシングのパフォーマンスを向上させる道を進んでいます。

レイトレーシングのためにNvidiaとAMDが採用したアプローチはかなり似ていますが、両社は異なるハードウェア技術を使用してこれを行っています。最初のテストでは、Nvidiaの専用RTコアが、コンピューティングユニット自体に組み込まれているAMDのレイアクセラレータよりも優れていることが示されています。これはエンドユーザーにとってはそれほど重要ではないかもしれませんが、ゲーム開発者はどちらのアプローチでもRT機能を最適化するという決定に直面しているため、将来的に考慮する重要なことです。