果たしてNVIDIAはRTX 4090Dで中国への禁輸の問題を超えられるのか…… 本当に厳しくなるのは、今より2年後かもね。
tomshardware.comとTechPowerUpの記事である。
Geforce RTX 4090が中国への輸出規制対象(禁輸)になったのは、DL/ML(LLM)に用いる演算性能が一定の枠を超えているからである。要は、単体(単一カード、チップ)でのFP性能が規制対象を上回っていると、中国への輸出が出来なくなる訳だ。
だから、NVIDIAはRTX 4090(AD102-250)というバリエーション製品を準備していると報じられている。ちなみに、今回AMDのRadeon RX 7900 XTXや7900XTは対象にならないことから、今爆裂に中国でうれているらしい。
このBlogを初めて読む人などは何故、Radeonは対象にならないのか不思議だと思う人もいるだろうから、説明するとRadeon RXに使われているRadeon DNA3は、NVIDIAで言うところのTensor Core、Intelで言うところのXe Matrix Extensions(XMX)のようなビジュアルワーク専用の演算器を持たないからだ。だから、ビジュアルワークの演算数値が上位の製品でもRTX 4090の1/3ぐらいまで下がり、販売継続が可能だったわけだ。
AMDはゲーミング向けのRadeonでは、基本的にシェーダーユニットでGPGPU処理も行うフルラスタライズタイプのGPUだ。そのラスタライズブロックの一部シェーダーをビジュアルワーク(GPGPU)に応用する形となっている。そして、業務用のPROシリーズはその比率をファーム調整し半々とかぐらいまで調整出来るように遊びを設けたと考えると良い。その分、ゲーミングだと遅いが、機械学習などでは速くなる。但し、後述するinstinctほどではない。
そして、GPGPU専用のinstinctと呼ばれるサーバー用のGPGPUユニット(NVIDIAで言うところのHopper/Hシリーズ)がシェーダーユニットをラスタライズではなく、ほぼ全てビジュアルワークのみに使うようにドライバーとファーム、設計で調整している。
だから、AMDのGPUはNVIDIAより少ないトランジスタ数でNVIDIAと競合できる性能を発揮する。特に伝統的なDirectXやOpenGLの純粋ラスタライズだけなら圧倒的出る。何せ、同じチップサイズトランジスタ数なら、ラスタライズに関連するシェーダーの数が多いからだ。NVIDIAだとTensorなどで埋まっている部分も、ラスタライズ関連の演算器が入っていれば性能は高くなる。
しかし、DLSSやビジュアルワークなどの演算が加わると、性能が相応に低下する傾向があるのだ。目的が定まっていればNVIDIAと比べても価格以上の性能を発揮するものも多いので、ゲーミング目的なら売れて当然なところはある。
ただ、今はゲーミングもディープラーニング(DL/ML)によるアップスケーリングを利用するから一歩AMDが後れていたということと、トレンドがAIになったことで、AMDのイメージが相対的に下がったこと。そのタイミングに、AMDのGPUはドライバー問題を抱えたことなどが重なって下がってしまったと言える。まあ、そもそも、GPU関連の記事を書く記事書きがこの辺りの説明をしていないのも理由の一つだろう。
話を戻すと、だからNVIDIAのGeforce RTX 4090は禁輸対象になり、中国のゲーマーでGPUを求める人はRadeon RX7900に流れることになった。
それを取り返すには、CUDA CoreとTensor Coreの性能を物理的に下げるしかない。但し、下げすぎるとゲーミングに影響を与えるので、なるべくビジュアル系の処理のみに特化して押し下げる方法を模索することになる。ただ、LHRのようなソフトウェア(ファーム)ベースの対応だと、突破される恐れがあり、突破されると米国政府から制裁をうける恐れがある(これもしも破ると米国内の企業との部品取引規制が掛かるはずで結構厳しい)ので、今になって情報が出ているが、実際に派調整を前々からしていたと思われる。
多分、私が思うにこれで行われる対応は、Tensorコアの一部を物理的に殺すことだろうと見ている。これに加えて一部のCUDAコアも止めるだろうが、Tensorの比率を多めに停止すれば、ゲーミングへの影響をなるべく抑制してAIなどに関わるビジュアル性能を大きく抑えられる。
ゲーミングで弊害があるとすれば、DLSS3実行時のフレームレートがゲームによっては予想以上に下がるかもしれないことだろう。
ただ、tomshardware.comの記事にはあるが、それをやると今度は、総熱量が減るので、オーバークロックで超えてくる可能性が高まる。そこは、プロダクトで初期設定しているTDPの最大枠そのものを下げて、物理的に超えられないようにするか、オーバークロックそのものを禁止するという手になるだろう。
まあ、NVIDIAにとって目下最大の懸念材料は、この規制がもしも2年後も続いているならば(多分続いているだろうが)、次の世代のGPUでは中国市場に出荷出来るGPUがさらに80や70のようなパフォーマンスグレードやミドルグレードにも拡大する恐れがあることだ。概ねNVIDIAのGPU世代交代で考えると次のGB(Blackwell)は今の90と同等以上の性能を80で実現するぐらいにはなるはずだ。そうなると、性能を90と80の双方で下げなければいけなくなり、90と80は同じ性能相当になんて冗談みたいな話もない話ではない。まあ、規制の対象となる基準が上がっていれば良いが……
そのように見るとNVIDIA(性能が規制条件に達すればここに限らないが)にとって本当に厳しいのは、この規制がずっと先にも続くなら、その規制の対象が今後新世代の高性能製品が出るほどに増えていくことであり、新しい高性能品を出すほどに、中国市場には売れなくなる事かもしれない。