数字magicが素晴らしいGeforce RTX 50(Blackwell 2.0)…… ベンチマークを見てから買え。

PC Watchの記事を読んで……日本はやっぱり記事書きが駄目だなと思って書く記事である。これはDLSS4があってのこととはっきり言及すべきだが、それを書かないから善し悪しがはっきりしないのだ。


CESでNVIDIAが発表したGeforce RTX 5070/5070Ti/5080/5090の4製品だが、これ基本性能が大きく上がっている訳では無いことに注意が必要である。2倍とか数字は出ているが、RTX 5090で比較してみるとDLSS4.0などの新技術を使わないなら、純粋性能倍率は1.2倍台に留まることが既に確定している。

当初は1.33倍だったが、どうも発熱と電力を抑えるために少しクロックを下げたことで、元々推定されていたフィルレートよりピクセルレートやテクスチャーレートは下がっている。下げ率は5~6%程である。元々1.33倍だったが、1.27-1.28程に下がっているのだ。

以下が新しい比較表である。
Geforce RTX 5090.png

エンコーダーやデコーダーの機能がどう変わっているのかは記事執筆時点でまだNVIDIAのNVENCやDECの情報データが更新されていないので、分からないが描画レートは思った程上がっていないのが分かるだろう。むしろ、噂段階に比べて下がっている。

これは、5090に限らず他の製品でも何倍と性能が上がる製品は1つもない。
では、何故5070などが4090並になると宣言したのかというと、これは単純に使う命令セットが新しくなるので、それに対応したゲームが出てくれば爆発的に性能を水増し(DLSSでフレーム生成)できるからである。

昨日も書いたが、トランスフォーマーベースのDLSS4.0が追加され、これによってフレームジェネレーターがこれまで正式フレームで1フレーム当たり1つのフレーム生成による2倍生成だったものを、正式1フレームから複数のサブ生成フレームが作られるようになる、マルチフレームジェネレーターへと進化した。これによって、4090比で見ると見かけ上はフレームレートが大幅に上げられるというのがBlackwell 2.0の売りになったわけだ。

さらに、AIのTOPS性能も大幅に上がっているが、これの重要な点はAI TOPSと書かれている点だ。これは、マイクロソフトなどが使っているNPUなどに用いるAI性能の指標ではない。MS等が示すこれは、Int8ベース(8bit粒度の整数演算)のオペレーション回数で示されるが、AI TOPSというのは演算ビット粒度が固定されていないものである。Blackwell 2.0の数字が大きく上がった理由は、Blackwell と同2.0ではFP6とFP4をネイティブサポートしているからだ。

ちなみに、Ada LovelaceはFP8とInt8までで一応FP8をFP6に置き換えて処理する機能まではサポートしていたが、ネイティブサポートはFP8まで、FP4はサポートすらしていない。これが何を意味するかというと、FP8の半分の粒度をサポートすれば、同じビット粒度の演算器で処理出来る最大オペレーション数は、FP8に比べてFP4だと2倍になるという結果が生まれてくる。

このお陰で、AI TOPSの性能が大きく飛躍的に上がって見えるようになったと言うわけである。そして、この恩恵を上手く利用したのがDLSS4.0だと思われる。メモリーの消費も大きく下がるとしており、DLSS4.0でマルチフレームジェネレーターを使う際に、ビット粒度を8bit単位から、粗粒度の6bitや4bit中心に置き換えたことで、演算効率が飛躍的に上がると同時にメモリーの節約に繋がるという恩恵が得られたのだろう。

結果、DLSS4.0に対応したゲームでこれを使うなら飛躍的にフレームレートが上がり、メモリーの消費量も以前とは比べものにならないほど下がるという効果が得られると考えられる。トランスフォーマーベースのDLSSというのは、粗粒度の演算性能を生かすのに最適だったのがこれだったのだろう。
Windows 11でPCを買替えさせたくて仕方がないMicrosoftのNPU推しで行っているCopilotより上手い行列演算の使い方と言える。

それ以外の効果はまだはっきりしないが、この効果はレイトレーシングなどにも活用できる部分があれば多少、性質の改善などで影響を与えるかも知れない。

これを逆に見れば、DLSSなどの目的が特にないなら、性能はそんなに上がらないことを示している。頑張ってもGeforce RTX 5090と4090比で1.27倍ぐらいにしか上がらないのだ。でも、DLSS対応のゲームはPCだと一番多いし、GPGPUにおいてもCUDA対応の開発環境やクリエーション環境ももっとも多い。そう考えると、この特性を理解していれば試したくなる人は主に制作側に多いだろう。


即ち、ゲーマー側がどう思うかは、ベンチマークなどを待って特性を見極めてからの方がよいと思われる。はっきりしているのは、性能を見ても、最適化していないゲームが何倍もの性能に跳ね上がるようなGPU仕様ではないことだ。だから、5070は4090の2倍だという言葉などに踊らされて買って、既存ゲームを試したらあれれ……と後悔したりすることがないように、ちゃんと人柱の情報が出て自分がやりたいゲームソフトやアプリケーションソフトでその恩恵が得られるかどうかは、チェックしてから買うことである。

これから出てくる新しいゲームをやるとか、新しいソフトウェアを使うというなら、新しいに越したことはない「はず」である。Geforceも価格が高止まりしているので、消費者の買替えムーブメントも低下しており、ゲーム開発者やアプリケーション開発者もLLMを除けば、最新をどんどん入れる時代ではなくなっているので、何年後にそれを最大限生かした製品が出てくるかは分からないけど……。きっといつかは対応するはずなので、長く使えるかも知れない。

尚、これに近い話が、tomshardware.comの記事で書かれている。DLSSがなければ、5070が4090に匹敵することはないというのは、スペックを見れば当たり前である。そもそも、4090と5090も過去の製品と比べると凄く高い性能アップにはなっていないので、殆どは命令セットとそれを活用するAPI群の対応のお陰であり、それを使うゲームが出て来ないと本来の性能が出ることはないとみるべきである。

これは、悪い話ということではない。リソグラフィーが既に限界に近づいている中では、もうこういうソフトウェア手法の改善や、扱うデータごとに粒度の最適化をすることで、性能を引き出すしか、大幅なパフォーマンス改善は出来なくなり始めたからだ。これから、先のGPUやCPUはこういうアプリケーションソフトの開発側の対応待ちが必要になるものが増えていくことを想定して、いつ何を買うかを決めて行くことが肝要かも知れない。