トランジスタが70%増でも性能が最大4倍になったGeForce RTX 4090のカラクリ……283億→763億で2.6倍。
PC Watchの記事である。
たぶん、いつか修正されると思うが、これタイトルが間違っている。Geforce RTX 3090/同TiのGA102-3x0ダイはトランジスター数が283億で、RTX 4090(AD-102)は763億である。そのため、トランジスター数は70%増ではなく、2.69倍(2倍を100%とするなら169%増、2倍を200%とするなら269%増である)となる。尚、どこからこの70%増がやって来たのか調べたのだが単純に、2倍(200)が抜けているだけか……それとも言いたいことが違うのかは分からない。
尚、トランジスター1個のサイズは、同じ平方インチのGPUだったならば0.37倍に縮小された計算である。
厳密な値で考えると、techpowerupの先行データでは608平方ミリメートル(AD102)と628(GA102)平方ミリメートルになるので、Samsung 8nm→TSMCの4nm?(NVIDIA曰く4Nであり、TSMC N4とは異なるようだ)ではトランジスターサイズは0.359092倍に縮小されたのと同等ということになる。即ち、トランジスタ密度は2.7848倍まで上がっている。
クロック周波数は、ベースでTiの1670→2230MHz(1.3353倍)、ブーストで1860→2520MHz(1.3548倍)上がっている。
シェーダーユニットは10752→16384で1.52倍増えている。これを単純にかけ算すると、1.34×1.52=2.0368倍になる。即ち、RTX 3090Tiと公称値同じ電力枠で、最適化が無くても2.0368倍の性能を発揮することが可能な程度には高速化したということになる。
逆に言えば、トランジスタ数から見れば、これは少ない性能上昇になるわけだが、何故減っているかというと、AV1に対応した2基のNVENCエンコーダーや、これまでCUDAコアには無かったフロントエンドのデコーダー(x86で言えばμOPにして実行順序を最適化するような仕組みなど)が追加されたことで、シェーダーコアの数はトランジスタ数の割に増えていないのだろう。だが、これが今後アプリケーションソフトが最適化されていけば、強みになると言うのが、NVIDIAの狙いであると考えることが出来る。
即ち、ゲームがNVIDIAの技術に最適化されれば、この技術をベースにしたローエンドコアや省電力チップで爆発的な性能を発揮できるかもしれないという将来性を示したということでもある。ある意味で先々を見越して野心的に動いていると言える。そして、この沼に嵌まったら、逃げられないルートをNVIDIAは今も模索していることが分かる。
尚、以下がNVIDIAのサイトとtechpowerupから集めたRTX 4090の仕様である。
この仕様の範囲で見ると、電力としては、3090Tiと同じに収まり、性能は通常の処理でも2倍には上がっていると考えて良い。
即ち、価格面では品薄とは言え、3090Tiはだいぶ値下がりしているので、4090が魅力的と言えるかはまだ分からないが、3090Tiを選ぶより、ワットパフォーマンスは最低でも2倍は高いと考えて良い。先日ここで書いたあれは、正しくなかったということだ。お詫びして訂正する。
但し、これが4080になると、消費電力面では同等なのだが、PCIeスロットがこれまで2だったのに3になり、廃熱処理が求められるようだ。
トランジスタ数が大幅に増えていることで、熱密度の上がったGPUの熱を吐き出すのに結構大きなヒートシンクとファンが求められるのだろう。尚、これはリファフェンスのボードデザインでの話なので、さらにオーバークロック出来る製品の場合は、消費電力が更にあがったり、一部で4スロットを求める製品も出てくるかも知れない。(実際にそういう話も一部にあったので、可能性は十分にある)
見た目の懸念点はその辺りぐらいだ。
ただ、潜在的なリスクはある。それは、またNVIDIAはオリジナルに発展させようとしているということだ。
今回もNVIDIAはオリジナルのソフトウェア対応が必要な投資を、チップ内に組込んで、対応アプリケーションの芽が生えてくれば、化けるというものを用意しているからだ。それが、4倍という意味だ。アプリケーションが対応してくるとそれは効いてくるだろう。そして、それが効いてくると、RADEONなどは選びにくくなる。
これが罠になるか、それとも利点となるか?はまだ分からないが、悩ましい仕様にトランジスタを組み込んだことが分かる。