Nintendo Switch 2の推定性能仕様、PS4、PS5比較とSwitchとの比較

Swith 2の仕様表を少しばかりアップグレードしてみたので公開する。

Switch2_NEW.png

CPUやGPUのキャッシュなどをOrinの仕様から調べて追加している。

以前も書いたが、性能はSwitchと比べると大幅に上がる。
ゲーミング性能はレイトレーシングを使わないなら、確実に超えてくるだろう。GPUの性能やメモリー帯域は劣るもののCPUやGPUの世代差によってキャッシュも増えており、それが良く影響し効率の差が生じており、さらに命令セットが大きく拡張されているからだ。そのため、レイトレーシングコアによる光源測定を咥えないなら、PS4 Proの性能は確実に超えてくるとみられる。

但し、テクスチャーマッピングユニットの数が少ないので、フィルタリング合成を多用するゲームは開発時にある程度TMUの数が少ないことを考慮したゲーム設計をしないと、PS4より性能が落ちる恐れがある。即ち、制約なくPS4 Proを上回ってくれるわけではない。ゲームを作る側がその制約調整を果たしてくれないと、PS4から直接移植したら品質が大きく下がることもあるのだ。

レイトレーシングを使うとどうなるかというと、
PS4 Proにはレイトレーシングの機能がないので、使うと描画するときの光学品質(光の反射や映り込みの緻密さ)が向上するが、フレームレートは解像度とレイトレーシングを必要とする範囲レベルの大きさによって0.3倍~0.8倍程度まで低下することになるが、シェーダーユニットだけで見るなら、FP32で4TFlopsという性能はGPUとしてSnapdragon 8 Gen 3並にはなるので、凄く遅い訳でもないし、むしろRTやTensorが別にあるのでそれなりに良い性能を発揮するだろうから、最新のスマートフォンやタブレット並の性能があると思ってよい。但し、後述もするがこの性能はコンソールモードで使った時の性能になると考えられる。


ストレージの性能は、PS4や同Proより3倍以上ピークレートにアップする。これは、これまでのeMMC HS400だったインターフェースがUFS3.1に変更されるためである。PS5には及ばないが、初代のNVMeの2倍の最大速度がサポートされる。さらに、全二重転送で処理されるため、応答性が上がるのも特徴だ。これによって、リード/ライトの遅延が大きく低減される。事実上なくなるといっても良いだろう。

尚、SDカードスロットやゲームスロットの転送性能がどの程度になるかは不明だ。SDUCとSDExpressをサポートすると対応したメモリーカードを使うことで、大幅にスピードアップが図れるが……。それに対応するかどうは不明である。一応、今の仕様をそのまま継承する可能性が高いと見た方がよいであろう。

ゲーミングにおいては、基本的に携帯モードでは720pをベースにするとされている。携帯モードではフレームレートも30fpsを下回ることはほぼないだろう。そして、コンソールモード(据え置き)で1080pをアップスケーリングなしの最大解像度設定として、アップスケーリング4Kをサポートする。

4KアップスケーリングはDLSS2.0と3.5を使うことになると思われる。使われる倍率は720p(x8)/1080p(x4)だろう。フレームレートは可能な限り30fps以上をサポートするようになると見られるが、1080pからのアップスケーリングだと一部下回るケースが見られるという噂が流れている。これは、先に書いたTMUの数も影響していると思われる。マルチプラットフォームの高精細度なゲームタイトルだと、Swith 2 
にどこまでお金を掛けて最適化するかによって、フレームレートの安定性が大きく変わると考えられる。

ちなみに、Ampereベースなので、DLSS3.0に搭載されているFrame Generation(フレーム生成)の機能は搭載されない。これはAmpereにフレーム生成のためのフロー演算を司る機能がないからである。


最後に総合的なSwitchとの性能差の推定をそれぞれに書いていくと、

CPUの性能は前世代のSwitchから少なくとも
シングルスレッドで2倍~3倍、
マルチスレッドでシングルスレッドの倍数×約2.8~3倍ほどに跳ね上がる。

GPUのFP32性能は概ね理論上は10倍程度になり、実効レートではそれ以上
rasterizeは理論上では1.5×2倍ぐらいだが、ここはPS4やPS4 Proより高い。
TM(テクスチャー)の理論性能は、少なくとも3-4倍ほどで、
新規に行列演算とレイトレーシングが追加され、それを利用したアップスケーリングがサポートされる。

メモリーの性能は4倍以上、メモリー容量は3倍、RAM LatencyはDDR4からLPDDR5になるので少しタイミングを合わせる必要があり増えるはずだ。
ストレージ性能はピークレートで約4倍ぐらい上がり、並列アクセス遅延が大きく改善される。



GPUやCPUの性能上昇の割に、TMUの理論性能をそれほど上げていないのは携帯ゲームモードを重視し、
コンソールモードは最小限の演算(合成)リソースを使ったアップスケーリングを前提にコストを抑えているからと見るべきだろう。実際には、NVIDIAで選ぶ携帯ゲーム向けでお安い汎用製品がこれしかなかったからだろうけど。そこが、ある種他のゲーム機と比べた時の弱みでもある。

任天堂独占のゲームタイトルなら、TMUの上昇幅が低くともしっかり上がっており、他はさらに大幅に上がっているので、結構高精細で以前より安定したフレームレートが実現できそうだ。また、任天堂のゲーム機専用ならこれまでとは比べものにならないほど快適だったり、リアリティのあるゲームが実現できるのは間違いない。

逆に、マルチプラットフォーム向けのゲームメーカーで且つ他のゲームコンソールでギリギリまで性能を喰らって作っているゲームのSwitch2への移植ならば、このTMUの並列度に対する対応をちゃんと出来ないと、Switch向けでは思った程遊べないゲームに成り下がる可能性がある。もちろん、既存のSwitchよりは遥かにマシになるだろうが、レイトレーシング対応だからとフィルターなどがゴリゴリ乗ったままで対応させたら……解像度の低い携帯ゲームモードでも描画が追いつかなくなる恐れがあるのだ。

ここが、ある種の弱みになり、ゲーム開発する側の腕の見せ所にもなるだろうし、開発環境やAPIを供給する任天堂やNVIDIAの力の見せ所でもあるだろう。噂されているspecificationから見えるのはこんな感じである。