ディープ・ラーニング・スーパー・サンプリング

エヌビディアの画像アップスケーリング技術 From Wikipedia, the free encyclopedia

ディープ・ラーニング・スーパー・サンプリング英語: Deep learning super sampling(DLSS))は、NVIDIAによって開発され、一部のビデオゲームでリアルタイムに使用するためのNvidiaグラフィックカード専用英語版の画像アップスケーリングテクノロジーである。本項では略称である『DLSS』を用いて記述する。

概要

DLSSはその名の通り、ディープラーニング(深層学習)を使用して、低解像度の画像を高解像度にアップスケールし、高解像度のコンピューターモニターに表示する超解像技術の一つである。

NVIDIAによればこの技術は、ネイティブ画像と同等の品質・高解像度レンダリング並のアップスケールを実現する上、ビデオカードによる負荷(計算・性能)が少なくてすむため、特定の解像度ではより高いグラフィック設定とフレームレートが可能になるとしている[1]。バージョンが進んだ2.0に置いてNVIDIAは、「ネイティブ解像度に匹敵する画質を提供する」と説明した[2]。以降もバージョンの更新は継続されている。

2025年4月の時点で、このテクノロジーはGeForce RTX 20GeForce RTX 30GeForce RTX 40GeForce RTX 50シリーズGPUでのみ利用可能である。また、NVIDIAは2025年4月に同年6月5日発売の任天堂のゲーム機『Nintendo Switch 2』もDLSSに対応することを発表し、当該機に搭載された[2][3]

歴史

NVIDIAは、2018年9月に発売されたGeForce RTX20シリーズGPUの主要機能としてDLSSを追加した[4]。当時は、限られた少数のゲームタイトル(『バトルフィールドV [5]』と『メトロエクソダス』)においてのみ対応されていた。またアルゴリズムを対応された各ゲームで個別に調整する必要があり、平時の効果は単純な解像度のアップスケーリングと比較して大きな差はなかった[6][7]

2019年、ゲームタイトル『コントロール』において、レイトレーシングとTensorCoreを使用しなかったDLSSの改良版が対応されていた[8][9]

2020年4月、NVIDIAはドライバーバージョン445.75を提供し、DLSS 2.0へのバージョンアップが行われた。これは前述の『コントロール』『ウルフェンシュタイン:ヤングブラッド英語版』などのいくつかの既存のゲームで利用でき、今後発売されるゲームでも対応し利用可能になるとしている。2.0ではTensor Coreを再び使用することでAI学習データを用いる事で、初期のバージョンで必要だった各ゲーム毎での個別調整する必要はなくなった[4][10]。ただし、ゲーム側の対応と実装は引き続き個別に必要となる。
2.0のデメリットとしてはMSAA英語版TSAA英語版などのアンチエイリアス手法が、適切に効果が発揮されない点がある。この設定の場合DLSSを有効にすると、パフォーマンスに大きな悪影響がある[11]

2021年11月に2.3へとバージョンアップ。動きの激しい場面で発生するゴーストを、モーションベクトルをより高度に利用するよう改善したことで軽減に成功したとしている[12]

2022年12月に3.0がリリース、通常のレンダリングと比べて性能が最大で4倍増、更に従来のアップスケールに加えてオプティカルマルチフレーム生成機能が追加された。また、CPUがボトルネックとなっていてもフレームレートを高めることが可能となる。レイテンシを軽減するためにNVIDIA Reflexが搭載。フレーム生成機能はGeForce RTX 40シリーズのみで対応しており[13]、アップスケーリング機能は従来のGeForce RTX 20・RTX 30シリーズにも対応している。

2023年9月に3.5がリリース、「Ray Reconstruction(光線再構築)」と呼ばれる新技術が追加[14]され、この機能はRTX 20シリーズからRTX 30を含めた全てのRTXシリーズに対応する。

2025年に発売されたRTX50シリーズに併せて、DLSS4.0がリリース。RTX50シリーズのみで利用できる「マルチフレーム生成」をサポートし、更に機械学習モデルをTransformerに変更したことで、従来のバージョンでサポートした各種機能の性能も大幅に向上した[15]

2026年1月にDLSS4.5がリリース。マルチフレーム生成を最大で6倍のフレームレートまで実現するほか、超解像技術は更に高解像感が高められた第2世代「Transformer」が搭載された[16]

リリース履歴

さらに見る バージョン, リリース月 ...
バージョン リリース月 概要
1.0 2019年2月 AIを使用し、バトルフィールドVメトロエクソダスなどの特定のゲーム用に特別に調整された最初のバージョン[5]
2.0(最初の実装) 2019年8月 CUDAシューダーコアで実行され、特にコントロールに適合した進行中のバージョン2.0の近似AIを使用する。バージョン1.9とも呼ばれる最初の2.0バージョン[8][4][17]
2.0(2回目の実装) 2020年4月 Tensor Coreを再度使用し、一般的に調整された2番目の2.0バージョン[18]で、4段階のゲーム画質設定モードが実装された。
2.3 2021年11月 動きの激しい場面で発生するゴーストを、モーションベクトルをより高度に利用するよう改善したことで軽減に成功したとしている[12]
3.0 2022年10月 DLSS超解像、全く新しいDLSSフレーム生成、NVIDIA Reflexを組み合わせたバージョン[13]
3.1 2023年1月 2023年8月の3.5発表時にリリース済みである事が明かされたマイナーアップデートバージョンで詳細不明[14]。2025年にNintendo Switch2に実装されているバージョンである事が開発者向け要件から判明した[19]
3.5 2023年9月 「Ray Reconstruction(光線再構築)」と呼ばれる新技術が追加[14]され、この機能はRTX 20シリーズからRTX 30を含めた全てのRTXシリーズに対応する。
4.0 2025年1月 RTX 50シリーズのみで利用可能となる「DLSS マルチフレーム生成」機能が追加された。フレームレートの大幅な向上を謳っている[20][21]。また、機械学習モデルがTransformerに変更され、従来のDLSSでサポートされている機能の効果が従来より強化されている[22]
4.5 2026年1月 動体の残像感が減り,解像度を高めたときのディテール復元も高品質になった第2世代「Transformer」超解像技術が追加された[16]。この機能はRTX 20シリーズからの全RTXシリーズに対応する。また、ダイナミックマルチフレーム生成を最大で6倍のフレームレートで実現する[23]。こちらはRTX 50シリーズのみ対応。
閉じる

ゲーム画質モード(2.0以降)

さらに見る 品質プリセット, スケールファクター ...
標準DLSSプリセット[24]
品質プリセット[注釈 1] スケールファクター[注釈 2] レンダリングスケール[注釈 3]
クオリティ 1.50x 66.6%
バランス 1.72x 58.0%
パフォーマンス 2.00x 50.0%
ウルトラパフォーマンス(v2.1以降) 3.00x 33.3%
閉じる
  1. アルゴリズムは必ずしもこれらのプリセットを使用して実装する必要はなく、実装者がカスタムの入力および出力解像度を定義することも可能。
  2. 入力解像度を出力解像度にアップサンプリングする際に使用されるスケールファクターのこと。例えば、540pでレンダリングされたシーンを2.00xのスケールファクターで表示すると、出力解像度は1080pになる。
  3. アップサンプリングの前に内部でシーンをレンダリングする際に使用される、出力解像度と比較したレンダリングスケールのこと。例えば、1080pのシーンを50%のレンダリングスケールでレンダリングした場合、内部解像度は540pになる。

バージョン

DLSS 1.0

NVIDIAはDLSS 1.0について、従来のスーパーサンプリングを使用して「完璧なフレーム」を生成することで、各ゲーム画像毎にニューラルネットワークで学習する必要があると説明した。 2番目のステップでは、初期結果でアンチエイリアシングやVRSといった映像処理をAIの処理に任せるという調整がなされた[25][26]

DLSS 2.0[27]

  • ニューラルネットワークは、スーパーコンピューターでの超高解像度のビデオゲームの「理想的な」画像と同じゲームの低解像度画像を使用して、NVIDIAによって学習され、ビデオカードドライバに保存される。 NVIDIAはDEX-1英語版サーバーを使用してネットワークのトレーニングを実行すると言われている[28]
  • ドライバーに保存されているニューラルネットワークは、実際の低解像度画像を参照と比較し、完全な高解像度の結果を生成するもの。調整されたニューラルネットワークによって使用される入力は、ゲームエンジンによってレンダリングされた低解像度のエイリアス画像と、同じくゲームエンジンによって生成された同じ画像からの低解像度の動きベクトルである。モーションベクトルは、次のフレームがどのように見えるかを推定するために、シーン内のオブジェクトがフレーム間を移動している方向をネットワークに通知している[29]

DLSS 3.0[13]

  • 全く新しいフレームを生成するオプティカルマルチフレーム生成を追加し、最適な応答性を実現するNVIDIA Reflex低遅延技術を統合している。
  • DLSS フレーム生成畳み込みオートエンコーダーは、現在と前のゲームのフレーム、オプティカルフローアクセラレータで生成されたオプティカルフローフィールド、モーションベクターや深度などのゲームエンジンのデータの4つの入力を受け取る。アクセラレータは、連続した2つのゲーム内フレームを解析しフローフィールドを計算、フレーム1からフレーム2へピクセルが移動する方向と速度を捉える。
  • アクセラレータは、ゲーム エンジンのモーションベクター計算には含まれないパーティクル、リフレクション、シャドウ、ライティングなどのピクセルレベルの情報を取得することが可能であるとしている。

DLSS 4.0[30][31]

  • DLSSマルチフレーム生成機能が追加され、対応ゲームタイトルではフレームレートを飛躍的に向上させる事が可能になる。この機能はRTX50シリーズのみが対応している。
  • 機械学習モデルをTransformerに変更し、従来のバージョンで追加された機能の結果がより高品質なモノになるように改良された[32]

DLSS 4.5

  • 第2世代Transformerモデルが導入され、各種機能の品質がより向上した。なお、第2世代TransformerモデルはFP8処理演算を用いるため、FP8処理にハードウェアレベルで対応していないRTX20/30シリーズ(Turing、Ampereアーキテクチャ)では、本機能を有効化することでパフォーマンスに悪影響が出る可能性がある。

アーキテクチャ

DLSSは、GeForce RTXシリーズのGPUで、Tensor Coresと呼ばれる専用の AIアクセラレータでのみ使用できる[29][33]

Tensor Coreは、Tesla V100の製品ラインで最初に使用されたNVIDIA Volta英語版 GPUマイクロアーキテクチャ以降に利用可能[34]。それらの特異性は、各Tensorコアが16ビット浮動小数点4 x 4マトリックスで動作し、コンパイラレベルでもCUDA C ++レベルで使用されるように設計されているように見えることである[35]

Tensor Coreは、32の並列スレッドでCUDA ワープレベルプリミティブを使用して、並列アーキテクチャを活用する[36]。ワープは、同じ命令を実行するように構成された32スレッドのセットである。

3.0はNVIDIA Ada Lovelaceアーキテクチャの新しい第4世代Tensor Coreとオプティカルフローアクセラレータによってのみ動作する。

他社の競合技術

  • AMD FSR
  • Intel XeSS

脚注

関連項目

外部リンク

Related Articles

Wikiwand AI