CUDA 2.3のメモ

マルチポスト元→http://exth.net/~tgbt/wordpress/2009/07/27/2389/


ToolkitとSDKの2.3が出たので,リリースノートを読んだメモを残しておく.
リリースノートをちゃんと読むのは久しぶりだったりする.酷い話だ.


ちなみに,これを書いている現在では,nvidia.co.jpには2.3のダウンロードはありません.おとなしくnvidia.comへ行きましょう.

toolkit 2.3

(http://developer.download.nvidia.com/compute/cuda/2_3/toolkit/docs/cudatoolkit_release_notes_windows.txt)

New Features(新しい機能)
  • Win7サポート(32bit/64bit)
  • CUFFTの性能向上と倍精度計算サポート

これって,倍精度非対応のGPUで動かそうとしたらどうなるんだろう?

  • 64bitPCでの32bitアプリ作成対応

先日ひっかかった記憶があるなこれ.入れ直して試してみよう.

  • SLI DeviceEmulationの強化

今まで何ができなかったのかを把握していないのと,該当する環境を使用していないのでスルーで.

いままでは,sm_13より古いバージョン指定の場合に出力されるptxは倍精度の記述を単精度に勝手に落として使っていて,warningを出していた.新しいオプションをつけることで抑制可能になった.

Major Bug Fixes(バグ修正)
  • DeviceEmulationにおけるC++の対応の修正

DeviceEmulationについて「Support is restored for ...」って書いてある.一度対応させたけどバギーだったので封印して,改めて対応したのかな?

Known Issues(既知の問題) Vista/Server2008向け
  • PhysX実行時の制限?

In order to run CUDA on a non-TESLA GPU, either the Windows desktop must be extended onto the GPU, or the GPU must be selected as the PhysX GPU.
なんだこりゃ?TESLAじゃないGPUでCUDAを実行するためには,Windowsのデスクトップ出力先がそのGPUであってなおかつPhysXの対象GPUになってないといけないってことか?

2秒までよ.

  • cudaMallocやcuMemAllocで確保できるメモリサイズの上限

MIN ( ( System Memory Size in MB - 512 MB ) / 2, PAGING_BUFFER_SEGMENT_SIZE ),VistaだとPAGING_BUFFER_SEGMENT_SIZEが2GB
ええと,1GBのメモリを搭載している場合は(1024-512)/2=256MB,2GBだと(2048-512)/2=768MB,4GBでも1792MBか.……マジ?

Known Issues(既知の問題) XP向け
  • 5秒制限
Known Issues(既知の問題) XP/Vista向け

しかも,今後変わるかも知れないよ!とのこと.性能確認して一番速そうなのを使うってのがサンプルにあった気がするなあ.

  • メモリ使いすぎの際の注意

CUDA_ERROR_OUT_OF_MEMORYが出るとコンテキストが使用不能になる

  • OSのバグでMallocが死ぬかも

http://support.microsoft.com/kb/940105

32bitWinでvector_types.hを使う場合,16byteアラインメントのベクタが腐るよ.

  • cudaThreadExit問題

cudaThreadExitは暗黙に呼ばれないことがあるよ.明示的に呼んでね.

  • ?

ええと,union使ったときとかに良くないメモリアクセスが起きるかも.今後コンパイラが改善できるといいな,とか書いてある.

割愛

cudasdk 2.3

名称変更

NVIDIA CUDA SDK から NVIDIA GPU Computing SDK へ.なん…だ…と…!?また紛らわしくなるなぁ.

PTXJIT追加

cuModuleLoadDataExサンプルの追加.ファイルからではなくメモリ上のイメージ(?)からPTXを読めるようになる.これはいずれ作る必要があると思っていた機能なのでうれしい.

cudaDecodeD3D9とcudaOpenGLの追加

よくわからないが,ビデオのデコード関係.Cudaで高速デコードしてくれるのかしら???


だいたいこんなかんじ(ギャグマンガ日和のリズムで).


ここまでの内容は,nvidiaの日本語のフォーラムにも書いてあったりする.ちょっと違うことが書いてある気もするけど…….


それから,本家のフォーラムにも記述がある.これによると,デバッガやプロファイラがToolkitと一緒にインストールされるようになったらしい.これから試す!
あと,CUDA C Best Practices Guide 2.3というドキュメントも増えたので,これから目を通すよ!