消えたCUDA関連の旧ブログ記事を復元するひとり Advent Calendar 2024の記事です。
CUDA Profiler Controlとは
CUDAのRuntime APIやカーネル関数のプロファイルを取りたいときに使うものです.
nvprofのAPI版みたいな気持ちでしょうか
CUDAのすべての呼ばれる関数ではなく,一部の必要な関数のプロファイリングを行いたいときに便利です.
Referenceはあるのですが,configファイルの書き方などがあまりネットに転がっていないように思えたのでサンプルを書いておきます.
Profile Controlサンプル
コード
profile.conf
これはPyTorchのコードを参考にしました.
表示できる項目一覧はCOMPUTE COMMAND LINE PROFILER User Guideに書かれています.
結果
こうすることで目的のCSVファイルを得ます.