2008年9月23日

stream超基本

行列の転置サンプルから、非同期処理の練習用プログラム。

当然のことながら、サイズの小さい行列ではStreamの数を増やすとオーバーヘッドで処理速度が低下する模様。
ある程度のサイズがないと、オーバーラップの効果は出ない。
あと、やはりホスト・デバイス間のメモリ転送の割合が大きくないと、同じく効果は出にくい。
計算ネックなものに対してはあまり意味がない。

まぁ、ここまではとっくに予測できていたこと。
問題は、実際のアプリケーションに対してどうすればいいのか。

コメントする