先週@NVIDIA CUDA 13.1を導入し、そこに新しい並列計算プログラミングのパラダイムであるタイルが導入されました。「従来型」CUDAは、開発者向けに単一命令・マルチスレッド(SIMT)のハードウェアおよびプログラミングモデルを公開しています。 1/6
このパラダイムは最大限の柔軟性を可能にしますが、面倒で最適化が難しくなることがあります。タイルのパラダイムはテンソルを基本対象とし、そこから上へと進めていきます。これは高水準言語への中間層です。 2/6
タイルベースのプログラミングでは、データのチャンク、つまりタイルを指定し、そのタイル上で行われる計算を定義することでアルゴリズムをプログラムできます。 3/6
アルゴリズムの実行方法を要素ごとに設定する必要はありません。コンパイラやランタイムがそれを処理してくれます。 4/6
興味深いことに、タイルベースのプログラミングはまずPython開発で利用可能になりますが、cuTile Pythonで利用可能です。CUDAの伝統的に最上位のプログラミング言語であるC++は、後にリリースされる予定です。 5/6
10.8K