上週 @NVIDIA 推出了 CUDA 13.1,並在其中引入了一種新的平行計算編程範式 - 磚塊。 "傳統" CUDA 為開發者提供了一種單指令、多執行緒 (SIMT) 的硬體和編程模型。 1/6
這種範式允許最大的靈活性,但可能變得繁瑣且難以優化。瓷磚範式將張量作為基本對象,並從此向上工作。它是通往更高級語言的中介層。 2/6
基於瓷磚的程式設計使您能夠通過指定數據塊或瓷磚來編寫算法,然後定義在這些瓷磚上執行的計算。 3/6
您不需要設置算法在逐個元素層級上的執行方式:編譯器和運行時會為您處理這一切。 4/6
有趣的是,基於瓷磚的編程將首先在 Python 開發中可用,雖然是 cuTile Python。傳統上用於 CUDA 的頂級編程語言 C++ 將稍後發布。 5/6
10.79K