Na semana passada, @NVIDIA introduziu o CUDA 13.1, e nele um novo paradigma de programação de computação paralela – tiles. O CUDA "tradicional" expõe um modelo de hardware e programação de instrução única e múltiplas threads (SIMT) para desenvolvedores. 1/6
Esse paradigma permite a máxima flexibilidade, mas pode se tornar tedioso e difícil de otimizar. O paradigma tile toma tensores como os objetos fundamentais e trabalha a partir disso. É uma camada intermediária para línguas de nível superior. 2/6
A programação baseada em tiles permite que você programe seu algoritmo especificando blocos de dados, ou tiles, e então definindo os cálculos realizados nesses tiles. 3/6
Você não precisa definir como seu algoritmo é executado elemento a elemento: o compilador e o runtime vão cuidar disso para você. 4/6
Curiosamente, a programação baseada em tiles estará disponível para desenvolvimento em Python primeiro, embora o cuTile Python. A linguagem de programação tradicionalmente de alto nível para CUDA, C++, será lançada posteriormente. 5/6
10,81K