La scorsa settimana @NVIDIA ha introdotto CUDA 13.1, e in essa un nuovo paradigma di programmazione per il calcolo parallelo - tiles. Il CUDA "tradizionale" espone un modello hardware e di programmazione a singola istruzione e più thread (SIMT) per gli sviluppatori. 1/6
Questo paradigma consente la massima flessibilità, ma può diventare noioso e difficile da ottimizzare. Il paradigma dei tile prende i tensori come oggetti fondamentali e lavora da lì in su. È uno strato intermedio per linguaggi di livello superiore. 2/6
La programmazione basata su tile ti consente di programmare il tuo algoritmo specificando blocchi di dati, o tile, e poi definendo i calcoli eseguiti su quei tile. 3/6
Non è necessario impostare come il tuo algoritmo viene eseguito a livello di elemento per elemento: il compilatore e il runtime si occuperanno di questo per te. 4/6
È interessante notare che la programmazione basata su tile sarà disponibile per lo sviluppo in Python prima, tramite cuTile Python. Il linguaggio di programmazione tradizionalmente di alto livello per CUDA, C++, sarà rilasciato in seguito. 5/6
10,8K