Förra veckan introducerade @NVIDIA CUDA 13.1, och i det ett nytt paradigm för parallell datorprogrammering – tiles. Den "traditionella" CUDA exponerar en enkelinstruktions- och flertrådshårdvara (SIMT) och programmeringsmodell för utvecklare. 1/6
Detta paradigm möjliggör maximal flexibilitet, men kan bli tråkigt och svårt att optimera. Tile-paradigmet tar tensorer som de grundläggande objekten och arbetar utifrån det. Det är ett mellanlager till högre nivåers språk. 2/6
Tile-baserad programmering gör det möjligt för dig att programmera din algoritm genom att specificera databitar, eller tiles, och sedan definiera beräkningarna som utförs på dessa tiles. 3/6
Du behöver inte ställa in hur din algoritm ska köras på element-för-element-nivå: kompilatorn och runtime hanterar det åt dig. 4/6
Intressant nog kommer tile-baserad programmering att vara tillgänglig för Python-utveckling först, via cuTile Python. Det traditionellt högsta programmeringsspråket för CUDA, C++, kommer att släppas senare. 5/6
17,34K