Ich bin endlich an dem Punkt, an dem genug der Dinge, auf die ich angewiesen bin, b200 + cuda + torch-spezifisch sind, dass ich mit TPUs und Jax nicht die gleichen Ergebnisse erzielen konnte. Was für eine unerwartete Wendung der Ereignisse.