Por fin he llegado al punto en que suficientes cosas en las que dependo son específicas de b200 + cuda + torch como para que no consiga los mismos resultados con TPUs con Jax. Qué giro inesperado de los acontecimientos.