Je suis enfin arrivé au point où suffisamment de choses sur lesquelles je compte sont spécifiques à b200 + cuda + torch, que je ne pourrais pas obtenir les mêmes résultats sur des TPU avec Jax. Quel tournant inattendu.