Jeg har endelig kommet til det punktet hvor nok av tingene jeg stoler på er b200 + cuda + torch-spesifikke til at jeg ikke kunne få samme resultater på TPU-er med Jax. For en uventet vending.