Ik ben eindelijk op het punt gekomen waarop genoeg van de dingen waarop ik vertrouw b200 + cuda + torch specifiek zijn, dat ik niet dezelfde resultaten op TPU's met Jax kon krijgen. Wat een onverwachte wending van gebeurtenissen.