我終於到了這樣的地步,我依賴的許多東西都是 b200 + cuda + torch 特定的,以至於我無法在 TPUs 上用 Jax 獲得相同的結果。真是意想不到的變故。