Hub Środowiskowy teraz obsługuje evals - każde środowisko RL może być oceniane przy użyciu najpopularniejszych modeli.