Hoy, anunciamos el próximo capítulo de Terminal-Bench con dos lanzamientos: 1. Harbor, un nuevo paquete para ejecutar implementaciones de agentes en un entorno aislado a gran escala 2. Terminal-Bench 2.0, una versión más difícil de Terminal-Bench con verificación aumentada