Hoy, anunciamos el próximo capítulo de Terminal-Bench con dos lanzamientos: 1. Harbor, un nuevo paquete para ejecutar implementaciones de agentes de espacio aislado a escala 2. Terminal-Bench 2.0, una versión más dura de Terminal-Bench con mayor verificación