Hoy, anunciamos el próximo capítulo de Terminal-Bench con dos lanzamientos:
1. Harbor, un nuevo paquete para ejecutar implementaciones de agentes de espacio aislado a escala
2. Terminal-Bench 2.0, una versión más dura de Terminal-Bench con mayor verificación