Hoje, estamos anunciando o próximo capítulo do Terminal-Bench com dois lançamentos:
1. Harbor, um novo pacote para executar lançamentos de agentes em área restrita em escala
2. Terminal-Bench 2.0, uma versão mais difícil do Terminal-Bench com verificação aumentada