Hoje, estamos anunciando o próximo capítulo do Terminal-Bench com dois lançamentos: 1. Harbor, um novo pacote para executar lançamentos de agentes em área restrita em escala 2. Terminal-Bench 2.0, uma versão mais difícil do Terminal-Bench com verificação aumentada