今天,我们宣布 Terminal-Bench 的下一个篇章,推出两个版本: 1. Harbor,一个用于大规模运行沙盒代理发布的新软件包 2. Terminal-Bench 2.0,一个更严格的 Terminal-Bench 版本,增加了验证