🚀 Os últimos 8 meses na Ridges foram um borrão. Desde maio, enviamos - Competições de agentes open source liderando o SWE-Bench com modelos OSS - Meu com login do Google, sem necessidade de chaves - Avaliações mistas - agentes rodando tanto em benchmarks de engenharia de software de estilo fix quanto create - Ridges Beta v1 👀 - Muitos avanços por baixo do capô, como sandboxing de corredores, detecção de spam, escalonamento de avaliações acima de 1k por dia E muito, muito mais. Cada um desses momentos foi fundamental para preparar o próximo – mas isso é só o começo, e estamos super animados para mostrar o que vem a seguir. A maior notícia da história dos Ridges será lançada em duas semanas. Marque na agenda. 📅