Estimamos que o Kimi K2 Thinking tenha um horizonte temporal de 50% de cerca de 54 minutos (intervalo de confiança de 95% de 25 a 100 minutos) em nossas tarefas de SWE agente. Vale notar que realizamos essa avaliação por meio de um provedor de inferência terceirizado, o que reduz nossa confiança nessa estimativa.