Temas en tendencia
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
¿Los agentes de codificación de IA realmente escriben pruebas?
Las pruebas son fundamentales para la corrección y la mantenibilidad del software. A medida que los agentes autónomos envían cada vez más pull requests, comprender su comportamiento de prueba se vuelve esencial.
Esta nueva investigación analiza el conjunto de datos de AIDev para estudiar patrones de inclusión en pruebas en pull requests generadas por agentes.
Examinaron con qué frecuencia aparecen las pruebas, cuándo se introducen durante el ciclo de vida de la PR y cómo difieren las PR que contienen pruebas de las que no la tienen.
Los hallazgos revelan patrones interesantes. Las PR que contienen pruebas se han vuelto más comunes con el tiempo entre agentes, lo que sugiere una mejora en el comportamiento de las pruebas. Pero estos récords personales suelen ser mayores y tardan más en completarse que los que no son pruebas.
Las tasas de fusión siguen siendo en gran medida similares independientemente de si se incluyan las pruebas. Esto plantea preguntas sobre si los revisores valoran las pruebas generadas por agentes o simplemente no penalizan su ausencia.
Este trabajo pone de manifiesto una variación significativa entre diferentes agentes. Algunos agentes muestran tasas de adopción de pruebas más altas que otros. El equilibrio entre el código de prueba y el código de producción dentro de las PR que contienen pruebas también varía sustancialmente según el agente.
Esto sugiere que la capacidad de prueba no se desarrolla de forma uniforme entre las herramientas de codificación agentica. Algunos son mejores siguiendo las convenciones de pruebas que otros.
A medida que las empresas adoptan agentes de codificación con IA, comprender su comportamiento de prueba es crucial para la calidad del código. Los agentes que se saltan pruebas o escriben pruebas inadecuadas generan deuda técnica. Esta base empírica ayuda a identificar qué agentes se alinean con buenas prácticas de ingeniería de software y dónde se necesitan mejoras.
Papel:
Aprende a crear agentes de IA efectivos en nuestra academia:

Populares
Ranking
Favoritas
