DApp Store | Sede de Web3 para eventos y juegos

Tendencias del momento

Codifiqué un solucionador de ríos de póker de código abierto durante las vacaciones. El código está 100% escrito por Codex, y también hice una versión con Claude Code para comparar. En general, estas herramientas me permitieron iterar mucho más rápido en un dominio que conozco bien. Pero también sentí que no podía confiar plenamente en ellas. Cometían errores y encontraban fallos, pero en lugar de reconocerlo, a menudo pensaban que no era un gran problema o, en ocasiones, simplemente intentaban hacerme dudar de que algo estaba mal. En una memorable sesión de depuración con Claude Code, le pregunté, como verificación de cordura, cuál sería el valor esperado de una estrategia de "siempre foldear" cuando el jugador tiene $100 en el bote. Me dijo que, según su algoritmo, el EV era -$93. Cuando señalé lo extraño que era eso, esperando que se diera cuenta por sí mismo de que había un error, me aseguró que $93 estaba cerca de $100, así que probablemente estaba bien. (Una vez que le pedí que considerara específicamente los bloqueadores como un posible problema, reconoció que el algoritmo efectivamente no los estaba teniendo en cuenta correctamente.) Codex no fue mucho mejor en esto y se encontró con su propio conjunto de errores (interesantemente) distintos y errores algorítmicos que tuve que resolver cuidadosamente. Afortunadamente, pude trabajar en esto porque soy un experto en solucionadores de póker, pero no creo que haya muchas otras personas que pudieran haber tenido éxito en hacer este solucionador utilizando herramientas de codificación de IA. La experiencia más frustrante fue hacer una GUI. Después de una docena de idas y venidas, ni Codex ni Claude Code pudieron hacer el frontend que pedí, aunque el de Claude Code al menos era más bonito. No tengo experiencia en frontend, así que quizás lo que estaba pidiendo simplemente no era posible, pero si ese era el caso, desearía que me hubieran *dicho* que era difícil o imposible en lugar de hacer implementaciones rotas o cosas que no pedí. Me destacó cómo todavía hay una gran diferencia entre trabajar con un compañero humano y trabajar con una IA. Después de que las implementaciones iniciales se completaron y se depuraron, pedí a Codex y Claude Code que crearan versiones optimizadas en C++. En esto, Codex lo hizo sorprendentemente bien. Su versión en C++ era 6 veces más rápida que la de Claude Code (incluso después de múltiples iteraciones de solicitud de más optimizaciones). Las optimizaciones de Codex aún no eran tan buenas como las que podría hacer, pero, por otro lado, pasé 6 años de doctorado haciendo bots de póker. En general, pensé que Codex hizo un trabajo impresionante en esto. Mi solicitud final fue preguntar a las IA si podían proponer algoritmos novedosos que pudieran resolver los ríos de NLTH incluso más rápido. Ninguno tuvo éxito en esto, lo cual no fue sorprendente. Los LLM están mejorando rápidamente, pero desarrollar algoritmos novedosos para este tipo de cosas es un proyecto de investigación de meses para un experto humano. Los LLM aún no están a ese nivel.

Parte superior

Clasificación

Favoritos