Un proyecto que me alegra mucho ver lanzado, liderado por @couplefire12 durante su pasantía en Together 🔥 Si tienes curiosidad sobre el razonamiento con RL en configuraciones no verificables, ¡échale un vistazo!