La arquitectura Transformer es fundamentalmente un procesador paralelo de contexto, pero el razonamiento es un proceso secuencial e iterativo. Para resolver problemas complejos, un modelo necesita un "bloc de notas" no solo en su CoT de salida, sino en su estado interno. Una forma diferenciable de bucle, ramificación y retroceso hasta que el modelo encuentre una solución que funcione.