La arquitectura Transformer es fundamentalmente un procesador paralelo de contexto, pero el razonamiento es un proceso secuencial e iterativo. Para resolver problemas complejos, un modelo necesita un "scratchpad" no solo en su CoT de salida, sino en su estado interno. Una forma diferenciable de hacer bucles, ramificaciones y retrocesos hasta que el modelo encuentre una solución que funcione.