LLMs realmente precisam de uma função de 'copiar e colar' com um scratchpad, com uma quantidade absurda de cópias manuais acontecendo, copiando coisas 'atravessando' o modelo (na velocidade de token de inferência). Isso me deixa loucoo.