Quando o modelo É o produto, toda a experiência do usuário é RLHF. Cada edição, correção e clique torna-se um sinal de treinamento. A nova habilidade do designer de produto: construir para a capacidade de aprendizado, não apenas para a usabilidade.
Cada era da computação teve seus próprios ciclos de aprendizagem. Era do PC: ciclos manuais, por exemplo, relatórios de bugs. Era da Web: ciclos programáticos, por exemplo, cliques. Era da IA: ciclos de auto-aprendizagem, por exemplo, abas, aceita/rejeita, rascunhos.
Nos produtos de AI, a interface é a superfície de feedback. Cada Aceitar, Editar ou Excluir ensina algo ao modelo. Portanto, a questão do design do produto não é mais apenas "é fácil de usar?" também é "o sistema pode aprender com o uso?"
1,1K