Коли модель є продуктом, весь UX є RLHF. Кожне редагування, виправлення та натискання стають тренувальним сигналом. Нове ремесло продуктового дизайнера: створення для навчання, а не лише для використання.
Кожна епоха обчислювальної техніки мала свої цикли навчання. Ера ПК: ручні цикли, наприклад, звіти про помилки. Веб-ера: програмні цикли, наприклад, кліки. Ера штучного інтелекту: цикли самонавчання, наприклад, вкладки, прийняття/відхилення, чернетки.
У продуктах зі штучним інтелектом інтерфейс є поверхнею зворотного зв'язку. Кожне «Прийняття», «Редагування» або «Видалення» чогось навчає модель. Таким чином, питання дизайну продукту більше не полягає лише в тому, «чи зручно ним користуватися?». Це також «Чи може система вчитися на використанні?».
1,09K