🌀Lucrare nouă: Era interacțiunii 🌀 umane din lumea reală 📝: - RL *direct* din conversațiile utilizatorului - Răspunsurile organice + istoricul pe termen lung sunt semnal de învățare - Antrenat pe WildChat, bate RLHF la nivel de *utilizator* -> viitorul super-inteligenței personale? 🧵1/6