Tópicos populares
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
o resumo da entrevista de Dwarkesh Patel com Ilya Sutskever
• As abordagens atuais "vão avançar um pouco e depois vão estagnar"; continuarão a melhorar, mas não entregarão AGI.
• O tipo de sistema que funcionaria é algo "que ainda não sabemos como construir."
• Esperam-se impactos significativos no mercado de trabalho nos próximos anos.
• Principal gargalo: generalização. Os modelos são muito piores que os humanos nisso.
• Você pode treinar em todos os problemas de programação competitiva, e o modelo ainda não desenvolverá um verdadeiro "gosto", enquanto um adolescente aprende a dirigir em ~10 horas.
• As pontuações de avaliação parecem ótimas, mas o desempenho no mundo real fica atrás porque o treinamento de RL acaba otimizando para as avaliações em si.
• Os verdadeiros hackers de recompensa são os pesquisadores que elaboram esses benchmarks e ciclos de treinamento.
• Ele diz que tem ideias sobre o que está faltando, mas não as compartilhará publicamente.
• ASI, no entanto, dentro de 5-20 anos
"Você sabe o que é louco? Que tudo isso é real"
Eu realmente senti essa frase.

Top
Classificação
Favoritos

