Tópicos populares
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Se eu fosse a a16z, yc ou sequoia, estaria a investir agressivamente em startups que estão a criar formas inovadoras de coletar e anotar dados do mundo real.
> Bilhões de horas de dados de condução
> Trabalhadores de fábricas interagindo com eletrodomésticos e maquinário pesado
> Segmentação de áudio com compreensão profunda de dialetos e culturas
> Dados experimentais de laboratório úmido
> Coleta e anotação contínuas de rastros de agentes em escala computacional
Quando construímos LLMs, a maior parte dos dados já existia na internet. Apenas tivemos que raspar, limpar e escalar. Mas à medida que avançamos em direção a modelos de fundação mundial, o gargalo é dados de alta qualidade, do mundo real, bem anotados.
E a qualidade da anotação importa. Há uma diferença enorme entre:
"Maçã em uma árvore"
e
"Maçãs maduras em uma árvore. O vento está soprando a 2 milhas por hora. A temperatura está em torno de 18°C."
A questão é simples. Quanto do mundo você consegue realmente capturar?
Hoje, os LLMs sabem que as maçãs caem por causa da gravidade, não porque entendem causalidade, mas porque entendem correlações linguísticas extremamente bem. Compreender a estrutura causal vem a seguir.
Se eu estivesse a construir esse futuro, ancoraria a coleta de dados na Índia e em outras regiões do Sul e Sudeste Asiático. Implantaria hardware, coletaria milhares de horas de dados de atividade humana, sinais de saúde e vitais, e executaria pipelines de anotação continuamente. Dia e noite.
Se eu fosse a a16z, financiaria fundadores para fazer isso.
Talvez eu apenas tivesse a vontade de fazê-lo eu mesmo.
Top
Classificação
Favoritos
