Ontem, @grass e @inference_net lançaram um modelo de anotação de vídeo 12B que é 15x mais barato que os modelos fechados e excede ou iguala o desempenho do GPT-4.1 e Claude 4 Sonnet Muito louco, especialmente porque foi treinado em 1 milhão de quadros de vídeo da rede de Grass. Também estou muito animado para ver a produção da rede. Imagine como esses modelos podem se tornar bons à medida que o Grass/Inference continua a trabalhar em conjunto e o Grass raspa todo o estado avançado da internet para treinar modelos. Imaginar🌱
Inference
Inference15 de ago., 02:02
Apresentando o ClipTagger-12b. Um modelo de anotação de vídeo de última geração treinado em colaboração com @grass. O ClipTagger-12b oferece recursos de anotação de vídeo no mesmo nível do Claude 4 e GPT-4.1 a um custo 17x menor. Saiba Mais:
5,6K