🚨A equipe do DeepSeek quebrou o contexto longo barato para LLMs: um pré-preenchimento ~ 3,5x mais barato e uma decodificação ~ 10x mais barata em contexto de 128k em inferência com a mesma qualidade. Não posso deixar de amar o único laboratório de IA de fronteira que publica um modelo aberto e uma ótima pesquisa aberta!
Relatório técnico:
31,6K