🚨DeepSeek团队破解了LLMs的廉价长上下文:在推理时,128k上下文的预填充成本降低了~3.5倍,解码成本降低了~10倍,同时保持相同的质量。 无法不爱这个唯一发布开放模型和优秀开放研究的前沿AI实验室!
技术报告:
31.59K