🚨L'équipe de DeepSeek a trouvé un contexte long bon marché pour les LLMs : un pré-remplissage ~3,5x moins cher et un décodage ~10x moins cher à 128k de contexte lors de l'inférence avec la même qualité. On ne peut s'empêcher d'aimer le seul laboratoire d'IA à la pointe qui publie un modèle ouvert et de grandes recherches ouvertes !
Rapport technique :
31,6K