Мені смішно, що дослідження DeepSeek здебільшого ігнорують. Вони втягнули всю індустрію, кричачи і крики, у світ ефективних MoE і ефективних реальних життєвих відносин, але на цьому все. Чому всі ще не приділяють повної уваги DSA? Чи впроваджуються методи Math-V2? Ні. «Дайте мені ваги для китів»
Ahmad
Ahmad10 січ., 11:53
Будь ласка, кинь цей V4, Скоро Кит
(Звісно, я теж хочу V4)
216