Trovo divertente come la ricerca di DeepSeek venga per lo più ignorata. Hanno trascinato l'industria, scalciando e urlando, nel mondo degli MoE efficienti e del RL efficiente, ma questo è tutto. Perché non ci sono ancora tutte le attenzioni complete sugli Instructs DSA? I metodi Math-V2 sono stati adottati? No. «Dammi i pesi delle balene»
Ahmad
Ahmad10 gen, 11:53
per favore rilascia presto quel v4 balena
(Certo che voglio anche V4)
150