Atât de incredibil de bazat încât DeepSeek a câștigat premiul pentru cel mai bun articol la ACL cu NSA, apoi, se pare, a fost nemulțumit de rezultatele la scară largă, a descoperit o arhitectură mai bună care să poată folosi modele de atenție completă, a publicat asta și a împărțit greutățile. Adesea bănuim că Google face opusul