So unglaublich gut, dass DeepSeek den besten Beitrag bei ACL mit NSA gewonnen hat, dann schien es, als wäre man mit den Ergebnissen im großen Maßstab unzufrieden, hat eine bessere Architektur herausgefunden, die vollständige Aufmerksamkeitsmodelle nutzen kann, hat das veröffentlicht und die Gewichte geteilt. Wir vermuten oft, dass Google das Gegenteil tut.