Zo ongelooflijk goed dat DeepSeek de beste paper won op ACL met NSA, en vervolgens, lijkt het, ontevreden was met de resultaten op schaal, een betere architectuur heeft bedacht die volledige aandachtmodellen kan gebruiken, dat gepubliceerd heeft en gewichten heeft gedeeld. We vermoeden vaak dat Google het tegenovergestelde doet.