在大型语言模型出现之前,竟然没有广泛猜测高维向量编码概念,而它们相对位置的几何形状则普遍编码意义,这真是奇怪。 你会认为这应该是一个被广泛认为有30%概率的候选假设。
@johnmark_taylor 任何在2014年认为“深度学习会成功”的人可以说是对的。我只是没有听到这个更简单、更大胆的深度学习核心观点在讨论中获得广泛的可信度。
24.89K