在AI领域下一个基本的解锁将会像注意力机制一样简单明了(而且它可能已经存在)。我怀疑这将是一个使强化学习变得极其高效和有效的变化。有人有喜欢的候选者吗?