新的编码模型基本上具有无限上下文,经过端到端的强化学习训练。