Шолто Дуглас (Anthropic): "За последний год RL наконец-то позволил нам взять обратную связь и превратить её в модель, которая по крайней мере так же хороша, как лучшие люди в определённой области в узком домене. И вы видите это в математике и конкурсном программировании, которые являются двумя областями, наиболее подходящими для этого - где модели быстро становятся невероятно компетентными конкурсными математиками и конкурсными программистами. Между конкурсным программированием и математикой нет ничего принципиально отличного. Просто они действительно [более] поддаются RL, чем любая другая область. Но важно, что они демонстрируют, что у моделей нет интеллектуального потолка. Они способны выполнять действительно сложные рассуждения, если есть правильная обратная связь. Поэтому мы считаем, что тот же подход обобщается на все другие области человеческой интеллектуальной деятельности, где, при наличии правильной обратной связи, эти модели станут по крайней мере такими же хорошими, как лучшие люди в определённой области. А затем, когда у вас есть что-то, что по крайней мере так же хорошо, как лучшие люди в определённой области, вы можете просто запустить 1000 из них параллельно или в 100 раз быстрее, и у вас будет что-то, что даже с этим условием существенно умнее любого данного человека. И это полностью игнорирует вопрос о том, возможно ли создать что-то, что умнее человека. Последствия этого довольно поразительны, верно? В следующие 2 или 3 года, при наличии правильных обратных связей, при наличии правильных вычислений и т.д., мы считаем, что мы, как индустрия ИИ в целом, на пути к созданию чего-то, что по крайней мере так же способно, как большинство людей в большинстве задач, связанных с компьютерами, возможно, так же хорошо, как многие из наших лучших учёных в их областях. Это будет остро и резко, будут примеры вещей, которые оно не может [сделать]. Но мир изменится. ... Я думаю, что это стоит кричать с крыш немного - ребята, всё, что мы можем измерить, похоже, действительно быстро улучшается. Куда это нас приведёт через 2 или 3 года? Я не могу сказать с уверенностью. Но я думаю, что это стоит включить в мировоззрение, что есть довольно серьёзный шанс, что мы получим AGI."