Магазин DApp | Web3-центр мероприятий и игр

Актуальные темы

Хорошо, похоже, это уже было упомянуто в примечаниях к релизу (я проверил), так что... (замечание: тестирование моделей — часть моей работы, и этот пост не спонсируется OpenAI никаким образом): Меня пригласили на альфа-тестирование GPT-5.1 Pro вместе с экспертами в области робототехники, математики, иммунологии, медицины, музыки и многого другого. Мой фокус был на коммерческом исследовании и стратегии в области жизненных наук, а также на некоторых личных случаях использования. Используя GPT-5.1 Pro в течение нескольких дней, я нахожу его более похожим на человеческого эксперта в своей области, чем GPT-5 Pro, с более ясным письмом, лучшим суждением, меньшим количеством отклонений, более сильным синтезом и более эмоционально осознанными ответами. Я сравнил GPT-5.1 Pro с GPT-5 Pro в рабочих задачах, таких как синтез научной литературы, планирование запуска лекарств и анализ социальных медиа. Я также пробовал его для личного финансового планирования и даже ведения дневника. Это было: - Более строгим и комплексным в исследовании и планировании. - Более сильным в рассуждениях. - Лучше в том, чтобы оставаться на курсе и избегать отклонений (и, по крайней мере, в одном случае, связанных с этим ошибок). - Намного более ясным, уверенным, более эмпатичным в своем стиле общения. Зная о фокусе OpenAI на реальной производительности (например, GDPval) и о сообщениях о том, что они нанимают экспертов в таких областях, как финансы, я думаю, что человеческая экспертиза в области — это именно то, к чему они стремятся, и с GPT-5.1 Pro они становятся ближе к этому. Сказав это, он не лучше во всем. Он все еще плохо справляется с созданием профессиональных презентаций и таблиц Excel, что является заметной слабостью моделей OpenAI, над исправлением которой, я уверен, они работают. И я видел, что, по крайней мере, один тестировщик обнаружил, что модель осторожно избегала решения известных открытых проблем в STEM-доменах, предпочитая объяснять, почему они являются открытыми проблемами. В целом, если бы мне пришлось количественно оценить это, я бы сказал, что это на 10-15% лучше, чем GPT-5 Pro для тех задач, для которых я его использую. Это ощущается как шаг к моделям, которые думают и общаются более как настоящие коллеги, с лучшей экспертизой в области, интуицией и суждением, а также с увеличенной эмпатией и коммуникативными навыками. Это предвещает хорошие перспективы для ИИ, который будет выполнять еще более значимую работу в 2026 году.

Топ

Рейтинг

Избранное