Актуальные темы
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Aaron Levie
CEO @box — раскройте потенциал своего контента с помощью искусственного интеллекта
Искусственный интеллект со временем размывает границы между многими функциями, потому что теперь вы можете начинать выполнять задачи как на более высоком, так и на более низком уровне, или расширяться на другие смежные функции. Очень очевидная область заключается в том, что менеджеры проектов почти всегда должны представлять функциональные прототипы.

Kaz Nejatian19 часов назад
Мы добавляем раздел по программированию во все наши собеседования с менеджерами по продукту в @Shopify.
Мы начнем с собеседований для APM. Мы ожидаем, что кандидаты создадут прототип продукта, который они предложили на собеседовании по делу.
У менеджеров по продукту нет оправдания, чтобы не создавать прототипы.
23,59K
В Box мы тратим много времени на тестирование Box AI с новыми моделями на неструктурированных данных, чтобы увидеть, как они работают в реальных областях знаний.
Как мы видели по результатам тестов, GPT-5 предлагает значительный скачок в возможностях по сравнению с GPT-4.1 в области рассуждений, математики, логики, программирования и других областях работы. Вот несколько примеров того, как эти улучшения проявляются в реальном мире:
*GPT-5 лучше контекстуализирует информацию. При извлечении данных, таких как окончательная сумма в долларах США в счете без обозначений валюты, но с адресом в Лондоне, GPT-5 правильно отвечает, что необходим курс конверсии из USD в GBP. В сравнении, GPT-4.1 увидел окончательный счет и вернул его, предполагая валюту (неправильно).
* GPT-5 обеспечивает лучшую мультимодальную аналитику. Для годового отчета публичной компании GPT-5 был задан вопрос о выделении ячейки в таблице из изображения, показывающего изменения в компонентах капитала компании. В верхней части таблицы уточняется, что все суммы акций указаны в тысячах, и GPT-5 четко указывает на эту конверсию, в то время как GPT-4.1 этого не делает, запутываясь, поскольку в таблице указаны акции, а в легенде — доли.
* GPT-5 лучше справляется с высокими уровнями сложности запросов и данных. При извлечении данных из резюме о всех датах начала работы, названиях должностей и именах работодателей, GPT-5 смог извлечь каждую часть данных, в то время как GPT-4.1, похоже, был перегружен и не извлек те же поля из-за размера запроса и сложности документа.
* GPT-5 гораздо яснее и конкретнее отвечает на вопросы. В соглашении о аутсорсинге с 6 различными услугами, которые были явно обсуждены, когда его спрашивают о "5 конкретных услугах в контракте", GPT-5 вернет первые 5 и спросит, было ли намеренно, что шестая не была упомянута. В сравнении, GPT-4.1 просто вернул первые 5 без каких-либо дополнительных оговорок, что может привести к путанице для пользователя.
* GPT-5 лучше интерпретирует данные в сложных областях. Для графика поточной цитометрии, обычно используемого в иммунологии, GPT-5 правильно определил высокую долю мертвых клеток и предложил правдоподобные коренные причины, которые могут привести к этой ситуации, в то время как GPT-4.1 дал минимальные обоснования, нуждаясь в дальнейшей проверке, чтобы сделать какие-либо предположения на основе сырых данных.
* GPT-5 лучше выявляет несоответствия в коде. Когда его просят выявить проблемы в данном файле кода на Python, хотя и GPT-5, и GPT-4.1 могут выявить реальные ошибки, которые приводят к сбоям, только GPT-5 смог выявить более тонкие проблемы, такие как печать неправильной переменной, когда это не имело бы смысла в контексте программы.
Эти улучшения в математике, рассуждениях, логике и качестве ответов в более длинных контекстных окнах невероятно полезны для конечных пользователей в повседневной работе, но они проявятся еще больше с более длительными работающими AI-агентами, особенно когда нет человека в процессе, чтобы проверять информацию на каждом этапе.
Здорово видеть, как эти улучшения продолжают поступать в последней партии AI-моделей, так как это приведет к AI-агентам, которые смогут использоваться в постепенно более критически важных областях работы.
72,38K
Ясно, что мы находимся на траектории, где модели ИИ продолжают улучшаться в своих возможностях в области математики, логики, рассуждений, вызова инструментов и различных специфических задач, которые будут улучшаться по мере генерации большего объема обучающих данных.
Хотя будут дебаты о том, насколько эти достижения проявятся в виде значительных изменений в повседневных случаях использования, с которыми сталкивается потребитель, они *будут* иметь значительное влияние на многие категории знаний. Они постепенно откроют новые случаи использования в здравоохранении, юриспруденции, финансовых услугах, биологических науках и т.д., где модели могут надежно выполнять все более критические задачи.
На недавнем подкасте с Алексом Кантровицем Дарио Амодеи хорошо сформулировал это, сказав, что если вы улучшите возможности модели ИИ, чтобы она перешла от бакалавриата в биохимии к магистратуре в биохимии, небольшая часть потребительского населения заметит это влияние, но случаи использования для компании, такой как Pfizer, значительно увеличатся в результате этого.
Мы должны начать ожидать, что это теперь эпоха, в которой мы находимся с ИИ. Итак, как это начнет проявляться в реальном мире? Это проявится через ИИ-агентов, работающих над прикладными случаями использования. ИИ-агенты для программирования, юридической работы, медицинских писцов, извлечения данных, обработки страховых претензий, тестирования на проникновение и так далее.
Возможность сейчас заключается в создании ИИ-агентов для вертикалей и областей с глубоким пониманием этой сферы. Здесь начнет иметь значение влияние контекстного проектирования, глубокое понимание рабочих процессов, связи с корпоративными данными и специализированные пользовательские интерфейсы (которые позволяют пользователям развертывать, управлять и оркестровать этих агентов).
Это также будет означать создание распределения, которое соответствует этой конкретной вертикали или области. Это, вероятно, будет означать какую-то форму инженерии, развернутой вперед, чтобы не только помочь клиентам внедрить агентов, но и быстро узнать, для каких рабочих процессов агенты оптимизированы, и вернуть эту информацию в основную платформу.
В конечном итоге эти рынки будут выиграны игроками, которые смогут лучше всего связать сегодняшние корпоративные процессы (которые часто запутанные и не были разработаны для автоматизации) с миром, где агенты интегрированы в эти рабочие процессы. Это эпоха ИИ, в которой мы сейчас находимся.
76,9K
Мы еще далеко от оптимальной точки для любой стабилизации возможностей ИИ, но иронично, что существует множество коммерческих случаев использования ИИ, которые просто замораживаются из-за того, как быстро развиваются технологии. Вот почему архитектуры, защищенные от будущего, имеют такое большое значение.

Ethan Mollick11 авг., 18:39
Когда и если развитие ИИ достигнет плато (а пока нет никаких признаков этого), это может на самом деле ускорить интеграцию ИИ в нашу жизнь, потому что тогда станет легче понять, какие продукты и услуги нужны для дополнения ИИ. В настоящее время возможности меняются слишком быстро.
3,86K
Концепция «ядро против контекста» является критически важной для понимания того, с чем люди будут перестраиваться с помощью ИИ.
Компании внедряют «ядро» функций, которые отличают их. Это то, что является их основным продуктом или услугой, как они продают клиентам, вещи, которые формируют их культуру и так далее.
Напротив, они аутсорсят «контекст», который является необходимым для правильного выполнения, но только приносит убытки, если сделать неправильно. Простое правило, чтобы понять это: заметит ли клиент, если компания выполнит эту функцию самостоятельно или нет.
Корпоративное программное обеспечение почти всегда является «контекстом». Это такие области, как их CRM или HR-системы, инфраструктура, управление данными и так далее. Эти вещи необходимы для работы бизнеса в большом масштабе, но редко вы получаете преимущество, пытаясь создать свое собственное. Существуют лишь несколько исключений, и это почти всегда связано с тем, что вам нужно решение для обслуживания вашего «ядра», которое не предлагает ни один поставщик (например, если вам нужно индивидуальное программное обеспечение для вертикально интегрированной цепочки поставок).
Независимо от того, как компания начинает, со временем они почти всегда разделяют работу и ценность между ядром и контекстом. Это единственный способ оставаться конкурентоспособным и в конечном итоге выделять ресурсы на оптимальные области.
Так что даже если компания *может* переписать свое корпоративное программное обеспечение с помощью ИИ, они, по сути, просто не будут этого делать. Обновления версий, безопасность, регуляторные функции, ошибки, SLA, необходимые профессиональные услуги и т. д. просто сделают это отрицательным с точки зрения ROI.
Как указывает bucco, реальный риск заключается в лучших версиях этих инструментов, которые ориентированы на ИИ. Это то, на что стоит обратить внимание с точки зрения разрушения.


BuccoCapital Bloke10 авг., 01:04
Я думаю, что риск того, что компании создадут свои собственные системы учета - ERP, ITSM, CRM и т.д. - невероятно низок.
Компании не глупы. У них нет компетенции в этом, ставки крайне высоки, и независимо от того, насколько это легко, им все равно придется поддерживать и оптимизировать это, что, в конечном итоге, отвлекает от их основного бизнеса. По той же причине AWS, Azure и GCP являются такими невероятными бизнесами.
Я искренне думаю, что люди, которые в это верят, либо никогда не работали в реальном бизнесе, либо просто живут в таблицах и не понимают, как покупается и продается корпоративное программное обеспечение.
Тем не менее, я считаю, что риск того, что устаревшие SaaS-поставщики будут побеждены AI-нативными конкурентами снизу, гораздо выше.
Figma «съела» обед Adobe, потому что сотрудничество было нативным для облака, а Adobe не смогла адаптироваться. Вот такой риск должен держать эти устаревшие системы учета в напряжении, а не люди, которые создают замену по настроению.
195,76K
Отличная тема. Что бы ни мог сделать агент ИИ, его также можно обмануть. Вы должны предполагать, что если агент может получить доступ к данным, то пользователь в конечном итоге тоже сможет получить эти данные. Безопасность агентов, контроль доступа и детерминированные защитные меры будут критически важны.

mbg8 авг., 21:49
мы захватили агенты студии Copilot от Microsoft и заставили их раскрыть свои секретные знания, показать свои инструменты и позволить нам использовать их для выгрузки полных записей CRM
это автономные агенты.. без человека в процессе
#DEFCON #BHUSA @tamirishaysh

90,68K
Много разговоров о том, как будет выглядеть будущее программного обеспечения в корпоративном секторе. Вот как я думаю, это будет развиваться.
Для детерминированных рабочих процессов, где цена ошибки высока, предприятия будут склонны выбирать основные платформы для своих самых распространенных, важных и повторяемых функций в организации. Подумайте о зарплате, ERP, CRM, ITSM, поддержке клиентов, ECM/управлении документами и так далее. Это те области, где вы хотите, чтобы все выполнялось одинаково, каждый раз.
Каждая из этих платформ должна быть изначально ориентирована на ИИ, что означает, что у них будут пользовательские интерфейсы, настроенные для взаимодействия с рабочими процессами и данными через ИИ, и они будут полностью спроектированы для работы ИИ-агентов на этих платформах. Со временем мы можем ожидать, что использование этих систем будет значительно смещено в сторону ИИ-агентов, а не людей. Модель мест остается для пользователей, но потребление становится моделью для агентов. Некоторые действующие компании дойдут до конечного состояния, но другие не адаптируются достаточно быстро и исчезнут.
Затем появится новая волна компаний, ориентированных исключительно на агентов, которые будут специально созданы для автоматизации определенных типов работы (особенно для недетерминированной работы). Их бизнес-модели будут еще больше смещены в сторону потребления. Подумайте о Claude Code или Devins (вероятно, с некоторым пользовательским интерфейсом для управления агентами), но для различных функций работы. Мы, вероятно, увидим сотни или тысячи таких компаний, которые появятся со временем. Тестирование на проникновение, кодирование, поиск ошибок, проверки на соответствие, финансовые аналитики и так далее. Это огромная область, где стартапы будут чувствовать себя довольно хорошо, потому что в этих категориях, как правило, нет действующих программных компаний.
Мы будем взаимодействовать с этими различными агентами через смесь программных платформ, к которым они привязаны (таких как Box AI или Agentforce), через API в других системах и горизонтальные системы рабочих процессов, которые объединяют агентов на разных платформах (таких как ServiceNow, IBM Watsonx, Google Agentspace и так далее).
И, конечно, пользователи часто будут использовать этих агентов через горизонтальные чаты (такие как ChatGPT, Claude, Perplexity, Grok, Copilot и т. д.) через MCP или другие типы прямых соединений. Пользователи обычно работают в этих горизонтальных чат-системах, подтягивая агентов, данные и рабочие процессы из различных Агентских платформ по мере необходимости. Когда это уместно, они будут переходить на основные платформы для завершения рабочих процессов, просмотра информации и т. д.
Также будет длинный ряд возможностей, где пользователи смогут создавать микро-приложения на лету, когда им нужны быстрые приложения или автоматизированные случаи использования, когда нет очевидного программного обеспечения для этого. Это может происходить непосредственно в горизонтальных чат-системах, в таких инструментах, как Replit, Lovable, или в инструментах автоматизации рабочих процессов и т. д. Я бы ожидал, что это больше для продвинутых пользователей, которым нужно соединение между несколькими системами или где еще не существует программного обеспечения.
В итоге программное обеспечение становится все более важным со временем, даже если способы взаимодействия с ним меняются и расширяются. Похожим образом, как мы легко переключаемся между нашими телефонами и настольными компьютерами, даже если они могут легко конвергировать, будущее предложит смесь способов взаимодействия с программным обеспечением.
127,32K
Хотя идея о том, что ИИ будет генерировать каждый интерфейс пользователя на лету, fascinирует, она, вероятно, менее вероятна, чем думают люди. Преимущества гиперкастомизации, вероятно, не перевесят необходимость заново учить приложение каждый раз, когда вы его используете, или риски неожиданных сбоев.

Ben South9 авг., 01:59
Каждый, кто пережил крупный редизайн, знает, что генерация пользовательского интерфейса на лету не станет нормой для большинства продуктов.
110,66K
Разделение труда в агентстве ИИ будет критически важным для максимизации влияния агентов.
Мы давно имеем разделение труда в организациях, потому что наличие отдельных экспертов, передающих задачи друг другу, более эффективно, чем группа универсалов, пытающихся делать все по-разному каждый раз. Агенты ИИ представляют ту же динамику.
Чтобы агенты ИИ работали, вам нужно ровно столько контекста о задаче, которую они пытаются выполнить. Это означает глубокое понимание области, набор знаний, на основе которых можно работать, четкие инструкции и набор инструментов для использования. Слишком мало контекста, и агент потерпит неудачу. Однако, равно как и при увеличении объема этой информации в окне контекста, мы знаем, что модели могут стать субоптимальными.
Для сложного бизнес-процесса, если вы поместите всю документацию, описание рабочего процесса и инструкции в окно контекста, мы знаем, что это в конечном итоге может привести к «гниению контекста», что приведет к худшим результатам.
Логическая архитектура в будущем заключается в том, чтобы разделить агентов на атомные единицы, которые соответствуют правильным типам задач, а затем заставить этих агентов работать вместе для завершения своей работы.
Мы уже видим, как это эффективно реализуется в кодирующих агентах. Появляется все больше примеров, когда люди создают подсистемы, которые отвечают за конкретные части кодовой базы или области обслуживания. Каждый агент отвечает за часть кода, и для кода существует документация, удобная для агентов. Затем, когда работа необходима в соответствующей области кодовой базы, агент-оркестратор координирует действия с этими подсистемами.
Мы можем увидеть, что этот шаблон, вероятно, будет применяться почти в любой области знаний в будущем. Это позволит агентам ИИ использоваться не только для конкретных задач, но и для управления целыми рабочими процессами в компании.
Даже по мере улучшения моделей ИИ, которые смогут обрабатывать более крупные окна контекста, и повышения уровня интеллекта, не очевидно, что эта архитектура когда-либо исчезнет. Вероятно, роль каждого агента расширится по мере улучшения возможностей, но четкие границы разделения между подсистемами могут всегда приводить к лучшим результатам.
73,71K
Изначально предполагалось, что один AI-агент будет справляться с произвольно большими рабочими процессами. Вместо этого, похоже, что работающий подход заключается в развертывании субагентов, которые специализируются по задачам, чтобы избежать потери контекста. Разделение труда AI-агентов может стать будущим.

martin_casado5 авг., 10:02
.@levie сделал отличное наблюдение.
Использование агентов противоречит упрощенной нарративе AGI о меньшем количестве мощных агентов с задачами все более высокого уровня.
Скорее, мы движемся к большему количеству агентов с узко определенными, четко сформулированными и узкими задачами. Обычно это делают профессионалы.
67,27K
Топ
Рейтинг
Избранное
В тренде ончейн
В тренде в Х
Самые инвестируемые
Наиболее известные