Topik trending
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Aaron Levie
CEO @box - lepaskan kekuatan konten Anda dengan AI
AI akan mengaburkan garis antara banyak fungsi dari waktu ke waktu karena Anda sekarang dapat mulai melakukan hal-hal yang lebih tinggi atau lebih rendah dalam tumpukan, atau memperluas ke fungsi lain yang berdekatan. Area yang sangat jelas adalah bahwa PM hampir selalu muncul dengan prototipe fungsional.

Kaz Nejatian19 jam lalu
Kami menambahkan bagian pengkodean ke semua wawancara Manajer Produk kami di @Shopify.
Kita akan mulai dengan wawancara APM. Kami mengharapkan kandidat untuk membangun prototipe produk yang mereka sarankan dalam wawancara kasus.
Tidak ada alasan bagi PM untuk tidak membangun prototipe.
23,59K
Di Box, kami menghabiskan banyak waktu untuk menguji Box AI dengan model baru pada data tidak terstruktur untuk melihat kinerja mereka dengan baik di bidang pengetahuan yang nyata.
Seperti yang telah kita lihat dari tolok ukur, GPT-5 menawarkan lompatan kemampuan yang berarti dibandingkan GPT-4.1 dalam penalaran, matematika, logika, pengkodean, dan bidang pekerjaan lainnya. Berikut adalah beberapa contoh di mana peningkatan tersebut berperan di dunia nyata:
*GPT 5 mengontekstualisasikan informasi dengan lebih baik. Saat melakukan ekstraksi data seperti jumlah USD akhir pada faktur tanpa label mata uang tetapi dengan alamat di London, GPT 5 merespons dengan benar membutuhkan nilai konversi dari USD ke GBP. Sebagai perbandingan, GPT 4.1 melihat tagihan akhir dan mengembalikannya, dengan asumsi mata uang (salah).
* GPT-5 memberikan analisis multimoda yang lebih baik. Untuk pengajuan tahunan perusahaan publik, GPT-5 diminta untuk mengisolasi sel dalam tabel dari gambar yang menunjukkan perubahan komponen ekuitas perusahaan. Bagian atas tabel mengklarifikasi bahwa semua jumlah saham dalam ribuan, dan GPT-5 dengan jelas menyatakan konversi ini, sedangkan GPT-4.1 tidak, menjadi bingung mengingat tabel mengatakan saham dan legenda mengatakan saham.
* GPT-5 berkinerja lebih baik dengan tingkat prompt dan kompleksitas data yang tinggi. Saat melakukan ekstraksi data pada resume untuk semua tanggal mulai pekerjaan, nama posisi pekerjaan, dan nama pemberi kerja, GPT-5 mampu menarik setiap bagian data sementara GPT-4.1 tampaknya kewalahan dan tidak mengekstrak bidang yang sama mengingat ukuran prompt dan kompleksitas dokumen.
* GPT-5 jauh lebih jelas dan eksplisit dalam jawabannya. Dalam perjanjian outsourcing dengan 6 layanan berbeda yang dibahas secara eksplisit, ketika ditanya tentang "5 layanan spesifik dalam kontrak", GPT-5 akan mengembalikan 5 layanan pertama dan menanyakan apakah disengaja bahwa yang keenam tidak ditanyakan. Sebagai perbandingan, GPT-4.1 hanya mengembalikan 5 yang pertama tanpa peringatan lebih lanjut, yang dapat menyebabkan kebingungan hilir bagi pengguna.
* GPT-5 lebih baik dalam interpretasi data di bidang yang kompleks. Untuk bagan sitometri aliran, biasanya digunakan dalam imunologi, GPT-5 dengan benar mengidentifikasi proporsi sel mati yang tinggi dan memberikan akar penyebab yang masuk akal yang dapat menyebabkan situasi sementara GPT-4.1 memberikan alasan minimal, membutuhkan konfirmasi lebih lanjut untuk memiliki tebakan dari data mentah.
* GPT-5 lebih mampu mengidentifikasi inkonsistensi dalam kode. Ketika diminta untuk mengidentifikasi masalah dalam file kode python tertentu, sementara GPT-5 dan 4.1 dapat mengidentifikasi kesalahan nyata yang menyebabkan malfungsi, hanya GPT-5 yang dapat menyimpulkan masalah yang lebih halus, seperti mencetak variabel yang salah ketika itu tidak masuk akal dalam konteks program.
Peningkatan dalam matematika, penalaran, logika, dan kualitas respons dalam jendela konteks yang lebih panjang ini sangat membantu pengguna akhir dalam pekerjaan sehari-hari, tetapi mereka akan muncul lebih banyak lagi dengan agen AI yang berjalan lebih lama, terutama ketika tidak ada manusia dalam lingkaran untuk memverifikasi informasi di setiap langkah.
Sungguh luar biasa melihat peningkatan ini terus datang dalam model AI terbaru karena ini akan mengarah pada agen AI yang dapat digunakan di bidang kerja yang lebih penting secara bertahap.
72,39K
Jelas bahwa kita berada di lintasan saat ini model AI yang terus meningkatkan kemampuan di seluruh matematika, penalaran, logika, pemanggilan alat, dan berbagai tugas khusus domain yang akan menjadi lebih baik karena lebih banyak data pelatihan terus dihasilkan.
Meskipun akan ada perdebatan tentang seberapa banyak kemajuan ini akan muncul sebagai perubahan besar dalam kasus penggunaan sehari-hari yang dimiliki konsumen, mereka *akan* memiliki dampak besar di banyak kategori pekerjaan pengetahuan. Mereka akan secara bertahap membuka kasus penggunaan baru dalam perawatan kesehatan, hukum, layanan keuangan, ilmu kehidupan, dll., di mana model dapat dengan andal melakukan tugas yang lebih penting secara progresif.
Pada podcast baru-baru ini dengan Alex Kantrowitz, Dario Amodei memiliki cara yang bagus untuk membingkai ini, yaitu bahwa jika Anda meningkatkan kemampuan model AI untuk beralih dari memiliki sarjana dalam biokimia menjadi memiliki gelar sarjana dalam biokimia, sebagian kecil populasi konsumen akan melihat dampaknya, tetapi kasus penggunaan perusahaan untuk perusahaan seperti Pfizer akan meningkat secara berarti sebagai akibat dari ini.
Kita harus mulai mengantisipasi bahwa ini adalah era di mana kita berada di AI. Jadi, bagaimana ini mulai muncul di dunia nyata? Ini akan muncul melalui agen AI yang mengejar kasus penggunaan yang diterapkan. Agen AI untuk pengkodean, pekerjaan hukum, juru tulis medis, ekstraksi data, pemrosesan klaim asuransi, pengujian pena, dan sebagainya.
Peluang saat ini adalah membangun agen AI untuk vertikal dan domain dengan pemahaman mendalam tentang ruang itu. Di sinilah dampak rekayasa konteks, pemahaman mendalam tentang alur kerja, koneksi ke data perusahaan, dan antarmuka pengguna khusus (yang memungkinkan pengguna untuk menerapkan, mengelola, dan mengatur agen ini) akan mulai sangat penting.
Ini juga berarti membangun distribusi yang selaras dengan vertikal atau domain tertentu. Ini mungkin berarti beberapa bentuk rekayasa yang diterapkan ke depan untuk tidak hanya membantu pelanggan mengimplementasikan agen, tetapi juga dengan cepat mempelajari alur kerja mana yang dioptimalkan oleh agen dan membawanya kembali ke platform inti.
Pada akhirnya, pasar ini akan dimenangkan oleh pemain yang dapat menjembatani proses perusahaan saat ini (yang seringkali berantakan dan tidak dirancang untuk otomatisasi) ke dunia di mana agen diintegrasikan ke dalam alur kerja ini. Ini adalah era AI yang kita hadapi sekarang.
76,91K
Kami jauh dari titik optimal untuk stabilisasi apa pun dalam kemampuan AI, tetapi ironisnya ada banyak kasus penggunaan komersial untuk AI yang dibekukan karena seberapa cepat kemajuan teknologi. Inilah sebabnya mengapa arsitektur bukti masa depan sangat penting.

Ethan Mollick11 Agu, 18.39
Kapan dan jika pengembangan AI mendatar (dan belum ada indikasi yang terjadi), itu sebenarnya dapat mempercepat integrasi AI ke dalam kehidupan kita, karena kemudian menjadi lebih mudah untuk mengetahui produk & layanan apa yang dibutuhkan untuk melengkapi AI. Saat ini kemampuan berubah terlalu cepat
3,86K
Inti vs. konteks adalah konsep penting untuk dipikirkan saat mencari tahu apa yang akan dibangun kembali orang dengan AI.
Perusahaan membawa fungsi "inti" yang membedakan mereka. Inilah produk atau layanan inti mereka, bagaimana mereka menjual kepada pelanggan, hal-hal yang mendorong budaya mereka, dan sebagainya.
Sebaliknya, mereka mengalihdayakan "konteks" yang merupakan taruhan meja untuk menjadi benar, tetapi hanya menawarkan kelemahan dalam melakukan kesalahan. Aturan praktis yang mudah untuk dipikirkan adalah apakah pelanggan akan memperhatikan apakah perusahaan melakukan fungsi itu sendiri atau tidak.
Perangkat lunak perusahaan hampir selalu "konteks". Ini adalah area seperti CRM atau sistem SDM, infrastruktur, manajemen data, dan sebagainya. Ini diperlukan untuk mengoperasikan bisnis dalam skala besar, tetapi jarang Anda diuntungkan dalam mencoba menggulung bisnis Anda sendiri. Hanya ada beberapa pengecualian, dan hampir selalu karena Anda memerlukan solusi untuk melayani "inti" Anda yang tidak ditawarkan vendor (seperti jika Anda memerlukan perangkat lunak khusus untuk rantai pasokan yang terintegrasi secara vertikal).
Tidak peduli bagaimana perusahaan memulai, mereka akhirnya hampir selalu memisahkan pekerjaan dan nilai antara inti vs. konteks dari waktu ke waktu. Ini satu-satunya cara mereka dapat tetap kompetitif dan akhirnya mengalokasikan sumber daya ke area yang optimal.
Jadi bahkan jika sebuah perusahaan *bisa* menulis ulang perangkat lunak perusahaan mereka dengan AI, pada dasarnya mereka tidak akan melakukannya. Pembaruan versi, keamanan, fitur peraturan, bug, SLA, layanan profesional yang diperlukan, dll. semuanya akan membuatnya negatif ROI.
Seperti yang ditunjukkan oleh bucco, risiko sebenarnya adalah versi yang lebih baik dari alat ini yang mengutamakan AI. Itulah yang harus diwaspadai dari sudut pandang gangguan.


BuccoCapital Bloke10 Agu, 01.04
Saya pikir risiko bahwa perusahaan membangun sistem pencatatan mereka sendiri - ERP, ITSM, CRM dll - sangat rendah
Perusahaan tidak bodoh. Mereka tidak memiliki kompetensi di sini, taruhannya sangat tinggi, dan terlepas dari seberapa mudahnya, mereka masih harus memelihara dan mengoptimalkannya, yang, pada akhirnya, merupakan gangguan dari bisnis mereka yang sebenarnya. Alasan yang sama AWS, Azure, dan GCP adalah bisnis yang luar biasa
Saya benar-benar berpikir orang-orang yang percaya ini tidak pernah bekerja dalam bisnis nyata atau hanya tinggal di spreadsheet tanpa memahami bagaimana perangkat lunak perusahaan dibeli dan dijual
Namun, saya pikir risiko penyedia SaaS lama dikalahkan oleh pesaing asli AI dari bawah jauh lebih tinggi
Figma makan siang Adobe karena kolaborasi berasal dari cloud dan Adobe tidak dapat beradaptasi. Itulah jenis risiko yang harus menjaga sistem catatan lama ini tetap terjaga di malam hari, bukan orang yang mengkodekan penggantinya.
195,76K
Benang yang bagus. Apa pun yang mampu dilakukan oleh agen AI, itu juga bisa ditipu untuk dilakukan. Anda harus berasumsi jika agen dapat mengakses data, pengguna pada akhirnya dapat mendapatkan data tersebut juga. Keamanan agen, kontrol akses, dan pagar pembatas deterministik akan sangat penting.

mbg8 Agu, 21.49
Kami membajak agen studio copilot Microsoft dan membuat mereka menumpahkan pengetahuan pribadi mereka, mengungkapkan alat mereka dan membiarkan kami menggunakannya untuk membuang rekaman CRM penuh
ini adalah agen otonom.. Tidak ada manusia dalam lingkaran
#DEFCON #BHUSA @tamirishaysh

90,69K
Banyak percakapan tentang seperti apa masa depan perangkat lunak di perusahaan. Inilah yang menurut saya berjalan.
Untuk alur kerja deterministik di mana biaya untuk melakukan kesalahan tinggi, perusahaan akan memiliki kecenderungan untuk memilih platform inti untuk fungsi mereka yang paling umum, penting, dan dapat diulang dalam organisasi. Pikirkan penggajian, ERP, CRM, ITSM, dukungan pelanggan, manajemen ECM/dokumen, dan sebagainya. Ini adalah area di mana Anda ingin sesuatu dilakukan dengan cara yang sama, setiap saat.
Masing-masing platform ini harus mengutamakan AI secara desain, yang berarti bahwa mereka akan memiliki antarmuka pengguna yang disetel untuk berinteraksi dengan alur kerja dan data melalui AI, dan sepenuhnya dirancang untuk agen AI untuk beroperasi di platform. Seiring waktu, kita dapat mengharapkan penggunaan pada sistem ini jauh lebih bias pada agen AI daripada orang-orang. Model kursi tetap untuk pengguna, tetapi konsumsi menjadi model untuk agen. Beberapa petahana akan berhasil mencapai keadaan akhir, tetapi yang lain tidak akan beradaptasi dengan cukup cepat dan mati.
Kemudian akan ada tanaman baru dari perusahaan khusus Agen yang efektif yang dibangun khusus untuk mengotomatiskan jenis pekerjaan tertentu (dan terutama untuk pekerjaan non-deterministik). Model bisnis mereka akan memiringkan lebih banyak konsumsi. Pikirkan Claude Code atau Devins (kemungkinan dengan beberapa lapisan UI untuk mengelola agen) tetapi untuk berbagai fungsi pekerjaan. Kita kemungkinan akan melihat ratusan atau ribuan ini muncul dari waktu ke waktu. Pengujian pena, pengkodean, penemuan bug, tinjauan kepatuhan, analis keuangan, dan sebagainya. Ini adalah ruang besar di mana startup akan melakukannya dengan cukup baik karena akan cenderung tidak ada petahana perangkat lunak dalam kategori ini.
Kami akan berinteraksi dengan berbagai agen ini dari campuran platform perangkat lunak yang terkait dengannya (seperti Box AI, atau Agentforce), melalui API di sistem lain, dan sistem alur kerja horizontal yang menyatukan agen di seluruh platform (seperti ServiceNow, IBM Watsonx, Google Agentspace, dan sebagainya).
Dan tentu saja, pengguna akan sering mengonsumsi agen ini melalui pengalaman obrolan horizontal (seperti ChatGPT, Claude, Perplexity, Grok, Copilot, dll.) melalui MCP atau jenis koneksi langsung lainnya. Pengguna biasanya akan bekerja dalam sistem obrolan horizontal ini, menarik agen, data, dan alur kerja dari berbagai platform Agentic sesuai kebutuhan. Jika relevan, l mereka akan melompat ke platform inti untuk menyelesaikan alur kerja, meninjau informasi, dll.
Juga akan ada pengalaman ekor panjang di mana pengguna dapat menghasilkan aplikasi mikro dengan cepat ketika mereka membutuhkan aplikasi cepat atau kasus penggunaan otomatis, ketika tidak ada perangkat lunak yang jelas untuk melakukannya. Ini dapat terjadi langsung di sistem obrolan horizontal, alat seperti Replit, Lovable, atau di alat otomatisasi alur kerja, dll. Saya berharap ini lebih untuk pengguna yang kuat di mana mereka membutuhkan lem di antara beberapa sistem atau di mana belum ada perangkat lunak.
Jaringnya adalah bahwa perangkat lunak menjadi lebih penting dari waktu ke waktu, bahkan jika modalitas di mana kita berinteraksi dari berubah dan berkembang. Mirip dengan cara kita melompat antara ponsel dan komputer desktop dengan mudah, meskipun mereka dapat dengan mudah bertemu, masa depan akan menawarkan campuran cara berinteraksi dengan perangkat lunak.
127,33K
Meskipun menarik, gagasan AI menghasilkan setiap UI dengan cepat mungkin lebih kecil dari yang dipikirkan orang. Manfaat penyesuaian hiper kemungkinan tidak akan lebih besar daripada keharusan mempelajari kembali aplikasi setiap kali Anda menggunakannya atau risiko hal-hal rusak dengan cara yang tidak terduga.

Ben South9 Agu, 01.59
Siapa pun yang telah mengalami desain ulang besar-besaran tahu bahwa menghasilkan UI dengan cepat tidak akan menjadi sesuatu untuk sebagian besar produk
110,66K
Pembagian kerja Agen AI akan sangat penting untuk memaksimalkan dampak agen.
Kami telah lama memiliki pembagian kerja dalam organisasi karena memiliki ahli individu yang saling membagikan tugas lebih efektif daripada sekelompok generalis yang mencoba melakukan sesuatu dengan cara yang berbeda setiap saat. Agen AI menghadirkan dinamika yang sama.
Agar Agen AI berfungsi, Anda memerlukan jumlah konteks yang tepat tentang tugas yang mereka coba selesaikan. Ini berarti pemahaman domain yang mendalam, seperangkat pengetahuan untuk dikerjakan, instruksi yang jelas, dan seperangkat alat untuk digunakan. Konteks terlalu sedikit dan agen akan gagal. Namun, sama halnya, karena lebih banyak informasi ini memasuki jendela konteks, kita tahu bahwa model dapat menjadi tidak optimal.
Untuk proses bisnis yang kompleks, jika Anda memasukkan semua dokumentasi, deskripsi alur kerja, dan instruksi ke dalam jendela konteks, kami tahu bahwa ini pada akhirnya dapat menyebabkan pembusukan konteks, yang mengarah pada hasil yang lebih buruk.
Arsitektur logis di masa depan adalah membagi agen dalam satuan atom yang memetakan ke jenis tugas yang tepat dan kemudian membuat agen-agen ini bekerja sama untuk menyelesaikan pekerjaan mereka.
Kami sudah melihat ini dimainkan secara efektif dalam agen pengkodean. Ada semakin banyak contoh yang muncul dengan orang-orang yang menyiapkan subagen yang semuanya memiliki bagian tertentu dari basis kode atau area layanan. Setiap agen bertanggung jawab atas sebagian kode, dan ada dokumentasi yang ramah agen untuk kode tersebut. Kemudian karena pekerjaan diperlukan di area basis kode yang relevan, agen orkestrator berkoordinasi dengan subagen ini.
Kita dapat melihat pola ini kemungkinan berlaku untuk hampir semua bidang pekerjaan pengetahuan di masa depan. Ini akan memungkinkan Agen AI digunakan untuk lebih dari sekadar kasus penggunaan khusus tugas dan meluas untuk mendukung seluruh alur kerja di perusahaan.
Bahkan ketika model AI meningkat untuk dapat menangani jendela konteks yang lebih besar, dan tingkat kecerdasan meningkat, tidak jelas bahwa arsitektur ini pernah hilang. Kemungkinan peran masing-masing agen berkembang seiring dengan peningkatan kemampuan, tetapi garis pemisahan yang jelas antara subagen selalu dapat menghasilkan hasil yang lebih baik.
73,71K
Awalnya pemikirannya adalah bahwa agen AI tunggal akan menangani alur kerja besar secara sewenang-wenang. Sebaliknya, pola yang tampaknya berhasil adalah menyebarkan subagen yang memiliki spesialisasi berdasarkan tugas untuk menghindari pembusukan konteks. Pembagian kerja agen AI mungkin masa depan.

martin_casado5 Agu, 10.02
.@levie membuat pengamatan yang bagus.
Penggunaan agen akan bertentangan dengan narasi AGI yang sederhana tentang agen yang lebih sedikit dan kuat dengan tugas tingkat yang semakin tinggi.
Sebaliknya, kami cenderung ke lebih banyak agen yang diberikan tugas yang terjangkau dengan sempit, terdefinisi dengan baik, dan sempit. Umumnya oleh para profesional.
67,27K
Teratas
Peringkat
Favorit
Trending onchain
Trending di X
Pendanaan teratas terbaru
Paling terkenal