DApp Store | Pusat Web3 untuk Event & Game

Topik trending

Mari kita lihat kisah kelahiran Claude Code, terutama bersumber dari wawancara dengan blogger teknologi Gergely Orosz tentang anggota inti Claude Code. Claude Code benar-benar luar biasa, dengan pendapatan tahunan sebesar $500 juta dan peningkatan volume pengguna 10 kali lipat dalam tiga bulan, dan sekarang menjadi alat Agen Pengkodean yang disukai oleh banyak pemrogram. Alat ini dimulai sebagai mainan baris perintah kecil yang memberi tahu Anda "lagu apa yang Anda dengarkan sekarang." 🧵

Gergely Orosz mewawancarai tiga anggota inti Claude Code: • Boris Cherny, Insinyur Pendiri (pengalaman 17 tahun, mantan Kepala Insinyur Meta) • Insinyur 2 Sid Bidasaria (penulis fitur Subagen) • dan Cat Wu, Manajer Produk. Mereka berbicara tentang bagaimana Claude Code beralih dari prototipe ke produk, pilihan teknis apa yang mereka buat, dan bagaimana tim kecil yang terdiri dari selusin orang mampu menerbitkan 5 PR per hari. Ini mungkin sampel terdekat dengan "tim teknik AI-first" saat ini. Mereka menggunakan AI untuk menulis kode, menulis tes, melakukan tinjauan kode, memecahkan masalah, dan bahkan menggunakan Claude Code untuk mengembangkan Claude Code itu sendiri. 90% kode ditulis sendiri. Yang ingin saya lakukan adalah memilah bagian yang paling menarik dari wawancara ini, berbicara tentang bagaimana tim ini bekerja, apa yang dapat dipelajari, dan apa yang ditentukan oleh kondisi khusus mereka dan tidak dapat disalin. Berikut ini dibagi menjadi 7 cerita pendek, yang masing-masing dapat dibaca secara mandiri, dan dirangkai bersama untuk membentuk gambaran yang lengkap.

[1] Bagaimana gadget mendengarkan dapat menjadi produk dengan pendapatan tahunan sebesar $500 juta Pada September 2024, Boris Cherny baru saja bergabung dengan Anthropic dan menulis mainan baris perintah ketika dia tidak ada hubungannya. Apa yang bisa dilakukan benda ini? Ini menggunakan AppleScript untuk memberi tahu Anda lagu apa yang Anda dengarkan dan mengubah lagu sesuai dengan perintah Anda. Sesederhana itu. Boris sendiri berkomentar, "Demo yang cukup keren, tapi tidak menarik. ”

Twist sebenarnya datang setelah dia selesai mengobrol dengan rekannya Cat Wu. Cat sedang mempelajari kemampuan komputer Agen AI, dan saat mengobrol, Boris punya ide: bagaimana jika kita memberi alat baris perintah ini lebih banyak izin? Misalnya, biarkan ia dapat membaca dan menulis file dan menjalankan perintah?

Dia mencoba. Kemudian, saatnya tiba untuk menyaksikan keajaiban itu. Boris melemparkan alat yang ditingkatkan ke basis kode Anthropic dan mengajukan beberapa pertanyaan. Claude mulai menjelajahi sistem file sendiri—membaca file, melihat pernyataan impor di dalamnya, dan kemudian membaca file yang direferensikan, menggali lapis demi lapis sampai dia menemukan jawabannya. "Itu mengguncang saya," kenang Boris, "dan saya belum pernah menggunakan alat seperti ini. ”

Di bidang AI, ada konsep yang disebut "product overhang", yang diterjemahkan menjadi "product overhang". Ini berarti bahwa model sebenarnya memiliki kemampuan tertentu, tetapi bentuk produk yang ada tidak melepaskan kemampuan ini. Apa yang ditemukan Boris adalah "produk yang menggantung" besar yang bisa dilakukan Claude sejak lama, tetapi tidak ada yang membuat cangkang untuk itu.

Boris mulai bekerja dengan alat tersebut setiap hari dan kemudian membagikannya dengan beberapa rekan kerja. Dua bulan kemudian, pada bulan November, mereka merilis build. Datanya dibesar-besarkan: pada hari pertama, 20% insinyur digunakan; Hari ke-5, 50%.

Pada saat ini, muncul perdebatan menarik: haruskah dirilis ke dunia luar? Alasan oposisi sangat nyata: jika benda ini benar-benar sekuat yang kita pikirkan, bukankah baik untuk menyimpannya sebagai "senjata rahasia"? Mengapa melepaskan keunggulan kompetitif? Pada akhirnya, Anthropic memilih untuk menerbitkan. Logikanya adalah ini: Misi inti Anthropic adalah mempelajari keselamatan model, dan cara terbaik untuk mempelajari keamanan adalah dengan benar-benar menggunakan alat ini. Sekarang Claude Code telah divalidasi secara internal untuk banyak digunakan, merilisnya akan memberikan lebih banyak wawasan tentang kemampuan dan keamanan model.

Pada Mei 2025, Claude Code secara resmi dipublikasikan. Tiga bulan kemudian, penggunaan telah meningkat 10x lipat dan pendapatan tahunan melebihi $500 juta. Menariknya, Boris awalnya ditujukan untuk pemrogram - oleh karena itu nama "Claude Code". Tetapi suatu hari dia berjalan melewati workstation ilmuwan data dan menemukan Claude Code berjalan di layar lain. "Mengapa kamu menggunakan ini?" "Saya memintanya untuk membantu saya menulis pertanyaan dan memvisualisasikan." Sekarang, ilmuwan data Anthropic memilikinya, dan beberapa menggerakkan beberapa sekaligus. Gadget mendengarkan, karena diberi beberapa izin lagi, menjadi produk senilai ratusan juta dolar. Ini mungkin bukti terbaik dari "overhang produk", kemampuan model selalu ada, menunggu seseorang merilisnya.

[2] 90% kode ditulis sendiri - filosofi seleksi teknis Claude Code Claude Code memiliki 90% kodenya sendiri. Kedengarannya seperti gimmick, tetapi sebenarnya berkat logika pengambilan keputusan teknis mereka. Mari kita lihat tumpukan teknologi terlebih dahulu: TypeScript menulis bodi utama, React menggunakan kerangka kerja Ink sebagai UI terminal, Yoga open-source Meta melakukan sistem tata letak, dan Bun bertanggung jawab untuk membangun dan mengemas. Mengapa memilih tumpukan teknologi ini? Karena mereka "dalam distribusi". "Pada distribusi" adalah istilah di bidang AI. Ini berarti bahwa model telah melihat banyak kode semacam ini dan pandai menanganinya. TypeScript dan React adalah tempat Claude kuat. Jika Anda memilih kerangka kerja yang tidak populer, model harus "belajar", dan efeknya akan dikompromikan. Pilihan ini mengarah pada siklus yang luar biasa: tulis Claude Code dengan tumpukan teknologi yang dikuasai Claude, dan kemudian tulis lebih banyak Claude Code dengan Claude Code. 90% menulis tentang diri Anda, begitulah hasilnya. Pilihan mereka di tingkat arsitektur sama-sama ringkas. Claude Code berjalan secara lokal. Tidak ada kontainer Docker, tidak ada kotak pasir cloud, cukup baca dan tulis file dan jalankan perintah langsung di komputer Anda.

Adapun mengapa dirancang seperti ini? Boris menjawab, "Setiap kali kami membuat keputusan desain, kami hampir selalu memilih solusi yang paling sederhana. Berjalan secara lokal adalah jawaban paling sederhana. ” Kesederhanaan ini meluas ke seluruh filosofi produk: tulis logik bisnis sesedikit mungkin dan biarkan model menjadi protagonis. "Ini mungkin terdengar sedikit aneh," kata Boris, "tetapi kami ingin pengguna merasakan model se'otentik' mungkin. Banyak produk AI menambahkan banyak perancah—elemen UI tambahan, fitur aksesibilitas—dan hasilnya adalah modelnya terbatas. Yang ingin kami lakukan adalah membuat UI seramping mungkin. ” Agar tetap sederhana, setiap kali Claude merilis model baru, mereka banyak merampingkan kode. Misalnya, ketika Claude 4.0 dirilis, mereka menghapus sekitar setengah dari perintah sistem karena model baru tidak lagi membutuhkan "kruk" tersebut. Jumlah alat juga disederhanakan—hapus jika Anda bisa, gabungkan jika Anda bisa. Seluruh arsitektur Claude Code dapat diringkas dalam tiga hal: mendefinisikan UI dan mengekspos antarmuka ke modifikasi model, mengekspos alat untuk dipanggil model, dan kemudian mengesampingkan. Tentu saja, kesederhanaan tidak berarti tidak ada bagian yang rumit. Sistem izin adalah pengecualian. Lagi pula, memiliki AI menjalankan perintah di komputer Anda berisiko. Solusi Claude Code adalah bertanya kepada Anda sebelum menjalankannya: Apakah Anda ingin menyetujui operasi ini? Anda hanya dapat menyetujui kali ini, menyetujuinya nanti, atau menolaknya. Sistem izin mendukung konfigurasi berlapis-lapis – per proyek, per pengguna, per perusahaan. Teams dapat berbagi profil untuk memasukkan perintah keamanan yang umum digunakan ke daftar yang diizinkan. Prinsip-prinsip di balik desain izin ini adalah sebagai berikut: Jika Anda memulai Claude Code, itu tidak akan mengubah apa pun tanpa persetujuan Anda. Tetapi pada saat yang sama, juga perlu memberi pengguna opsi untuk "mendelegasikan" - dalam skenario kepercayaan Anda, Anda dapat melewati tautan konfirmasi. Sederhana, tapi tidak belum sempurna. Pengekangan, tetapi tidak kurang fungsi.

[3] 20 prototipe dalam dua hari - seperti apa iterasi produk di era AI Dulu, ketika saya membuat prototipe produk, saya bisa membuat dua dalam dua hari, yang dianggap efisien. Boris membuat 20 dalam dua hari. Ini tidak berlebihan, tetapi catatan nyata dari pengembangan fitur daftar tugas Claude Code. Dia bahkan membagikan petunjuk dan tangkapan layar dari setiap langkah. Mari kita lihat bagaimana 20 arketipe ini berulang. Dalam versi pertama, dia ingin daftar tugas muncul di bawah panggilan alat terbaru. Perintahnya singkat: "Alih-alih membuat todo muncul dengan input, tampilkan daftar todo tetap di atas kotak input, dengan judul '/todo (1 dari 3)' berwarna abu-abu". Setelah melihat efeknya, saya tidak terlalu puas. Dalam versi kedua, itu ditampilkan sebaris pada setiap pembaruan ToDo. Prompt: "Alih-alih menampilkan daftar tugas, render nama alat menjadi judul tebal saat model mulai memproses todo." Pertahankan tampilan kemajuan seperti 'langkah 2 dari 4'. ” Masih tidak benar. Pada edisi ketiga dan keempat, dia mencoba membuat "pil interaktif" - kotak kecil di bagian bawah layar yang dapat Anda klik untuk melihat kemajuannya. "Tambahkan pil todo di bawah kotak input teks, mirip dengan tugas latar belakang, yang menunjukkan 'todos: 1 dari 3'." Kemudian: "Jadikan pil ini interaktif, seperti pil pencarian latar belakang." ” Ini agak menarik, tetapi tidak cukup baik. Pada edisi kelima dan keenam, dia berubah pikiran: buat "laci" yang meluncur keluar dari kanan. "Batalkan pil dan judul sebelumnya, dan sebagai gantinya tampilkan daftar tugas di sisi kanan kotak input, dipusatkan secara vertikal, dipisahkan oleh pembatas abu-abu." "Ini agak gelisah, bisakah kamu membuatnya menjadi animasi laci?" Kelihatannya keren, tetapi kepraktisannya dipertanyakan. Pada edisi ketujuh dan kesembilan, ia memindahkan daftar tugas di atas kotak input dan bereksperimen dengan gaya pemotongan dan header yang berbeda. "Jika ada lebih dari 5, itu menunjukkan '... dan 4 lagi'","Tambahkan judul 'Todo:' abu-abu". Jawabannya semakin dekat dan dekat. Pada edisi kesepuluh dan kedua puluh, ia mulai mencari cara menggabungkan daftar tugas dengan memuat animasi. Solusi terakhir adalah menempatkan informasi kemajuan di sebelah pemintal (indikator beban) untuk memaksimalkan visibilitas. Setelah rilis, pengguna melaporkan ingin melihat daftar tugas lengkap. Jadi iterasi lain ditambahkan: tekan Ctrl+T untuk memperluas semua langkah. Ini adalah versi yang sekarang online.

Sepanjang proses, petunjuk Boris secara mengejutkan pendek—sebagian besar satu atau dua kalimat. Namun setiap versi adalah prototipe yang benar-benar dapat dijalankan, bukan gambar statis, bukan PPT. Dia benar-benar dapat menguji dan memverifikasi fungsi ini untuk merasakan apakah berfungsi dengan baik. Proses pengembangan produk tradisional adalah: ide→ diskusi → menggambar wireframe → melakukan desain → pengembangan → pengujian fidelitas tinggi → ditayangkan. Setiap langkah membutuhkan waktu, dan setiap langkah bisa macet. Sekarang alurnya menjadi: Ide → Prompt satu kalimat → Prototipe yang dapat dieksekusi → Jika ada sesuatu yang tidak terasa beres, lakukan lagi. Hal ini sebenarnya mengharuskan pengembang untuk mengubah pola pikir mereka untuk beradaptasi dengan proses pengembangan ini. Di masa lalu, peran prototipe adalah untuk "memverifikasi ide" - karena biaya pembuatan prototipe tinggi, dan Anda harus berpikir dengan hati-hati sebelum melakukannya. Sekarang, prototipe telah menjadi "eksplorasi kemungkinan" - karena biaya pembuatan prototipe rendah, Anda dapat membuatnya terlebih dahulu dan kemudian membuangnya. Boris mengatakan bahwa ketika menggunakan Claude Code, dia sering melewatkan tahap menggambar cetak biru dan hanya membuat versi yang sedang berjalan, yang lebih intuitif daripada apa pun. Irama harian tim Claude Code adalah sebagai berikut: setiap insinyur mendorong sekitar 5 PR per hari, 60-100 rilis secara internal per hari, dan 1 rilis secara eksternal per hari. 5 PR sehari, yang tidak terbayangkan di sebagian besar perusahaan. Uber berada dalam periode restrukturisasi yang paling intens, dan tidak buruk untuk dapat mendorong PR menengah sehari. Ketika alat berubah, ritme berubah, dan cara berpikir harus berubah.

[4] Mendesain ulang terminal baris perintah dengan AI terintegrasi Terminal baris perintah telah ada selama beberapa dekade, mengapa perlu didesain ulang sekarang? Karena sebelum LLM, terminal tidak terlalu fokus pada pengalaman interaktif. Baris perintah tradisional adalah pertanyaan dan jawaban: Anda memasukkan perintah, itu mengembalikan hasil, dan Anda selesai. Tidak ada dialog, tidak ada konteks, tidak ada umpan balik saat menunggu. Anda menatap kursor yang berkedip dan tidak tahu apa yang terjadi di latar belakang. Claude Code adalah produk pertama yang benar-benar perlu memikirkan "terminal UX". Mereka menambahkan beberapa detail kecil yang terlihat tidak mencolok, tetapi terasa sangat berbeda saat digunakan. Pertama: Perintah pemuatan kontekstual. Saat model berpikir, layar dapat menghasilkan petunjuk yang relevan berdasarkan tampilan tugas saat ini: misalnya, "membaca struktur kode Anda" atau "memikirkan solusi". Ini adalah sentuhan kecil, tetapi memberi alat ini "kepribadian". Anda akan merasa seperti bekerja keras dan tidak terjebak. Boris mengatakan terakhir kali dia melihat interaksi kecil yang menyenangkan semacam ini adalah ketika Slack adalah proses orientasi pemula. Kedua: Tips mengajar sambil menunggu. Saat Claude menjalankan tugas yang panjang, bagian bawah layar akan menampilkan rotasi tip, seperti "Anda dapat menekan Esc untuk mengganggu tugas saat ini" atau "Coba /bantu untuk melihat semua perintah". Baris perintah digunakan untuk mengajarkan baris perintah, yang sederhana dan cerdas. Cerita ketiga bahkan lebih menarik: renderer Markdown. Sehari sebelum rilis, beberapa insinyur mengeluh bahwa daftar bersarang jelek dan spasi paragraf tidak benar. Masalahnya adalah dengan perender Markdown. Boris mencoba semua renderer di pasaran, dan tidak ada yang terlihat bagus di terminal. Jadi dia menghabiskan satu hari menggunakan Claude Code untuk menulis parser dan renderer Markdown dari awal. Ya, sehari sebelum rilis. Ya, tulis dari awal. Ya, menggunakan Claude Code sendiri. Akibatnya, perender "terburu-buru" ini terlihat lebih baik daripada semua solusi siap pakai. Mereka merilisnya secara langsung. Boris percaya bahwa tidak ada terminal lain yang sekarang memiliki kualitas rendering Markdown yang sama. Cerita ini menggambarkan satu hal: ketika Anda memiliki alat pemrograman AI yang cukup baik, biaya "membangun roda Anda sendiri" turun secara signifikan. Kompromi "gunakan saja" sekarang bisa menjadi "kemudian lakukan yang lebih baik". Bentuk antarmuka kuno dari terminal baris perintah sedang terlahir kembali dengan penambahan LLM. Terminal masih terminal yang sama, tetapi karena penambahan AI, kita perlu memikirkan secara serius bagaimana membuat orang melakukan percakapan yang lebih baik dengan AI di terminal.

[5] AI menembus setiap tautan - eksperimen "AI komprehensif" oleh tim teknik Tim teknik Anthropic mungkin merupakan salah satu penggunaan alat AI yang paling ekstrem saat ini. Ini bukan hanya tentang menulis kode, ini tentang setiap aspek proyek. Tinjauan kode: Tinjauan pertama dari semua PR dilakukan oleh Claude Code, dan yang kedua dilakukan oleh insinyur. Boris mengatakan bahwa Claude Code dapat menemukan banyak masalah pada lintasan pertama. Fitur ini awalnya hanya digunakan secara internal, tetapi kemudian mereka mempublikasikannya sehingga semua orang dapat menggunakan Claude Code untuk tinjauan keamanan. Tes tulis: Rangkaian pengujian Claude Code hampir seluruhnya ditulis oleh Claude Code. "Di masa lalu, jika seseorang mengungkit PR dan tidak menulis tes, saya akan ragu untuk mengatakan apa pun - itu terasa seperti pick-and-point," kata Boris. Tapi sekarang dengan Claude, menulis tes adalah kata yang cepat, dan tidak ada alasan untuk tidak menulisnya. ” Respons Insiden: Insinyur Oncall meminta Claude Code untuk membantu menganalisis akar penyebab (akar penyebab masalah). Ini menarik diskusi yang relevan dari Slack, log kesalahan dari Sentry, data dari berbagai sistem pemantauan, dan menganalisisnya secara sintetis. Boris mengatakan Claude Code menemukan Akar Penyebab lebih cepat daripada seseorang dalam beberapa skenario. Triase masalah GitHub: Setiap kali masalah baru masuk, Claude Code akan melakukan analisis terlebih dahulu, dan kemudian insinyur akan menanyakan apakah itu dapat diimplementasikan. Boris mengatakan bahwa sekitar 20% hingga 40% dari waktu, itu bisa dilakukan untuk pertama kalinya. Bagan dan kueri: Data produk berada di BigQuery, dan hampir semua kueri dan visualisasi dihasilkan di Claude Code. Insinyur bahkan akan membiarkannya mengeluarkan diagram ASCII secara langsung.

Yang paling mengejutkan saya adalah kebangkitan TDD (pengembangan berbasis pengujian). TDD adalah konsep lama: tulis tes terlebih dahulu, lalu tulis kode yang lulus pengujian. Ini bagus secara teori - memaksa Anda untuk memikirkan apa yang Anda inginkan terlebih dahulu. Namun dalam praktiknya, kebanyakan orang menganggapnya terlalu lambat dan rumit, sehingga metode ini perlahan-lahan terpinggirkan dalam sepuluh tahun terakhir. Tapi Boris mengatakan bahwa setelah menggunakan Claude Code, dia melakukan banyak TDD: "Saya akan mulai dengan meminta model untuk menulis tes dan memberitahunya bahwa tes akan gagal sekarang, jangan mencoba untuk meloloskannya. Kemudian saya memintanya untuk menulis kode untuk mengimplementasikan fungsi, dan membiarkan tes lulus, tetapi tidak mengubah tes itu sendiri. ” "Ketika sebuah model memiliki tujuan yang jelas untuk diulangi—seperti pengujian unit atau tiruan—kinerjanya sangat baik." Dia secara khusus menyebutkan bahwa Claude 4.0 adalah seri model pertama yang memungkinkan model untuk menulis sebagian besar tes. Versi sebelumnya dapat menulis bagian, tetapi membutuhkan banyak campur tangan manusia. Ada juga konsep baru: multi-clauding. Ini berarti menjalankan beberapa instance Claude Code secara bersamaan, memungkinkan mereka untuk mengerjakan tugas yang berbeda secara paralel. Sid mengatakan dia sering melakukan ini – memulai beberapa agen selama rapat dan kembali nanti untuk melihat hasilnya. Anthropic menemukan bahwa 25% pelanggan Max (pengguna premium yang berharga $100-$200 per bulan) multi-clauding setiap hari. Ini adalah perubahan yang menarik. Pemrograman selalu menjadi aktivitas "single-threaded": Anda hanya dapat melakukan satu hal pada satu waktu, dan hanya beralih tugas ketika kode ditinjau atau diterapkan. Tapi sekarang, "pemrograman paralel" dimungkinkan – Anda dapat memajukan beberapa hal sekaligus. Tentu saja, ada banyak hal yang tidak diketahui di sini: apakah pekerjaan paralel benar-benar lebih efisien, atau apakah itu hanya terasa lebih efisien? Jenis tugas apa yang cocok untuk paralelisme? Apakah akan ada masalah jika setiap agen kurang mendapat perhatian? Pertanyaan-pertanyaan ini belum terjawab. Tapi kami memiliki alat baru untuk bereksperimen. Terakhir, mari kita bicara tentang sebuah kasus. Sebuah perusahaan akan melakukan migrasi kerangka kerja, dan diperkirakan akan memakan waktu dua tahun teknik - dua tahun untuk satu insinyur, atau dua setengah bulan untuk sepuluh insinyur. Mereka menggunakan Claude Code, dan seorang insinyur melakukannya dalam dua minggu. Boris mengatakan dia dulu skeptis terhadap klaim seperti itu, tetapi mereka telah mendengar cerita serupa terlalu sering.

[6] Hackathon tiga hari - bagaimana fitur Subagents lahir Inspirasi untuk fitur ini di Subagents berasal dari postingan Reddit. Beberapa mengatakan dia membuka lima instance Claude Code pada saat yang sama, mengatur peran yang berbeda untuk setiap instance, dan kemudian menggunakan sistem file untuk berkomunikasi satu sama lain. Ketika Sid Bidasaria melihat postingan ini, reaksi pertamanya adalah: Gameplay ini keren, tetapi pengguna tidak perlu melempar seperti ini. Kita harus menjadikannya fungsi bawaan produk. Kebetulan perusahaan mengadakan hackathon internal selama tiga hari, dan Sid memutuskan untuk menggunakan tiga hari itu untuk melakukannya. Pada hari pertama, tim dengan bersemangat menggambar berbagai topologi agen yang kompleks: komunikasi bus pesan antar agen, mode asinkron, interaksi banyak-ke-banyak...... Gambarnya digambar dengan indah dan konsepnya canggih. Keesokan harinya, mereka menyadari bahwa sepertinya tidak layak untuk melakukannya. Masalahnya bukan implementasi teknis - pola kompleks dapat dibuat. Masalahnya adalah pengguna tidak dapat memahaminya. UI Claude Code adalah terminal sederhana, bagaimana Anda membiarkan pengguna memahami mode komunikasi agen yang kompleks dalam antarmuka yang begitu sederhana? Mereka memutuskan untuk memulai dari awal dan kembali ke pertanyaan mendasar: Apa bentuk paling sederhana yang dapat digunakan oleh rata-rata pengembang? Mereka menetapkan diri mereka sendiri dua kendala: Pertama, jangan menemukan sesuatu yang baru. Gunakan hanya kemampuan yang sudah dimiliki Claude Code - perintah "/" dan file .md. Kedua, jangan berkomunikasi antar agen. Ubah ke pola orkestrasi sederhana: ada agen master yang dapat memanggil agen turunan, dan agen anak mengembalikan hasilnya setelah menyelesaikan tugas, dan hanya itu. Mereka juga mengobrol dengan tim peneliti Anthropic. Para peneliti sedang mengerjakan pola multi-agen, tetapi kesimpulannya adalah bahwa masih belum meyakinkan apakah topologi agen kompleks benar-benar berfungsi. Ini memberi mereka lebih banyak kepercayaan diri: karena bahkan tim peneliti mengatakan bahwa kompleksitas belum tentu baik, lebih baik membuat versi sederhana. Di penghujung hari ketiga, mereka membuat versi kerja. Pengguna dapat menentukan peran dan kemampuan sub-agen dalam file .md (misalnya, "agen front-end: menggunakan React 19 dan Next.js"), Claude Code akan memanggilnya bila perlu, atau pengguna dapat memicu mereka secara manual. Setelah hackathon, setelah sedikit dipoles, fitur tersebut ditayangkan. Sekarang Anda dapat menentukan berbagai sub-agen eksklusif: agen back-end dengan keahlian audit keamanan, agen front-end yang akrab dengan kerangka kerja tertentu, dan agen QA yang berspesialisasi dalam menulis tes...... Mereka dapat bekerja secara paralel di latar belakang, masing-masing melakukan perannya sendiri. Banyak tim akan enggan untuk membatalkan rencana kompleks mereka dalam hackathon, lagipula, mereka menghabiskan sepanjang hari menggambar dan berdiskusi, dan mereka memiliki perasaan. Mampu mengakui bahwa "jalan ini tidak berhasil" dan menggulingkannya dan memulai dari awal membutuhkan keberanian dan keyakinan pada "kesederhanaan". Kesederhanaan bukanlah kemalasan. Yang sederhana adalah menemukan bentuk yang benar-benar dapat digunakan pengguna di antara kemungkinan yang tak terhitung jumlahnya.

[7] Seperti apa tim teknik di masa depan? Beberapa dapat digunakan sebagai referensi, dan beberapa tidak dapat disalin Boris berkata, "Pemrograman sangat menyenangkan sekarang. Terakhir kali saya merasa seperti ini adalah ketika saya menulis kode pada kalkulator grafik untuk pertama kalinya di sekolah menengah. Perasaan magis yang sudah lama tidak saya alami, tetapi sekarang kembali. ” Sid merasakan hal yang sama: "Ada dua hal yang menggairahkan saya. Salah satunya adalah kecepatan di mana kita melepaskan – terkadang terasa terlalu cepat. Yang kedua adalah begitu banyak ruang eksperimental - meskipun pekerjaan sebelumnya cepat, hal-hal yang saya lakukan lebih rutin, dan mengetahui jawabannya, itu hanya eksekusi. Sekarang berbeda, modelnya berubah setiap tiga bulan, dan kita harus terus-menerus memikirkan kembali bagaimana kita melakukan sesuatu. ” Perasaan ini sangat nyata dan menular. Namun sebelum membahas "seperti apa masa depan tim teknik nantinya", jangan lupakan kekhususan Anthropic. Pertama, Anthropic adalah laboratorium penelitian, bukan perusahaan produk. Misi intinya adalah meneliti keamanan dan kemampuan AI, dan produk adalah sarana, bukan akhir. Ini berarti bahwa mereka memiliki toleransi yang jauh lebih tinggi untuk "eksperimen cepat" daripada rata-rata perusahaan. Kedua, produk utama mereka adalah model Claude itu sendiri. Claude Code hanyalah "cangkang" dari model. Jadi "menghapus kode untuk membiarkan model berbuat lebih banyak" adalah pilihan alami bagi mereka, tetapi untuk perusahaan lain itu mungkin berarti memberikan logika bisnis inti ke kotak hitam. Ketiga, semua karyawan memiliki akses tak terbatas ke Claude, termasuk model Opus yang paling mahal. Di sebagian besar perusahaan, biaya berlangganan AI adalah item anggaran yang perlu diperjuangkan dan tidak dapat digunakan oleh semua orang. Keempat, tim hanya memiliki selusin orang, dan prosesnya minimal. Mereka hampir tidak menggunakan bendera fitur karena "terlalu lambat". Ini tidak terpikirkan dalam produk dengan basis pengguna yang besar dan biaya kesalahan yang tinggi. Jadi, menyalin tim Claude Code secara langsung belum tentu realistis untuk sebagian besar tim. Tetapi ada beberapa hal yang bisa dipelajari. Pola pikir pembuatan prototipe cepat: Bahkan jika Anda tidak dapat membuat 10 prototipe sehari, dapatkah Anda mengubah dari "satu setiap dua minggu" menjadi "tiga seminggu"? Perkakas telah berubah, dan ekspektasi "seberapa cepat prototipe seharusnya" harus diperbarui. Tinjauan Kode Berbantuan AI: Biarkan AI melakukan tinjauan pertama dan manusia melakukan tinjauan kedua. Proses ini tidak bergantung pada akses API tak terbatas, yang dapat dicoba oleh sebagian besar tim. Kebangkitan TDD: Jika menulis tes menjadi cukup mudah, "tidak ada waktu untuk menulis tes" bukan lagi alasan. Ini bisa menjadi titik masuk berbiaya rendah untuk meningkatkan kualitas kode. Nilai insinyur yang berpikiran produk diperkuat: Tim Claude Code tidak memiliki desainer atau PM, hanya beberapa insinyur yang berpikiran produk. Alat AI telah sangat memperluas apa yang dapat dilakukan "bakat full-stack" ini.

Tentu saja, ada beberapa hal yang tidak bisa digantikan oleh alat. Boris mampu memilih yang terbaik dari 20 pola dasar karena dia menghakimi—dia tahu apa yang "terasa benar" dan apa yang "terlihat bagus." Rasa ini adalah hasil dari 17 tahun pengalaman pengembangan perangkat lunak, bukan sesuatu yang dapat diberikan oleh AI. Tim membuat rencana yang rumit pada hari pertama, dan keesokan harinya mereka dapat dengan kejam membalikkan dan memulai dari awal, yang juga merupakan penilaian manusia. Mengetahui kapan harus menghapus kode dan kapan menyimpannya sama dengan intuisi arsitektur ini. AI membuat eksekusi lebih cepat, tetapi tidak membuat "mengetahui apa yang harus dilakukan" lebih mudah. Sebaliknya, karena biaya eksekusi telah menurun, keputusan "apa yang harus dilakukan" menjadi lebih penting - Anda dapat membuat 20 versi dengan cepat, tetapi Anda harus tahu mana yang benar. Seperti apa rekayasa perangkat lunak dalam beberapa tahun? Tidak ada yang bisa memprediksi secara akurat. Tetapi tim Claude Code hari ini mungkin semacam latihan untuk besok bagi banyak tim - iterasi yang lebih cepat, lebih sedikit "pemindahan batu bata", lebih banyak penilaian dan pengambilan keputusan. Alat-alat berubah. Yang tetap tidak berubah adalah bahwa masih orang-orang yang membuat keputusan akhir.

2,55K

Teratas

Peringkat

Favorit