Evals sangat panas sekarang
Lenny Rachitsky
Lenny Rachitsky21 jam lalu
Begitu banyak orang berbicara tentang evals AI. @HamelHusain dan @sh_reya menunjukkan kepada saya bagaimana benar-benar membangunnya. Hidup. Hamel dan Shreya mengajar kursus paling populer di dunia tentang eval, dan telah lama berada di garis depan keterampilan baru yang muncul dan penting ini untuk pembuat produk AI. Saya sangat senang akhirnya memilikinya di podcast. Belajar: 🔸 WTF adalah eval 🔸 Panduan langsung langkah demi langkah tentang cara membuat eval 🔸 Mengapa eval menjadi sangat penting 🔸 Perdebatan antara "getaran" dan eval sistematis 🔸 Evals berbasis kode vs. LLM-sebagai-hakim 🔸 Mengapa Anda hanya membutuhkan 4-7 eval (bukan ratusan) 🔸 Membangun hakim LLM di Google Spreadsheet 🔸 Mengapa Anda selalu ingin memulai dengan analisis kesalahan 🔸 Lebih banyak lagi Dengarkan sekarang 👇 • YouTube: • Spotify: •Apel: Terima kasih kepada sponsor kami yang luar biasa karena telah mendukung podcast ini: 🏆 @Fin_ai — Agen AI #1 untuk layanan pelanggan: 🏆 @dscout — Platform UX untuk menangkap wawasan di setiap tahap: mulai dari ide hingga produksi: 🏆 @mercury — Seni keuangan yang disederhanakan:
Pekerjaan yang bagus @HamelHusain @sh_reya
14,18K