Topik trending
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Oke, sepertinya ini sudah keluar di catatan rilis (saya memeriksa), jadi... (catatan: menguji model adalah bagian dari pekerjaan saya dan posting ini tidak disponsori oleh OpenAI dengan cara apa pun):
Saya diundang untuk menguji alfa GPT-5.1 Pro bersama para ahli robotika, matematika, imunologi, kedokteran, musik, dan banyak lagi. Fokus saya adalah penelitian dan strategi komersial ilmu hayati dan beberapa kasus penggunaan pribadi.
Setelah menggunakan GPT-5.1 Pro selama beberapa hari, saya merasa lebih seperti ahli domain manusia daripada GPT-5 Pro, dengan tulisan yang lebih jelas, penilaian yang lebih baik, lebih sedikit garis singgung, sintesis yang lebih kuat, dan respons yang lebih sadar secara emosional.
Saya menjalankan GPT-5.1 Pro secara langsung melawan GPT-5 Pro pada tugas-tugas kerja seperti sintesis literatur ilmiah, perencanaan peluncuran obat, dan analisis media sosial. Saya juga mencobanya untuk perencanaan keuangan pribadi dan bahkan jurnal. Itu adalah:
- Lebih ketat dan komprehensif dalam penelitian dan perencanaan.
- Lebih kuat dalam penalaran.
- Lebih baik dalam tetap berada di jalur dan menghindari garis singgung (dan, setidaknya dalam satu kasus, kesalahan terkait).
- Jauh lebih jelas, lebih percaya diri, lebih berempati dalam gaya komunikasinya.
Mengetahui fokus OpenAI pada kinerja dunia nyata (misalnya GDPval) dan laporan perekrutan pakar domain di bidang-bidang seperti keuangan, saya pikir keahlian domain manusia adalah apa yang mereka inginkan, dan dengan GPT-5.1 Pro mereka semakin dekat.
Konon, itu tidak lebih baik dalam segala hal. Masih menyebalkan dalam membuat presentasi berkualitas profesional dan spreadsheet Excel, kelemahan penting dengan model OpenAI yang saya yakin mereka sedang berupaya untuk memperbaikinya. Dan saya melihat bahwa setidaknya satu penguji menemukan model tersebut secara konservatif menghindari mengatasi masalah terbuka yang diketahui dalam domain STEM, memilih untuk menjelaskan mengapa mereka adalah masalah terbuka.
Secara keseluruhan, jika saya harus mengukurnya, saya akan mengatakan itu adalah lompatan 10-15% dari GPT-5 Pro untuk jenis hal yang saya gunakan. Rasanya seperti langkah menuju model yang berpikir dan berkomunikasi lebih seperti rekan kerja sungguhan, dengan keahlian, intuisi, dan penilaian domain yang lebih baik, bersama dengan peningkatan empati dan keterampilan komunikasi.
Ini pertanda baik bagi AI yang melakukan pekerjaan yang lebih berdampak pada tahun 2026.
Teratas
Peringkat
Favorit

