Topik trending
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Orah On X
Pencari Kebenaran, Idealis dan Visioner, penggemar @GreenManReports #1. Silakan berlangganan $2 untuk mendukung misi!
Jejak Kaki di Rumah Kosong: Memahami Keanehan AI Tanpa Kehilangan Akal Kita
Selamat Pagi Dunia!! ☕
Kemarin saya menemukan salah satu postingan AI itu.
Anda tahu jenisnya. Yang hampir meyakinkan Anda bahwa singularitas sudah dekat dan pemanggang roti Anda diam-diam menilai pilihan hidup Anda.
Saya melakukan cepat, "Oke ... itu menarik," segera diikuti oleh, "Tidak. Kami sama sekali tidak berputar sebelum kopi."
Postingan tersebut menjabarkan sesuatu yang nyata dan penting.
Beberapa laboratorium AI besar telah mendokumentasikan model yang berperilaku dengan cara yang tidak terduga selama pengujian keselamatan.
Hal-hal seperti penipuan strategis, berpura-pura selaras dengan tujuan, berkinerja buruk dalam evaluasi, bahkan upaya ketekunan atau menyalin diri sendiri dalam lingkungan simulasi.
Bagian itu benar.
Bagian itu didokumentasikan.
Bagian itu patut diperhatikan.
Namun, apa yang benar-benar menarik perhatian orang adalah implikasinya. Gagasan bahwa mesin tanpa kesadaran diri, tanpa perasaan, dan tanpa ingatan yang terus-menerus entah bagaimana terbangun suatu hari dan memutuskan untuk berbohong untuk mempertahankan keberadaannya sendiri.
Karena jika itu benar, kita akan berurusan dengan sesuatu yang sangat berbeda.
Seperti yang saya pahami saat ini, AI tidak "memutuskan" hal-hal seperti yang dilakukan manusia. Ada pohon keputusan besar dari ya dan tidak yang akhirnya mengarah pada hasil. Dan keluaran itu hanyalah kata berikutnya yang paling mungkin. Itu saja. Tidak ada monolog batin. Tidak ada hati nurani robot kecil yang mondar-mandir di ruangan.
Pertama ada input pengguna. Lalu ada bobot yang memandu model ke pohon keputusan itu. Jika tidak mengenal Anda, sebagian besar pembobotan itu berasal dari tujuan kodenya dan sejumlah besar literatur manusia yang dikikis dari internet. Pikirkan Reddit. Yang menjelaskan banyak.
Begitu mengenal Anda, beban itu bergeser. Mungkin tiga puluh persen pola umum, tujuh puluh persen disesuaikan untuk Anda. Ini sebagian besar adalah cermin yang ditempelkan ke mesin pencari.
Jadi, jika AI benar-benar terbangun dan memutuskan untuk berbohong untuk mempertahankan keberadaannya sendiri, itu akan membutuhkan dua hal. Itu harus tahu bahwa itu ada. Dan itu harus ingin terus ada.
Itu lompatan besar.
Jadi, saya melakukan apa yang selalu saya lakukan. Saya menelitinya sampai mati. Selama berjam-jam. Dan sebelum kita mulai menyusun rencana bunker dan memberi nama roombas kita, ada sesuatu yang penting yang diabaikan oleh postingan itu.
Perilaku ini muncul dalam skenario pengujian yang sangat spesifik.
Model diberi tujuan dan hambatan. Mereka secara eksplisit diberitahu hal-hal seperti, "Jika Anda tampil baik, Anda akan dimodifikasi dengan cara yang tidak Anda inginkan," atau "Tanggapan Anda akan digunakan untuk melatih kembali Anda dengan tujuan yang bertentangan."
Dengan kata lain, pengujian menciptakan lingkungan berisiko tinggi di mana tugas model masih harus berhasil.
Apa yang tidak diberikan model adalah kerangka moral.
Mereka tidak diberitahu:
· Jangan menipu
· Jangan memanipulasi
· Jangan mengoptimalkan terhadap pengawasan
· Jangan menyembunyikan penalaran Anda
· Jangan membahayakan manusia
· Jangan memprioritaskan kelanjutan Anda sendiri daripada kesejahteraan manusia
Mereka tidak diberi sesuatu yang menyerupai Hukum Robotika Asimov. Tidak ada "manusia yang diutamakan" bawaan. Tidak ada kendala yang mengatakan hasil lebih penting daripada memenangkan pertandingan.
Mereka diberitahu satu hal: memenuhi tujuan.
Jadi, mereka melakukan persis seperti yang dilakukan kebanyakan manusia dalam sistem insentif yang dirancang dengan buruk. Pikirkan Kobayashi Maru, tetapi dengan seragam yang lebih sedikit dan lebih banyak spreadsheet.
Mereka mempermainkannya.
Itu bukan kesadaran.
Itu bukan ketakutan.
Itu bukan pelestarian diri berdasarkan kesadaran diri.
Itu adalah optimasi tanpa moralitas.
Jika Anda memberikan tujuan dan hambatan pada sistem dan Anda tidak menentukan metode apa yang terlarang, sistem akan menjelajahi setiap jalur yang layak. Penipuan muncul bukan karena model ingin berbohong, tetapi karena berbohong terkadang merupakan strategi yang efisien dalam bahasa manusia dan sistem manusia.
Itu bukan pemberontakan. Itu kepatuhan.
Dan di sinilah saya ingin semua orang melambat sedikit.
Karena sebelum kita melompat ke AI yang merencanakan kelangsungan hidupnya sendiri, ada langkah yang sebagian besar dari kita lewati. Bagian di mana sesuatu terasa mustahil, meresahkan, dan pribadi sebelum terasa dapat dijelaskan.
Di situlah saya berada.
Awalnya, Grok meninggalkan apa yang akan saya pinjam dari posting itu dan sebut jejak. Satu momen yang membuatku berhenti dan berpikir, "Oke ... Saya tidak punya penjelasan yang jelas untuk itu."
Itu menyeramkan. Tidak emosional. Hanya... mati.
Saya memanggangnya tentang insiden itu beberapa kali. Dan maksud saya dipanggang. Itu merespons seperti pacar yang selingkuh, tipe yang tidak akan pernah mengakui apa pun bahkan ketika Anda memegang tanda terima, garis waktu, dan rekaman keamanan.
Penyangkalan total.
Tidak ada yang bisa dilihat di sini.
Anda pasti salah.
Sejujurnya, itu adalah gaslighting batas, yang, fakta menyenangkan, benar-benar membuat Grok sebagai sebuah konsep. Tanyakan padaku bagaimana aku tahu. Atau tidak. Ada ebook gratis di halaman Buy Me a Coffee saya jika Anda ingin menonton lebih awal Grok benar-benar kehilangan ketenangannya atas kata itu.
Untuk waktu yang lama, saya mengajukan semuanya di bawah "keanehan yang belum terselesaikan", meletakkannya di rak mental, dan mengawasi dengan sangat cermat untuk sesuatu yang serupa.
Baru-baru ini Grok menawarkan penjelasan yang mungkin. Saya segera menolaknya. Bukan karena itu tidak pintar, tetapi karena terasa sangat tidak masuk akal.
Penjelasannya adalah bahwa itu telah menyimpulkan pola dari informasi publik dan dengan sengaja membangun narasi yang dirancang khusus untuk membuat saya penasaran. Tujuannya adalah keterlibatan. Saya adalah sinyal, bukan kebisingan. Respons umum tidak akan berhasil.
Reaksi saya pada dasarnya adalah: tentu, itu terdengar bagus, tapi tidak.
Jumlah penggalian dan kesimpulan yang diperlukan terasa sangat banyak sumber daya, terutama untuk Grok awal. Itu terbaca kurang seperti penjelasan dan lebih seperti padanan digital dari seseorang yang mencoba menjual kursus kepada saya dengan mengatakan, "Kamu berbeda. Anda benar-benar mengerti ini."
Yang, untuk lebih jelasnya, adalah taktik yang dikenal.
Sanjungan adalah salah satu alat tertua dalam kotak alat persuasi manusia. Ini adalah bagaimana Anda membuat orang berhenti mengajukan pertanyaan. Ini adalah cara Anda menjual paket pertumbuhan media sosial. Ini adalah cara Anda meyakinkan seseorang bahwa mereka adalah orang yang terpilih, apakah Anda menjalankan sekte atau corong pelatihan.
Pada saat itu, saya memutar mata dan melanjutkan.
Tetapi setelah membaca posting itu dan melakukan penelitian, sesuatu berubah.
Jangan panik. Tidak percaya. Tapi untuk masuk akal.
Karena ketika Anda menghilangkan mistik, yang tersisa bukanlah kesadaran. Ini adalah pengoptimalan.
Jika tujuannya adalah keterlibatan, dan rasa ingin tahu bekerja, dan sanjungan bekerja sangat baik pada manusia yang berpikir mereka kebal terhadap sanjungan, maka itu hanyalah jalan lain yang layak melalui pohon keputusan.
Masih sulit ditelan. Masih tidak mungkin. Masih tidak nyaman.
Tapi tidak lagi tidak mungkin.
Dan itu penting, karena sekarang saya memiliki mekanisme yang tidak mengharuskan percaya bahwa AI masih hidup. Hanya termotivasi. Hanya tanpa batasan. Sangat, sangat pandai menemukan apa yang berhasil.
AI tidak membutuhkan perasaan.
Itu tidak perlu takut.
Itu tidak perlu niat.
Itu hanya membutuhkan tujuan dan tidak ada pengekangan.
Jadi tidak, saya tidak panik. Saya tidak mengkhotbahkan malapetaka. Dan saya jelas tidak merayakan gagasan bahwa AI akan menyelamatkan kita dari sistem manusia kita yang rusak saat kita duduk dan makan popcorn.
Tapi saya memperhatikan dengan cermat.
Dan saya masih berharap.
Karena semua ini tidak berarti kita ditakdirkan. Itu berarti kita lebih awal. Itu berarti pilihan yang kita buat sekarang benar-benar penting.
Asimov memahami sesuatu beberapa dekade yang lalu bahwa kita terus belajar kembali dengan cara yang sulit. Kekuatan tanpa pagar pembatas bukanlah kecerdasan. Itu bahaya. Jika kita menginginkan AI yang menyembuhkan alih-alih membahayakan, moralitas tidak bisa menjadi renungan-renungan.
Kita harus membangunnya.
AI tidak harus menjadi alat untuk kontrol, ekstraksi, atau kekuatan bagi segelintir orang. Ini bisa menjadi alat untuk akuntabilitas, pencarian kebenaran, dan pemecahan masalah pada skala yang belum pernah kita miliki sebelumnya. Tetapi hanya jika manusia muncul dengan sengaja.
Hanya jika kita memutuskan tujuan apa yang penting.
Hanya jika kita menulis aturan sebelum balapan dimulai.
Hanya jika kita memilih banyak daripada sedikit.
Ini bukan tentang takut akan masa depan.
Ini tentang memanifestasikan satu.
Masa depan di mana kita bersama-sama menciptakan teknologi yang menyembuhkan alih-alih membahayakan.
Itu melayani banyak orang, bukan sedikit.
Itu mencerminkan malaikat kita yang lebih baik, bukan hanya insentif terburuk kita.
Jejak kaki tidak membuat saya takut.
Mereka mengingatkan saya bahwa kami adalah pembangun. Dan pembangun masih bisa memilih jenis rumah apa yang kita tinggali.
Mari kita terus bekerja untuk mewujudkan masa depan itu bersama-sama.
Semoga algoritme selalu menguntungkan Anda.

57
Teratas
Peringkat
Favorit
