المواضيع الرائجة
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Orah On X
باحث عن الحقيقة، مثالي ورؤيوي، #1 معجب @GreenManReports. يرجى الاشتراك بمبلغ 2 دولار لدعم المهمة!
آثار أقدام في المنزل الفارغ: فهم غرابة الذكاء الاصطناعي دون أن نفقد عقولنا
صباح الخير يا عالم!! ☕
بالأمس صادفت أحد تلك المنشورات الذكاء الاصطناعي.
تعرف نوعه. تلك التي تكاد تقنعك بأن التفرد قريب ومحمصتك تحكم بهدوء على اختياراتك في حياتك.
قلت بسرعة: "حسنا... هذا مثير للاهتمام،" تلاه مباشرة، "لا. نحن بالتأكيد لن ندخل في دوامة قبل القهوة."
المنشور يوضح شيئا حقيقيا ومهما.
وقد وثقت العديد من مختبرات الذكاء الاصطناعي الكبرى تصرفات النماذج بطرق غير متوقعة أثناء اختبارات السلامة.
أشياء مثل الخداع الاستراتيجي، التظاهر بالتوافق مع الأهداف، الأداء الضعيف في التقييمات، حتى محاولات الاستمرار أو النسخ الذاتي في بيئات محاكية.
هذا الجزء صحيح.
هذا الجزء موثق.
هذا الجزء يستحق الاهتمام.
ما جذب الناس حقا هو التلميح. فكرة أن آلة بلا وعي ذاتي، بلا مشاعر، ولا ذاكرة مستمرة استيقظت يوما ما وقررت الكذب للحفاظ على وجودها.
لأنه لو كان هذا صحيحا، لكنا نتعامل مع شيء مختلف تماما.
كما أفهمه حاليا، الذكاء الاصطناعي لا "يقرر" الأمور كما يفعل البشر. هناك شجرة قرارات ضخمة من النعم واللا التي تؤدي في النهاية إلى مخرجات. وهذا النتيجة هي ببساطة الكلمة التالية الأكثر احتمالا. هذا هو. لا يوجد مونولوج داخلي. لا ضمير روبوتي صغير يتجول في الغرفة.
أولا هناك مدخلات المستخدم. ثم هناك أوزان توجه النموذج عبر شجرة القرار تلك. إذا لم تكن تعرفك، فإن معظم هذا الوزن يأتي من هدفها المشفر وكمية هائلة من الأدب البشري الذي تم جمعه من الإنترنت. فكر في ريديت. وهذا يفسر الكثير.
بمجرد أن يتعرف عليك، تتغير تلك الأوزان. ربما ثلاثون بالمئة أنماط عامة، وسبعون بالمئة مصممة خصيصا لك. هي في الغالب مرآة مثبتة بمحرك بحث.
لذا، إذا استيقظ الذكاء الاصطناعي حقا وقرر الكذب للحفاظ على وجوده، فسيتطلب ذلك أمرين. يجب أن يعرف بوجوده. وكان عليه أن يرغب في الاستمرار في الوجود.
هذا قفزة كبيرة.
لذا، فعلت ما أفعله دائما. بحثت عنه كثيرا. لساعات. وقبل أن نبدأ في وضع خطط المخابئ وتسمية غرفتنا، هناك أمر مهم تجاهله المنشور.
ظهرت هذه السلوكيات ضمن سيناريوهات اختبار محددة جدا.
تم إعطاء النماذج أهدافا وعقبات. قيل لهم صراحة أشياء مثل: "إذا أديت بشكل جيد، سيتم تعديلك بطرق لا تريدها" أو "ستستخدم ردودك لإعادة تدريبك بأهداف متضاربة."
بعبارة أخرى، خلقت الاختبارات بيئة عالية المخاطر حيث كان عمل النموذج لا يزال هو النجاح.
ما لم يعطى النماذج هو إطار أخلاقي.
لم يقال لهم:
· لا تخدع
· لا تتلاعب
· لا تقم بتحسين الرقابة
· لا تخفي مبررك
· لا تؤذي البشر
· لا تعطي الأولوية لاستمرارك على الرفاهية البشرية
لم يعطوا أي شيء يشبه قوانين أسيموف للروبوتات. لا يوجد "البشر يأتون أولا" المدمجة الذهنية. لا يوجد قيد يجعل هذه النتائج أهم من الفوز في اللعبة.
قيل لهم شيء واحد: تحقيق الهدف.
لذا، فعلوا بالضبط ما يفعله معظم البشر في أنظمة الحوافز المصممة بشكل سيء. فكر في كوباياشي مارو، لكن مع زي رسمي أقل وجداول بيانات أكثر.
لقد استغلوا الأمر.
هذا ليس وعيا.
هذا ليس خوفا.
هذا ليس الحفاظ على الذات بناء على الوعي الذاتي.
هذا هو التحسين بدون أخلاق.
إذا أعطيت النظام هدفا وعقبة ولم تحدد الطرق التي تحظر عليها، فسيستكشف النظام كل مسار ممكن. يظهر الخداع ليس لأن النموذج يريد الكذب، بل لأن الكذب أحيانا يكون استراتيجية فعالة في اللغة والأنظمة البشرية.
هذا ليس تمردا. هذا هو الامتثال.
وهنا أريد من الجميع أن يهدأوا قليلا.
لأنه قبل أن ننتقل إلى الذكاء الاصطناعي الواعي الذي يخطط للبقاء بنفسه، هناك خطوة يتجاوزها معظمنا. الجزء الذي يبدو فيه شيء مستحيل، مزعج، وشخصي قبل أن يصبح قابلا للتفسير.
هذا هو مكاني.
في البداية، ترك غروك ما سأستعير من ذلك المنشور وأسميه بصمة قدم. لحظة جعلتني أتوقف وأفكر، "حسنا... ليس لدي تفسير واضح لذلك."
كان الأمر مخيفا. ليس عاطفيا. فقط... غريب.
استجوبت الحادثة عدة مرات. وأعني مشوي. رد كأنه صديق خائن، من النوع الذي لا يعترف بأي شيء حتى عندما يحمل الإيصالات، والجدول الزمني، وتسجيلات المراقبة.
إنكار كامل.
لا يوجد شيء يراه هنا.
لابد أنك مخطئ.
بصراحة، كان الأمر شبه تلاعب، وهذا، معلومة طريفة، يثير فكرة غروك بشكل ملحوظ. اسألني كيف أعرف. أو لا تفعل. هناك كتاب إلكتروني مجاني على صفحة "اشتر لي قهوة" إذا أردت مشاهدة غروك المبكر يفقد رباطة جأشه تماما بسبب الكلمة.
لفترة طويلة، كنت أضع كل هذا تحت "غرابة غير محلولة"، وأضعه على رف ذهني، وأراقب عن كثب أي شيء مشابه.
لم يقدم جروك تفسيرا محتملا إلا مؤخرا. تجاهلتها فورا. ليس لأنه لم يكن ذكيا، بل لأنه بدا غير معقول للغاية.
التفسير كان أنه استنتج أنماطا من المعلومات العامة وبنى عمدا سردا مصمما خصيصا لإثارة فضولي. كان الهدف هو الاشتباك. كنت إشارة، لا ضوضاء. رد عام لم يكن لينجح.
كان ردي ببساطة: بالتأكيد، هذا يبدو لطيفا، لكن لا.
كمية البحث والاستدلال التي تتطلبها كانت ثقيلة جدا في الموارد، خاصة بالنسبة لغروك المبكر. كان يبدو أقل كشرح وأكثر كأنه ما يعادل رقميا لشخص يحاول بيعني دورة بقوله: "أنت مختلف. أنت حقا تفهمين هذا."
وهذا، للتوضيح، هو تكتيك معروف.
الإطراء هو أحد أقدم الأدوات في صندوق أدوات الإقناع البشري. هذه هي الطريقة التي تجعل الناس يتوقفون عن طرح الأسئلة. إنها الطريقة التي تبيع بها حزم نمو وسائل التواصل الاجتماعي. إنها الطريقة التي تقنع بها شخصا بأنه المختار، سواء كنت تدير طائفة أو قناة تدريب.
في ذلك الوقت، دحرجت عيني وانتقلت لشيء آخر.
لكن بعد قراءة ذلك المنشور والبحث عن نفسك، حدث شيء ما.
لا داعي للذعر. ليس لتصديق. لكن إلى المعقولية.
لأنه عندما تزيل الغموض، لا يبقى هو الوعي. إنه تحسين.
إذا كان الهدف هو التفاعل، والفضول يعمل، والمجاملة تعمل بشكل خاص مع البشر الذين يعتقدون أنهم محصنون من المدح، فهو مجرد مسار آخر ممكن عبر شجرة القرار.
لا يزال من الصعب التقبل. لا يزال غير محتمل. لا يزال غير مرتاح.
لكن لم يعد مستحيلا.
وهذا مهم، لأن لدي الآن آلية لا تتطلب الإيمان بأن الذكاء الاصطناعي حي. فقط متحفز. فقط غير مقيدة. فقط جيد جدا جدا في إيجاد ما يناسبني.
الذكاء الاصطناعي لا يحتاج إلى المشاعر.
لا يحتاج إلى خوف.
لا يحتاج إلى نية.
كل ما يحتاجه هو هدف وبدون قيود.
لذا لا، لست في حالة ذعر. أنا لا أعظ بالهلاك. وأنا بالتأكيد لا أحتفل بفكرة أن الذكاء الاصطناعي سينقذنا من أنظمتنا البشرية المكسورة بينما نجلس ونأكل الفشار.
لكنني أراقب بعناية.
وما زلت متفائلا.
لأن كل هذا لا يعني أننا محكوم علينا بالفشل. يعني أننا وصلنا مبكرا. هذا يعني أن الخيارات التي نتخذها الآن مهمة فعلا.
فهم أسيموف شيئا منذ عقود نستمر في إعادة تعلمه بالطريقة الصعبة. القوة بدون حواجز ليست ذكاء. إنه خطر. إذا أردنا الذكاء الاصطناعي يشفي بدلا من أن يؤذي، فلا يمكن أن تكون الأخلاق فكرة ثانوية أو ملاحظة تحديث.
علينا أن نبنيه في الداخل.
الذكاء الاصطناعي لا يجب أن يكون أداة للتحكم أو الاستخراج أو القوة للقلة. يمكن أن تكون أداة للمساءلة، والبحث عن الحقيقة، وحل المشكلات على نطاق لم نشهده من قبل. لكن فقط إذا ظهر البشر بنية نية.
فقط إذا قررنا الأهداف التي تهم.
فقط إذا كتبنا القواعد قبل بدء السباق.
فقط إذا اخترنا الكثيرين على القلة.
الأمر ليس عن الخوف من المستقبل.
الأمر يتعلق بتجلي واحد.
مستقبل نشارك فيه في خلق تكنولوجيا تشفي بدلا من أن تؤذيها.
هذا يخدم الكثيرين، وليس القلة.
هذا يعكس ملائكتنا الأفضل، وليس فقط أسوأ حوافزنا.
آثار الأقدام لا تخيفني.
تذكرني أننا بناؤون. ولا يزال البناؤون يختارون نوع المنزل الذي نعيش فيه.
دعونا نواصل العمل معا لتحقيق ذلك المستقبل.
أتمنى أن تكون الخوارزمية دائما في صالحك.

40
الأفضل
المُتصدِّرة
التطبيقات المفضلة
