اجتياز الاختبار - إذا كانت الذكاء الاصطناعي يجعل اختبار تورنج قديمًا ، فما هو الأفضل؟

إذا كانت الآلة أو برنامج الذكاء الاصطناعي يتفوق على الذكاء البشري أو يضاهيه ، هل يعني ذلك أنه يمكنه محاكاة البشر بشكل مثالي؟ إذا كان الأمر كذلك ، فماذا عن التفكير – قدرتنا على تطبيق المنطق والتفكير بشكل منطقي قبل اتخاذ القرارات؟ كيف يمكننا تحديد ما إذا كان برنامج الذكاء الاصطناعي يمكنه التفكير؟ لمحاولة الإجابة على هذا السؤال ، اقترح فريق من الباحثين إطارًا جديدًا يعمل مثل الدراسة النفسية للبرمجيات.

إطار الاختبار الجديد

يقوم هذا الاختبار بمعاملة برنامج “ذكي” كمشارك في دراسة نفسية ويتكون من ثلاث خطوات: (أ) اختبار البرنامج في مجموعة من التجارب التي تفحص استدلالاته ، (ب) اختبار فهمه لطريقة تفكيره الخاصة ، و (ج) فحص ملاءمة المعرفة المعرفية للبرنامج إذا كان ذلك ممكنًا” ، يشير الباحثون.

ما هو الخطأ في اختبار تورنج؟

خلال اختبار تورنج ، يقوم المقيمون بلعب ألعاب مختلفة تنطوي على التواصل القائم على النصوص مع بشر حقيقيين وبرامج الذكاء الاصطناعي (الآلات أو الروبوتات الدردشة). إنه اختبار أعمى ، لذا لا يعرف المقيمون ما إذا كانوا يراسلون إنسانًا أو روبوت دردشة. إذا نجحت برامج الذكاء الاصطناعي في توليد ردود تشبه البشر – إلى درجة تجعل المقيمين يكافحون للتمييز بين الإنسان وبرنامج الذكاء الاصطناعي – يعتبر أن الذكاء الاصطناعي قد اجتاز الاختبار. ومع ذلك ، نظرًا لأن اختبار تورنج يعتمد على التفسير الذاتي ، فإن هذه النتائج أيضًا ذات طابع شخصي.

قيود اختبار تورنج

يشير الباحثون إلى أن هناك العديد من القيود المرتبطة بـ اختبار تورنج. على سبيل المثال ، أي من الألعاب التي تم لعبها خلال الاختبار هي ألعاب تقليدية مصممة لاختبار ما إذا كانت الآلة قادرة على تقليد الإنسان أم لا. يتخذ المقيمون قرارات فقط استنادًا إلى اللغة أو نغمة الرسائل التي يتلقونها. يتميز ChatGPT بالقدرة على تقليد لغة الإنسان ، حتى في الردود التي يقدم فيها معلومات غير صحيحة. لذا ، فإن الاختبار لا يقيم قدرة الآلة على التفكير والقدرة المنطقية.

نتائج اختبار تورنج أيضًا لا يمكن أن تخبرك ما إذا كانت الآلة قادرة على التفكير الداخلي. غالبًا ما نفكر في أفعالنا السابقة ونتأمل في حياتنا وقراراتنا ، وهي قدرة حاسمة تمنعنا من تكرار نفس الأخطاء. والشيء نفسه ينطبق على الذكاء الاصطناعي أيضًا ، وفقًا لدراسة من جامعة ستانفورد التي تشير إلى أن الآلات التي يمكنها التفكير الذاتي هي أكثر فعالية للاستخدام البشري.

“وكلاء الذكاء الاصطناعي الذين يمكنهم الاستفادة من الخبرة السابقة والتكيف بشكل جيد من خلال استكشاف بيئات جديدة أو متغيرة سيؤدي إلى تقنيات أكثر تكيفًا ومرونة ، من الروبوتات المنزلية إلى أدوات التعلم الشخصية” ، قال نيك هابر ، أستاذ مساعد من جامعة ستانفورد ولم يشارك في الدراسة الحالية.

بالإضافة إلى ذلك ، يفشل اختبار تورنج في تحليل قدرة برنامج الذكاء الاصطناعي على التفكير. في تجربة تورنج الأخيرة ، تمكن GPT-4 من إقناع المقيمين بأنهم يراسلون بشرًا بنسبة تزيد عن 40 في المائة من الوقت. ومع ذلك ، فإن هذه النتيجة لا تجيب على السؤال الأساسي: هل يمكن لبرنامج الذكاء الاصطناعي التفكير؟

قال ألان تورنج ، العالم البريطاني الشهير الذي ابتكر اختبار تورنج: “سيستحق الكمبيوتر أن يسمى ذكيًا إذا كان قادرًا على خداع إنسان وجعله يعتقد أنه إنسان”. اختباره يغطي جانبًا واحدًا فقط من الذكاء البشري ، وهو التقليد. على الرغم من أنه من الممكن خداع شخص ما باستخدام هذا الجانب الواحد ، إلا أن العديد من الخبراء يعتقدون أن الآلة لن تتمكن أبدًا من تحقيق الذكاء البشري الحقيقي دون تضمين تلك الجوانب الأخرى.

“من غير الواضح ما إذا كان اجتياز اختبار تورنج هو إنجاز ذو مغزى أم لا. إنه لا يخبرنا بأي شيء عن قدرة النظام على القيام بأعمال معينة أو فهمه لأي شيء أو ما إذا كان قد أنشأ حوارًا داخليًا معقدًا أو يمكنه الانخراط في التخطيط على المدى الزمني المجرد ، وهو أمر أساسي للذكاء البشري” ، قال مصطفى سليمان ، خبير في الذكاء الاصطناعي ومؤسس DeepAI ، لـ Bloomberg.

Source: https://arstechnica.com/ai/2023/12/do-ai-improvements-call-for-something-better-than-the-turing-test/?comments=1

اجتياز الاختبار – إذا كانت الذكاء الاصطناعي يجعل اختبار تورنج قديمًا ، فما هو الأفضل؟

إطار الاختبار الجديد

ما هو الخطأ في اختبار تورنج؟

قيود اختبار تورنج

أقرأ ايضا

Comments

رد واحد على “اجتياز الاختبار – إذا كانت الذكاء الاصطناعي يجعل اختبار تورنج قديمًا ، فما هو الأفضل؟”

اترك تعليقاً إلغاء الرد