
شات جي بي تي 5
كشفت دراسة حديثة أن نظرة نماذج الذكاء الاصطناعي إلى طريقة تفكير البشر قد تكون أكثر تفاؤلًا من الواقع. إذ أظهرت النتائج أن روبوتات الدردشة الشائعة، مثل «شات جي بي تي» من «أوبن إيه آي» و«كلود» من «أنثروبيك»، تميل إلى افتراض أن البشر يتصرفون بعقلانية ومنطقية أعلى مما يحدث فعليًا، خاصة في المواقف التي تتطلب تفكيرًا استراتيجيًا معقدًا.
وأشار الباحثون إلى أن هذا الخلل في التقدير قد يؤثر على دقة توقعات الذكاء الاصطناعي لسلوك البشر، لا سيما في مجالات حساسة مثل الاقتصاد واتخاذ القرار، حيث يلعب العامل البشري غير العقلاني دورًا كبيرًا.
واعتمدت الدراسة على اختبار نماذج متعددة، من بينها «GPT-4o» و«Claude Sonnet 4»، باستخدام إطار نظرية الألعاب الكلاسيكية المعروفة باسم «مسابقة الجمال الكينزية»، وهي تجربة توضّح كيفية محاولة الأفراد توقّع قرارات الآخرين بدلًا من الاعتماد على تفضيلاتهم الشخصية فقط.
وفي إحدى التجارب، شاركت النماذج في لعبة «خمن الرقم»، حيث يختار كل لاعب رقمًا بين صفر ومئة، ويفوز من يكون اختياره الأقرب إلى نصف متوسط اختيارات الجميع. وطُلب من نماذج الذكاء الاصطناعي اختيار الرقم المناسب وشرح منطقها في الاختيار، بعد تزويدها بأوصاف مختلفة لمنافسيها البشر، تراوحت بين طلاب جامعيين مبتدئين وخبراء في نظرية الألعاب.
وأظهرت النتائج أن النماذج عدّلت قراراتها بناءً على مستوى الخبرة المفترض لمنافسيها، لكنها في معظم الحالات بالغت في تقدير عمق التفكير المنطقي لدى البشر. ونتيجة لذلك، كانت «تلعب بذكاء زائد» مقارنة بالواقع، ما أدى أحيانًا إلى نتائج أقل دقة من تلك التي يحققها اللاعبون البشر الفعليون.
وتخلص الدراسة إلى أن تحسين أداء الذكاء الاصطناعي في التنبؤ بالسلوك البشري يتطلب فهمًا أعمق لحدود العقلانية البشرية، وليس فقط الاعتماد على النماذج النظرية المثالية.