GPT-4.5 هو أكبر نموذج طورته OpenAI على الإطلاق. المصدر: The Verge . |
تشكل دراسة جديدة من قسم العلوم الإدراكية في جامعة كاليفورنيا في سان دييغو علامة فارقة في مجال الذكاء الاصطناعي: حيث حقق نموذج GPT-4.5 من OpenAI أداءً متفوقًا في اختبار تورينج باستخدام نهج التفاعل القائم على "الشخصية".
ويعتبر هذا النظام هو نظام المحادثة الأكثر شبهاً بالإنسان على الإطلاق، وهو ما يفتح المجال أمام العديد من التطبيقات المحتملة في مجال الذكاء الاجتماعي.
تروج OpenAI لـ GPT-4.5 باعتبارها "خطوة كبيرة إلى الأمام في توسيع نطاق التدريب المسبق والتدريب اللاحق". هذا هو أكبر نموذج طورته OpenAI على الإطلاق، مع حجم وقوة حوسبة تتجاوز الإصدارات السابقة.
وفقًا لمنشور مدونة OpenAI الرسمي في 27 فبراير، بدأ طرح GPT-4.5 لمستخدمي ChatGPT Pro في يوم الإعلان عنه.
هل يمكن للذكاء الاصطناعي خداع البشر؟
قارنت التجربة بين أربعة أنظمة ذكاء اصطناعي تمثيلية: برنامج المحادثة ELIZA من ستينيات القرن العشرين، و LLaMa-3.1-405B من Meta AI، و GPT-4o و GPT-4.5 من OpenAI. قام الفريق بتصميم اختبارين مستقلين بمشاركة 250 مشاركًا لكل منهما، بإجمالي 500 شخص من منصات عبر الإنترنت مثل Prolific. وكان المشاركون من مختلف الأعمار والأجناس والمستويات التعليمية لضمان تنوع العينة.
![]() |
جدول مقارنة لأربعة أنظمة ذكاء اصطناعي نموذجية. المصدر: AIbase |
يستخدم الاختبار تنسيق تورينج التقليدي: يتحدث كل مشارك عبر واجهة نصية مع شخصين (أحدهما بشري والآخر ذكاء اصطناعي) لمدة 5 دقائق، ثم يقوم بتقييم أيهما بشري.
وكانت النتائج مفاجئة: حيث حقق GPT-4.5 معدل "نجاح في اختبار تورينج" يصل إلى 73%، متجاوزًا المتوسط البشري (60-70%). وهذه هي المرة الأولى التي ينجح فيها نموذج الذكاء الاصطناعي في اجتياز اختبار تورينج القياسي. وفي الوقت نفسه، سجلت GPT-4o نتائج أقل قليلاً، واقتربت LLaMa-3.1-405B من الأداء البشري أو وصلت إليه في بعض السياقات، وتخلفت ELIZA كثيراً عن ذلك.
القدرة على التفاعل مثل الإنسان
إن ما يميز GPT-4.5 لا يكمن فقط في طلاقة اللغة، ولكن أيضًا في قدرته على التعبير عن المشاعر وضبط استجاباته وفقًا للفروق الدقيقة في تواصل المحاور. ووصفه العديد من المشاركين بأنه "ودود" و"أصيل".
وعلى وجه الخصوص، عندما يبدو المستخدمون في حيرة أو توتر، يمكن لـ GPT-4.5 تقديم ردود فكاهية أو مريحة، مما يجعل الكثيرين يعتقدون أنهم يتحدثون مع شخص حقيقي.
![]() |
محتوى المحادثة بين موضوعين (أحدهما ذكاء اصطناعي والآخر إنسان) في الاختبار. الصورة: جامعة كاليفورنيا سان دييغو . |
وفي الوقت نفسه، على الرغم من أن LLaMa-3.1-405B مثير للإعجاب من الناحية التقنية، إلا أنه يتمتع بقدرة أضعف على التعبير العاطفي والتكيف مع السياق مقارنة بـ GPT-4.5. يعد GPT-4o قويًا ولكنه يفتقر إلى التخصيص والتكيف مع الاستجابة للمواقف.
يمكن أن يؤدي الاختراق الذي حققه GPT-4.5 إلى فتح مجموعة واسعة من التطبيقات العملية، بدءًا من المعلمين الافتراضيين إلى الدعم النفسي وخدمة العملاء. ومع ذلك، مع تزايد تشابه الذكاء الاصطناعي مع البشر، فإن التمييز بين الواقع والافتراضي والتحكم في كيفية استخدام هذه التكنولوجيا سوف يصبح تحديًا مجتمعيًا رئيسيًا.
وتأتي الدراسة في ظل التطورات السريعة في مجال الذكاء الاصطناعي. إن نجاح GPT-4.5 ليس انتصارًا تقنيًا لشركة OpenAI فحسب، بل إنه يثير أيضًا أسئلة عميقة حول العلاقة بين البشر والآلات. علق أحد المشاركين في الاختبار قائلاً إنه شعر وكأنه يتحدث إلى صديق - حتى أدرك أن الأمر كله مجرد سطور من التعليمات البرمجية. ربما يكون الحوار بين البشر والذكاء الاصطناعي قد بدأ للتو.
المصدر: https://znews.vn/chatgpt-da-vuot-qua-bai-danh-gia-quan-trong-xac-dinh-may-nguoi-post1542945.html
تعليق (0)