واصلت OpenAI إثارة الحوار في صناعة الذكاء الاصطناعي بإطلاقها قبل أسبوعٍ اثنين من أحدث إصداراتها: النموذج الرئيسي o3 والإصدار المصغر o4-mini، واصفةً إياهما بأنهما “أذكى النماذج التي طورناها حتى الآن”. ومع ذلك، لا تزال أسئلة عديدة تلوح حول مدى انتظام أدائهما وقدرتهما على تحقيق نتائج قابلة للتنبؤ، بعدما حققا أرقامًا قياسية في بعض المهام وتراجع مستوى أدائهما في أخرى.
أظهر نموذج o3 تفوّقًا لافتًا في التفكير المنطقي مقارنةً بسابقاته. فقد صُمم ليسرد خطوةً بخطوة كيفية إنجاز مهمةٍ معقّدة، بدءًا من التخطيط وصولًا إلى التنفيذ وبرمجيات التحكّم وشرح منهجيّته. كما يمكنه إجراء بحثٍ مستقل على الويب، واستخدام أدواتٍ رقمية خارجية دون الحاجة إلى إشرافٍ بشري فوري، ما يشكل قفزة نوعية في مفهوم “الذكاء الاصطناعي الوكيل”.
إيلون ماسك يقدم عرضاً بقيمة 97 مليار دولار للسيطرة على OpenAI.. وسام ألتمان يعرض شراء منصة X
— CNBC Arabia (@CNBCArabia) February 11, 2025
مع رلى الطراونةhttps://t.co/NTcLiKgSsI pic.twitter.com/6uy8zij03z
في مجال المهام التقليدية للذكاء الاصطناعي، كالكتابة الإبداعية، والرسم التوضيحي، والحساب الدقيق، حتى البرمجة المعقدة، وجد المراجعون في o3 أداءً متينًا بل ومطوّرًا في بعض النواحي. كما دخلت قدراته البصرية منعطفًا جديدًا بعد أن أثبت النموذج قدرته على “قراءة” الصور الرقمية تقريبًا وتحديد موقع التقاطها، وهي ميزة قد تثير مخاوفٍ بشأن الخصوصية.
وهاجم المطور سيمون ويلسون تعليقاته عن أهمية هذا التطور، قائلاً:“إتاحة عمليات البحث كجزءٍ من التفكير المنطقي قبل توليد الإجابة نهائيًا يعدّ ثورةً في طريقة عمل هذه النماذج.
اقرأ أيضاً: للشراكة في الذكاء الاصطناعي.. أوبن إيه آي وميتا تفاوضان شركة هندية
فيما عبّر دان شيبر من منصة Every عن إعجابه بقوله:“هذه أقوى لحظة انبهار شعرت بها مع نموذج OpenAI جديد منذ GPT-4.”
كما وصف المدون الاقتصادي تايلر كوين o3 بأنه بادرة للذكاء الاصطناعي العام:“أعتقد بجدية أننا أمام ذكاء اصطناعي عام… ربما يشبه الأمر المواد الإباحية: أعرفه عندما أراه، وقد رأيته بالفعل.”
على الرغم من هذه الإشادات، يواجه نموذج o3 انتقاداتٍ جدّية تتعلق بدقته ومصداقيته. ففي تجربة مستقلة حول التحليل المالي، احتل o3 المرتبة الأولى من حيث نطاق التغطية، لكنه حقق إجابات صحيحة بنسبة 48.3% فقط، مع ارتفاع تكلفة الاستعلام إلى 3.69 دولار لكل عملية—أعلى بكثير من أي نموذج سابق .
وفي سياقٍ داخلي، اعترفت OpenAI بأن o3 لا يزال يعاني من “ميل إلى الهلوسة” (hallucination)، حيث ينتج إجاباتٍ خاطئة أو مفبركة أكثر من النموذج o1 بمعدلٍ يزيد عن الضعف. ومع ذلك، يظل o3 قادرًا على الإجابة عن عددٍ أكبر من الأسئلة وأكثر دقةً من سابقه، ما دفع الشركة للقول:“هناك حاجة إلى المزيد من الأبحاث لفهم أسباب ارتفاع معدل الخطأ.
اقرأ أيضاً: رسمياً.. OpenAi ترفض استحواذ ماسك: لم يكن عرضاً على الإطلاق
يرى بعض الخبراء أن هذا التناقض بين الأداء الفائق في بعض المهام والرهيب في أخرى يمثل “حدودًا وعرة” (rugged frontier) لتقنيات الذكاء الاصطناعي. ففي بعض السيناريوهات يكون النموذج غير موثوقٍ تمامًا، بينما يتجاوز التوقعات في مهامٍ أخرى.
يرى المحلل إيثان موليك أن أحدث نماذج OpenAI، رغم إمكانياتها اللافتة، تمثل “قفزةً نوعية” في تاريخ الذكاء الاصطناعي، سواء أطلقنا عليها صفة “عام” أم لا. خصائصها الوكيلية (agentic)، إلى جانب عدم انتظام أدائها، ترسم ملامح تقنيةٍ جديدة لا يشبهها شيءٌ سبقها.
ومع ذلك، يظل تطوير الذكاء الاصطناعي يتسم بالغموض:
فقد قضى صانعو البرمجيات على مدار عقودٍ في تحسين موثوقية برامجهم وقابليتها للتوسع والتكرار،
بينما لا يزال بناء وتدريب نماذج الذكاء الاصطناعي عمليةً أكثر شبهاً بتربية طفل يتعلم تدريجيًا، وليس هندسة جسرٍ قابلٍ للتوقع.
تابعونا على منصات التواصل الاجتماعي