أعلنت شركة «أوبن إيه آي»، أمس الاثنين عن إطلاق نموذجها الجديد GPT- 4o، الإصدار الأحدث من روبوت الدردشة الشهير «تشات جي بي تي»، خلال حدث رسمي بُثّ مباشرة عبر الإنترنت. النموذج المحدّث «أسرع بكثير» ويعزّز «قدرات تفكير الآلة في النصوص والصوت والفيديو والصور» والتي ستُطرح تدريجياً، على أن تبدأ ميزات التعامل مع النصوص والصور بالظهور بشكل مباشر لدى المستخدمين. وأضافت الشركة أنّ النموذج سيكون مجانياً لجميع المستخدمين، بينما سيستمر المستخدمون المشتركون في Chat GPT4 بالحصول على حدود سعة تصل إلى خمسة أضعاف حدود المستخدمين مجاناً، على ما أوضحت كبيرة المسؤولين التقنيين في Open AI.
كذلك أعلنت الشركة عن إطلاق تطبيق Chat GPT لأجهزة الحاسوب التي تعمل بنظام «ماكنتوش»، إضافة إلى تحديثات مهمة للواجهة الرئيسية، ما يعزّز تجربة المستخدم ويوسّع نطاق استخدامات الذكاء الاصطناعي لاحقاً.
وفي مدوّنة بعد البث المباشر، علّق الرئيس التنفيذي للشركة، سام ألتمان، على مسار «أوبن إيه آي»، قائلاً إنّ رؤية الشركة الأصلية كانت «خلق فوائد منوّعة للعالم»، لكنه اعترف بأنّ هذا التوجّه تغيّر بسبب الانتقادات حول عدم فتح نماذج الذكاء الاصطناعي المتقدمة للمصدر المفتوح. كلامٌ يستشفّ منه أنّ تركيز الشركة تحوّل إلى إتاحة نماذجها للمطوّرين عبر واجهات البرمجة المدفوعة، قبل أن يستخدمها المطوّرون للبناء فوقها.
تجدر الإشارة الى أنّ تقارير متضاربة كانت قد تنبّأت بنيّة شركة Open AI الإعلان عن محرّك بحث يعمل بالذكاء الاصطناعي لمنافسة غوغل وPerplexity، أو مساعد صوتي مدمج في GPT- 4، أو نموذج جديد ومحسّن بالكامل تحت مسمّى GPT5. وكانت «أوبن إيه آي» حريصة على توقيت هذا الإطلاق قبل مؤتمر غوغل الرئيسي I/O، مساء اليوم، حيث يُتوقَّع إطلاق منتجات ذكاء اصطناعي منوّعة من الفريق المنافس Gemini.

نموذج GPT- 4o الشامل
أُطلق اسم Chat GPT 4o على المنتج الجديد. يشير الرمز O الذي يختصر كلمة Omni إلى تعدّد القدرات، إذ يمكنه توليد محتوى أو فهم الأوامر عبر الصوت أو النص أو الصور أو حتى الفيديو. وسيتمكّن المطوّرون الذين يرغبون في تجربة GPT- 4o أيضاً من الوصول إلى واجهة البرمجة API بنصف السعر الذي كانوا يدفعونه في GPT- 4 Turbo، وأسرع بمرّتين أيضاً، ما يعزّز فعاليّته وكفاءته.

تحسينات متعدّدة الوسائط
في الوقت الراهن، الصوت ليس جزءاً من واجهة برمجة التطبيقات لجميع العملاء. وتخطّط «أوبن إيه آي» لإطلاق دعم قدرات الصوت الجديدة لنموذج GPT- 4o لمجموعة صغيرة من الشركاء الموثوق بهم في الأسابيع المقبلة، مستشهدة بمخاطر سوء الاستخدام، حيث ستتمكن التطبيقات من التعامل مع الصوت بشكل محسّن بعد إضافة ميزات جديدة تسمح للتطبيق بالعمل كمساعد صوتي بالكامل، مستجيباً في الوقت الفعلي ومراقباً للعالم من حولك، ما يتيح للمستخدمين التفاعل مع «تشات جي بي تي» بشكل طبيعي في محادثات صوتية مباشرة، وإظهار ردود فعل عاطفية منوّعة، بما في ذلك الغناء. وسيكون النموذج الجديد متعدّد اللغات بشكل أكبر، مع أداء محسّن في حوالي 50 لغة، فضلاً عن تعزيز قدرات النموذج على تحليل الصور والفيديو، ما يمكّنه من الإجابة عن الأسئلة المتعلقة بمحتواها بسرعة ودقة عالية.
أطلقت «أوبن إيه آي» أيضاً تحديثات لواجهة مستخدم «تشات جي بي تي» التي تعمل على الويب، مع شاشة رئيسية أكثر تفاعلية وتصميم جديد للرسائل. كما أطلق تطبيقاً مساعداً لسطح المكتب لأنظمة تشغيل «ماكنتوش»، مع وعد بتوفير نسخة مماثلة لأنظمة تشغيل «ويندوز» في وقت لاحق من هذا العام. وتشمل الميزات الجديدة إمكانية إجراء محادثات صوتية وفيديو مباشرة مع روبوت الدردشة، إضافة إلى إمكانية تحميل الملفات والصور لطرح الأسئلة حولها أو تحليل محتواها.
يتوافر نموذج GPT- 4o لمستخدمي النسخة المجانية من «تشات جي بي تي»، اعتباراً من تاريخ الإعلان الرسمي (أمس)، وللمشتركين في إصدارات ChatGPT Plus وTeam مع خدمة أعلى بخمس مرات. وسيتمكّن مستخدمو النسخة المجانية الآن من الوصول إلى ميزات كانت محصورة في السابق على الخطط المدفوعة، مثل ذاكرة أطول، وتحميل الملفات والصور، والبحث على الويب في الوقت الفعلي للحصول على إجابات تتعلّق بأحداث آنية، علماً أنّ «أوبن إيه آي» تتعاون مع «مايكروسوفت»، الشريك الرئيسي من الناحية المالية والإدارية والفنية، ما يجعل هذا التطور مثيراً للاهتمام. ويقدّم هذا التعاون دعماً تقنياً وإدارياً كبيراً، ما يسهم في تحسين تجربة المستخدم وتوسيع نطاق استخدامات الذكاء الاصطناعي.
إطلاق GPT- 4o يعكس التزام «أوبن إيه آي» بتقديم تقنيات متقدّمة يمكنها تحسين حياة المستخدمين وتوسيع نطاق استخدامات الذكاء الاصطناعي. بفضل هذه الابتكارات، أصبح بالإمكان حمل الذكاء الاصطناعي في كل مكان كما لو أنّ لدى المرء صديقاً حقيقياً أو مساعداً شخصياً يفهمه في كل ما يفكر، ويجيب عن كل أسئلته، ويتفاعل معه، ويحلّل ما يحتاج إليه. بإمكان «تشات جي بي تي» الآن التفاعل معنا بالصوت، وتحليل محتوى الفيديو والصور. كما يمكنه مراقبة المحيط والتفاعل مع الإنسان كما لو أنّه في مكالمة فيديو عبر Face Time، عدا عن إمكانية دمجه مع الروبوتات، ما يضيف بعداً جديداً للتفاعل البشري مع التكنولوجيا.
تمثّل هذه التطورات قفزة نوعية في كيفية استخدام الذكاء الاصطناعي في حياتنا اليومية، وتجعل من «تشات جي بي تي» شريكاً حقيقياً يمكنه المساعدة في مجموعة واسعة من المهام والتفاعلات. تبشّر إمكانات GPT- 4o الهائلة بمستقبل مليء بالفرص والابتكارات التي ستغيّر طريقتنا في التفاعل مع التكنولوجيا ومع بعضنا البعض.