يعود تاريخ «الذكاء الاصطناعي» إلى الخمسينيات حين بدأ العلماء لأول مرّة في استكشاف فكرة إنشاء آلات يمكنها التفكير والتعلّم مثل البشر. ركّزت أبحاث الذكاء الاصطناعي المبكرة على إنشاء أنظمة قائمة على القواعد، وجرت برمجة الآلة بمجموعة قواعد لاتباعها من أجل إكمال المهمة. وفي الستينيات والسبعينيات، تحوّلت أبحاث الذكاء الاصطناعي نحو فكرة إنشاء «أنظمة خبيرة» صُمّمت لتقليد قدرات صنع القرار للخبراء في مجالات محدّدة. أدّى ذلك إلى تطوير تطبيقات الذكاء الاصطناعي المبكرة في مجالات مثل الطب والتمويل. أما في الثمانينيات والتسعينيات، فقد تحوّلت أبحاث الذكاء الاصطناعي نحو استخدام التعلّم الآلي (Machine Learning)، فيتم تدريب الآلة على مجموعة بيانات بدلاً من أن تكون مبرمجة بشكل صريح بقواعد. سمح ذلك بتطوير تطبيقات الذكاء الاصطناعي الأكثر تعقيداً، مثل التعرّف إلى الصور والتعرّف إلى الكلام. في السنوات الأخيرة، أدّى تطوير تقنيات التعلّم العميق (Deep Learning)، ولا سيما في شكل الشبكات العصبية، إلى تجديد الاهتمام بالذكاء الاصطناعي وتحقيق تقدم كبير في هذا المجال. أدّى ذلك إلى تطوير نماذج مثل ChatGPT اختصاراً لـ«Chat Generative Pre-training Transformer»، وهو نموذج لغوي كبير تم تطويره بواسطة شركة متخصّصة بالذكاء الاصطناعي تُسمى OpenAI. يمكن أن يشمل ذلك مهام حلّ المشكلات واتّخاذ القرار والتعلّم من التجربة. أُصدر هذا النموذج لأول مرة في عام 2018، ومنذ ذلك الحين تم ضبطه ليناسب العديد من المهام المتعلّقة باللغة. الجدير بالذكر، أننا أمام «سلوك ذكي» وليس ذكاءً خالصاً بحدّ ذاته.
وكأي نموذج لغوي آخر، تم تدريبه على بيانات ضخمة من محتوى النصوص المنشأة من قبل البشر، ليقوم بعدها النموذج بإنشاء استجابات أو ردود، بناءً على الأنماط التي تعلّمها من هذه البيانات. ويمكن للنموذج القيام بمهام مثل الترجمة وتلخيص النصوص والإجابة على الأسئلة وكتابة الأكواد البرمجية. وهو يستخدم بنية شبكة عصبية قائمة على المحوّلات، والتي أثبتت فعاليتها في مهام معالجة اللغة الطبيعية.
هكذا، تصبح نوعية البيانات التي يتدرّب النموذج عليها ذات أهمية جوهرية. ورغم المميزات الكثيرة التي يقدمها هذا النموذج، إلا أنه تبقى النقطة الأبرز، أن هذه البيانات قد تحتوي على تحيّزات إيديولوجية. مثلاً إذا كانت بيانات التدريب تحتوي على الكثير من النصوص ذات منظور سياسي أو اجتماعي معين، فمن المرجح أن يولّد النموذج استجابات وردوداً تتماشى مع هذا المنظور.
ومثالٌ على هذه التحيزات، ربط هذا النموذج مهناً معينة بالنساء كالممرضة أو السكرتيرة، وخصّص مهناً أخرى للرجال كالطبيب أو المدير التنفيذي. أو قد يستخدم لغة النوع عند الإشارة إلى الأشخاص في أدوار معينة، مثل استخدام «هو» عند الإشارة إلى الطبيب و«هي» عند الإشارة إلى الممرضة. إضافة إلى أنه قد يقدّم وصفاً نمطياً للمرأة بأنها «عاطفية» وللرجل بأنه «عقلاني».
أضف إلى ذلك، يمكن أن يستخدم النموذج لغة هجومية أو لغة مسيئة أو نمطية عند الإشارة إلى مجموعات عرقية أو إثنية معينة. أو حتى عند وضع افتراضات حول ذكاء الشخص أو قدراته أو شخصيته بناءً على عرقه أو وضعه الاجتماعي والاقتصادي. إضافة الى استخدام عبارات عنصرية أو خطاب كراهية عند الإشارة إلى مجموعات معينة من الأشخاص. قد يستخدم النموذج، أيضاً، لغة أو تعبيرات خاصة بطبقة اجتماعية معينة، أو الإشارة إلى مستوى معيّن من التعليم أو الثقافة أو أسلوب حياة شخص ما، بناءً على خلفيته أو اللغة التي يستخدمها.
قد يكون للنموذج أيضاً انحياز تجاه إيديولوجية سياسية معينة مثل الليبرالية أو المحافظة، أو تجاه حزب سياسي معيّن مثل الجمهوريين أو الديمقراطيين، أو تجاه أو ضدّ سياسات معينة أو قضايا سياسية مثل الهجرة أو الرعاية الصحية أو تغير المناخ، أو تجاه منظور اجتماعي أو أخلاقي معيّن مثل حقوق النساء أو حقوق المثليين. أو عرضه لوجهة نظر أحادية الجانب للقضايا الاجتماعية مثل الفقر أو التعليم أو الرعاية الصحية، أو للقضايا الأخلاقية مثل الذكاء الاصطناعي أو حيازة الأسلحة أو الخصوصية. ناهيك بإمكانية تحيّزه تجاه دين معيّن أو ضدّه، كأن يستخدم لغة أو حججاً تتوافق مع أو ضدّ عقيدة أو إيديولوجية دينية معينة، أو يقدم الصور النمطية أو السلبية لمجموعات دينية معينة. يمكن أن يتجلى هذا في ردود النموذج، من خلال استخدام اللغة أو الحجج التي تتوافق مع تلك الإيديولوجية باستمرار.
وفي معرض الدفاع الذي قدّمه ChatGPT بشأن شبهة التحيز تجاه طريقة صندوق النقد الدولي على حساب المدارس الاقتصادية الأخرى في ما يخصّ مقاربة الحلّ الذي قدّمه للأزمة المالية في لبنان، قال الآتي: «من المحتمل أن يكون الحلّ الذي قدّمته متوافقاً مع طريقة صندوق النقد الدولي (IMF) كون هذا النهج معروفاً وموثوقاً به جيداً. لقد تعلّمته من بيانات التدريب». وأكمل شارحاً: «إن نهج صندوق النقد الدولي يميل إلى حلّ الأزمات المالية نحو التركيز على التقشّف المالي والإصلاحات الهيكلية وإعادة هيكلة الديون، وهو معترف به على نطاق واسع باعتباره النهج القياسي». وعند سؤاله عن مدى إمكانية اعتماد مدارس اقتصادية أخرى لحلّ الأزمة المالية في لبنان، أجاب: «من المهم أن نلاحظ أن نهج صندوق النقد الدولي ليس هو الوحيد، وقد تكون للمدارس الفكرية الاقتصادية المختلفة وجهات نظر مختلفة حول أفضل طريقة لحل الأزمات المالية». واعتبر أنه «عدم تقديم حلول وفقاً للمدارس الاقتصادية الأخرى، لا يعني بالضرورة أن لديه تحيّزاً إيديولوجياً، بل قد يكون انعكاساً للبيانات التي تم تدريب النموذج عليها».
نحن أمام نموذج وظيفته الأساسية إنشاء نصّ بلغة البشر بناءً على البيانات التي تدرّب عليها والتي قد تحتوي على أخطاء أو تحيّزات


ونظراً إلى مصادر وشكل البيانات التي تدرّب عليها النموذج، يتبيّن أنه تدرّب على بيانات من مصادر متعدّدة على شبكة الإنترنت غالبيتها من موقع «Common Crawl» الذي يحتوي على أرشيف كبير من مواقع الويب، بالإضافة إلى مصادر أخرى مثل منصّة ويكيبيديا، ومن الكتب والدوريات والمقالات العلمية المتوافرة. علماً أنه يتم استخدام نموذج ChatGPT حالياً من قبل الكثيرين لمساعدتهم في صناعة المحتوى وكتابة المقالات الصحافية والمنشورات العلمية.
إذاً نحن أمام نموذج تتمثل وظيفته الأساسية في إنشاء نصّ بلغة البشر، بناءً على البيانات التي تدرّب عليها، والتي قد تحتوي على أخطاء أو تحيّزات. يعيد هذا النموذج إنتاج المعلومات ذاتها، ويكرّرها بصيغ وعبارات مختلفة ومتنوعة على شكل «مقتطفات معرفية» أو «ملخّصات معرفية»، من دون إمكانية إنتاج أو تقديم معرفة جديدة، أو فهم العالم بالطريقة التي يقوم بها البشر. فماذا لو أصبحت هذه المعلومات التي ينتجها النموذج هي ذاتها البيانات التي يمكن أن يتدرب عليها في المستقبل؟ فإذا تم استخدام مخرجات النموذج كمدخلات مرّة أخرى، وتدريب النموذج عليها، قد يؤدي ذلك إلى أن يصبح النموذج متناسباً جداً مع تلك البيانات المحددة، وقد يبدأ في إنشاء مخرجات متكرّرة أو غير منطقية، ويكون قد تدرّب تحديداً على إنتاج ذات المخرجات التي تم إنشاؤها مسبقاً. هكذا، نصبح أمام تركّز فظيع في التوجّه المعرفي والإيديولوجي، ويصبح هذا الكم الكبير من البيانات المكرّرة هو من يحدّد شكل معرفتنا. أو كما يقول علماء البيانات «Garbage In Garbage Out».

* أستاذ جامعي، مستشار مالي، ومحلل بيانات