في تطور تكنولوجي مثير، أعلنت شركة جوجل عن إطلاق نموذج الذكاء الاصطناعي الجديد (PaliGemma 2)، الذي يُعتبر خطوة متقدمة نحو فهم أعمق للعالم المرئي، هذا النموذج قادر على تحليل الصور بشكل معقد، ليس فقط بتحديد الأجسام والأشخاص، بل يمتد ليشمل وصف الأفعال والمشاعر التي تعبر عنها الوجوه في الصور.
يأتي هذا التطور ليقربنا أكثر من الذكاء الاصطناعي القادر على تفسير مشاعر البشر من خلال الصورة، وهو ما يثير العديد من التساؤلات حول مدى دقة هذه التكنولوجيا وإمكانية تأثيرها في حياتنا اليومية.
في منشور نشرته الشركة عبر مدونتها، أوضحت جوجل أن نموذج (PaliGemma 2) قادر على توليد أوصاف تفصيلية للصور تتجاوز مجرد التعرف على الكائنات، بل يمكنه الآن تقديم وصف للأفعال التي يقوم بها الأشخاص وكذلك المشاعر التي يعبرون عنها، إضافة إلى السياق العام للصورة، مما يعني أننا نقترب من مرحلة يكتسب فيها الذكاء الاصطناعي قدرة على “فهم” الصور بنفس الطريقة التي يفهم بها الإنسان.
كيف يعمل نموذج (PaliGemma 2)؟
يعتمد النموذج على بنية (Gemma 2) عالية الأداء والمفتوحة المصدر، مع إضافة قدرة جديدة على تحليل ومعالجة المعلومات المرئية، يتمتع (PaliGemma 2) بمرونة عالية، حيث يمكن تخصيصه وتطويره ليخدم مختلف التطبيقات، مما يجعله أداة قوية للباحثين والمطورين في مجالات الرؤية الحاسوبية ومعالجة اللغات الطبيعية.
يأتي (PaliGemma 2) مع عدة ميزات تجعل منه أداة متفوقة في معالجة الصور، فمن ناحية الأداء، يتوفر النموذج بثلاثة أحجام مختلفة، مما يسمح للمطورين باختيار الأنسب لحجم البيانات والمهمة التي يتم معالجتها، بالإضافة إلى ذلك، يعزز النموذج القدرة على توليد تعليقات وصفية شاملة تشمل الأفعال والعواطف والسياق العام لكل صورة، بما يتيح إمكانيات جديدة في مجال فهم الصور.
كما أثبت النموذج قدرة عالية في التعامل مع مهام متنوعة، مثل قراءة النوتات الموسيقية أو حل مسائل هندسية معقدة، وحتى توليد تقارير طبية من صور الأشعة السينية.
على الرغم من هذه الإنجازات المثيرة، تظل فكرة اكتشاف المشاعر البشرية باستخدام الذكاء الاصطناعي مثار جدل، فالمشاعر البشرية تتسم بالتعقيد والتنوع، ويصعب على الآلات محاكاتها بدقة، وتحذر العديد من الباحثين من إمكانية الاعتماد على هذه التقنيات لفهم مشاعرنا، مؤكدةً أن هذه التكنولوجيا لا تزال في مراحلها الأولى.
سارت ساندرا واتشر، أستاذة أخلاقيات البيانات والذكاء الاصطناعي في معهد أكسفورد للإنترنت، في هذا الاتجاه حيث قالت: “إن افتراض قدرة الآلات على قراءة مشاعرنا بدقة هو أمر مثير للقلق، فالمشاعر البشرية معقدة ومتعددة الأبعاد، ولا يمكن اختزالها في بيانات يمكن للآلة تحليلها.”
رغم الجهود الكبيرة التي تبذلها شركات التقنية في تطوير أنظمة قراءة المشاعر، إلا أن هناك شكوكًا كبيرة حول دقة هذه الأنظمة، تعتمد الكثير من التقنيات المستخدمة في هذا المجال على نظرية عالم النفس بول إيكمان، التي افترضت أن البشر يشتركون في ستة مشاعر أساسية، إلا أن الدراسات الحديثة أظهرت أن هذه الفرضية قد تكون مبسطة، إذ أن تعبيرات الوجه والمشاعر تختلف بين الثقافات والأفراد، مما يجعل من الصعب تحديد مشاعر شخص ما من خلال ملامح وجهه فقط.
وفقًا لمايك كوك، الباحث في الذكاء الاصطناعي في جامعة كينغز كوليدج لندن، فإن محاولة تحديد المشاعر من خلال تحليل ملامح الوجه وحدها تظل صعبة للغاية، بسبب تأثير العوامل الثقافية والاجتماعية والنفسية.
تمثل التحيزات أحد أكبر التحديات التي قد تواجه تقنيات الكشف عن المشاعر، فقد أظهرت دراسات أن بعض الأنظمة قد تطور تحيزات غير مقصودة، مثل تفضيل تعبيرات معينة كالتبسم، مما يؤثر في دقة النتائج.
كما أظهرت أبحاث أخرى أن نماذج الذكاء الاصطناعي المتخصصة في تحليل المشاعر قد تكون متحيزة عرقيًا، حيث تصنف الوجوه السوداء على أنها تعبيرات عن مشاعر سلبية أكثر من الوجوه البيضاء.
وفي هذا الصدد، أكدت جوجل أنها قامت بإجراء اختبارات شاملة على (PaliGemma 2) للكشف عن أي تحيزات قد تكون موجودة في النموذج، ورغم ذلك، لم يتم الكشف عن المعايير المحددة التي تم استخدامها في هذه الاختبارات، مما يثير تساؤلات حول مدى شفافيتها وموثوقيتها.
استخدام التكنولوجيا الجديدة في كشف المشاعر قد يفتح المجال أمام مخاطر كبيرة، خاصة في المجالات الحساسة مثل التعليم والتوظيف، على سبيل المثال، حظر الاتحاد الأوروبي استخدام أنظمة الذكاء الاصطناعي لاكتشاف المشاعر في المدارس وأماكن العمل، خوفًا من استخدامها بطريقة تمييزية.
من جانب آخر، يثير استخدام هذه الأنظمة في النماذج المفتوحة مثل (PaliGemma 2) قلقًا بشأن إمكانية استغلالها في أغراض غير أخلاقية، مثل اتخاذ قرارات تمييزية في مجالات مثل التوظيف والموارد البشرية، أو حتى تطبيق القانون.
في الختام، بينما يقدم (PaliGemma 2) إمكانيات واعدة في فهم الصور والمشاعر البشرية، يبقى العديد من الأسئلة مفتوحة حول مدى فعالية هذه التكنولوجيا وأثرها المستقبلي على حياتنا، هل سنكون قادرين على الثقة في الذكاء الاصطناعي ليحدد مشاعرنا؟ وماذا ستكون عواقب استخدام هذه التكنولوجيا في مجالات حساسة؟ هذه الأسئلة لا تزال بحاجة إلى المزيد من البحث والنقاش.