«تحدي التمييز بين الحقيقة والخيال» إشكالية جديدة تثير الجدل في عالمنا المعاصر

مع دخولنا الشهر الأخير من العام، قد يكون الخبر الأبرز في عالم التكنولوجيا عبارة عن أمرٍ مربكٍ للمستخدمين، وهذا ما دفع كثرٌ للتساؤل عمّا إذا كان الذكاء الاصطناعي قد خرج عن السيطرة. فقد انتشرت على مواقع التواصل الاجتماعي صورٌ لعمالقة التكنولوجيا، مثل إيلون ماسك وتيم كوك وسوندار بيتشاي، وهم يجتمعون مع أصحاب مليارات آخرين، ليتبين لاحقاً أن ما انتشر كالنار في الهشيم هو نتاج من أداة جديدة لتوليد الصور بالذكاء الاصطناعي تُسمى “نانو بانانا برو” من “غوغل جيميني”، والتي بات في إمكانها إنشاء صورٍ مزيفة تبدو واقعيةً للغاية وأفضل بكثير من أداة “نانو بانانا” القديمة. وبعد رؤية الصور التي انتشرت بواسطة هذه الأداة الجديدة، بات يمكننا الجزم بأننا دخلنا مرحلة نهاية التصوير الفوتوغرافي التقليدي.

انتشار على نطاقٍ واسع

حتى قبل بضعة أشهر، كانت صور الذكاء الاصطناعي أقل إقناعاً، فغالباً ما كانت الخلفية ضبابية ولها لون غريب، وهذا ما ساعدنا على معرفة أنها مزيفة، لكن الإصدار الجديد من شركة “غوغل” زاد من دقة الصور، لدرجة يصعب معها تمييزها على أنها مزيفة، وهذا يعني أننا جميعاً مضطرون بأن نصبح محقّقين في مجال الذكاء الاصطناعي، ونتساءل عمّا إذا كانت الصورة حقيقية أم لا، وهو أمر يتطلب وقتاً وجهداً.

صورة إيلون ماسك، وهو يستمتع بوجبة عيد الشكر مع عمالقة التكنولوجيا، بدت واقعية للغاية، لدرجة دفعت مستخدمي وسائل التواصل الاجتماعي لكتابة آلاف التعليقات السلبية المهاجمة لعمالقة التكنولوجيا، لكونهم يعيشون حياة رغيدة، لحسن الحظ، يضيف برنامج “جيميني” علامة مائية إلى الصور، ولكن من السهل أيضاً إزالتها أو قصّها، باستخدام برنامج روبوت “غوغل جيميني”، يمكنك تحميل صورة، والسؤال عمّا إذا كانت حقيقية أم لا، ويمكن للبرنامج عادةً البحث عن ملف توقيع يكشف ما إذا كانت من إنتاج الذكاء الاصطناعي، وبطبيعة الحال، فإن هذا الأمر ليس كافياً، خصوصاً أننا حين نستخدم وسائل التواصل الاجتماعي، نتصفّح بسرعة، ونلقي نظرة خاطفة على الصور، وبالتالي فإن معظم الناس لا يفحصون صور “نانو بانانا برو”، وغالباً ما يتفاعلون بسرعة، ويعلّقون، من ثم ينتقلون إلى موضوعٍ آخر.

نانو بانانا برو وأدوات توليد الصور القديمة

تتميز أداة “غوغل” الجديدة عن سابقاتها بأنه بينما لا يزال في إمكاننا التعرّف بصرياً إلى تزييف الصور في النسخ القديمة، ومنها “نانو بانانا” الذي صدر في شهر آب المنصرم، فإن إصدار “نانو بانانا برو” الجديد لا يترك أي مجال للتشكيك بالصور، إذ تبدو حقيقية بصورةٍ تامة، مثلاً يوفّر الإصدار الاحترافي الجديد تحكماً حقيقياً في إعدادات الكاميرا، كالزوايا القابلة للتعديل، واتجاه الإضاءة وكثافتها، وضبط عمق المجال، وخصائص العدسة، وبالتالي يوفر هذا الإصدار تحكماً مشابهاً للكاميرا الحقيقية، وبعدما كان إصدار “نانو بانانا” محدوداً بـ 1024 × 1024 بكسل، وهو أمر مناسب لوسائل التواصل الاجتماعي، لكنه محدود لأي شيءٍ آخر، يوفر الإصدار الجديد مخرجات بدقة 2K و4K لتعطي تفاصيل أفضل في الصور.

فوق ذلك، كانت الإصدارات القديمة لتوليد الصور جيدة في المطالبات البسيطة، لكنها واجهت صعوبة في التعامل مع التعليمات المعقدة المتعددة الأجزاء، حيث غالباً ما كانت تركّز على عنصر واحد وتتجاهل العناصر الأخرى، أو تسيء تفسير العلاقة بين مكوّنات المطالبات، أما “نانو بانانا برو” فقد بُني على نظام Gemini 3 Pro، الذي حسّن القدرة على الاستدلال، ويحلل النموذج الآن المطالبات المعقدة منطقياً، ويفهم العلاقات بين العناصر، ويحافظ على السياق عبر الأوصاف المفصلة، ويتعامل مع التعليمات بشكلٍ أفضل، ويفهم العلاقات المكانية، ومنطق الإضاءة، وتركيب المشهد، انطلاقاً من ذلك، بتنا نستطيع كتابة مطالبات كالآتي “أريد تصميماً داخلياً لمقهى يتدفق فيه ضوء الصباح عبر النافذة اليسرى، ويلقي بظلاله على الطاولات الخشبية، مع وجود باريستا في الخلفية يحضّر الإسبريسو، وزبون يقرأ كتاباً في المقدمة”.

بينما استغرق الإصدار القديم حوالى ثلاث ثوانٍ لإنتاج كل صورة، أي أسرع بعشر مرات من “ميدجورني”، يستغرق الإصدار الجديد ما يُقدّر بـ 8 إلى 12 ثانية لكل صورة حسب درجة التعقيد، فالجودة الإضافية تتطلب وقتاً.

مقارنة بين نماذج صور

انتشرت على وسائل التواصل الاجتماعي صور مصممة باستخدام أداة “غوغل” الجديدة والقديمة، في النموذج أعلاه نجد أن الصورة على اليسار المنتجة من “نانو بانانا” تتميّز بالطابع الكلاسيكي الذي أصبحنا نربطه بالذكاء الاصطناعي، فهي لامعة، معدّلة، ومن الواضح أنها من إنتاج الذكاء الاصطناعي، أما الصورة على اليمين المنتجة بواسطة “نانو بانانا برو”، فتبدو كأنها مأخوذة من حساب أي فتاة صغيرة على “إنستغرام”، تبدو بنيةُ الصورة ونبرتها حقيقيتين، ويكاد يكون من المستحيل التمييز بينها وبين الصورة الحقيقية.

في صور أخرى انتشرت أيضاً لنظّارات شمسية، ظهرت في النسخة الأصلية من غوغل نظارة شمسية مميزة على خشب مع ضبابية غامضة في الخلفية، أما الإصدار الاحترافي فقد أعطانا نتائج أفضل بكثير، فأظهر السطح الخشبي ملمساً أصيلاً، وتميّز المحيط في الخلفية بعمق وتدرج لوني واقعيين، وظهرت انعكاسات مرئية على العدسات تظهر البحر والسماء، عند الطلب من الإصدار القديم إعداد صورة لعمل عن بعد على شاطئٍ استوائي، فسر الإصدار القديم هذا الأمر بإظهار جهاز كمبيوتر محمول، وفنجان قهوة موضوع على رمال، مع أشجار نخيل مشوشة في الخلفية، وبدا الكمبيوتر المحمول عادياً، وكان الشاطئ واضحاً ولكنه مسطح، وبدا التكامل بين إعداد العمل وبيئة الشاطئ منفصلاً كصورتين منفصلتين مدمجتين بشكلٍ سيء، أما الإصدار الجديد فقد أعطانا محطة عمل كاملة: كمبيوتر محمول، وشاشة خارجية، ولوحة مفاتيح، ودفتر ملاحظات، وكانت البيئة الاستوائية غنية بالتفاصيل كأنواع محددة من النخيل، وملمس رمل واقعي، ومياه فيروزية بأمواج مرئية، وضباب جوي مناسب.

في صورة تعود لشخصية واقعية لامرأة ترفع يدها إلى وجهها، وراحة يدها مفتوحة في مواجهة الكاميرا، كانت النتيجة في الإصدار القديم جيدة بشكلٍ عام، ولكن تفتقر إلى مستوى معين من التفاصيل التي قد تجعلها أكثر إقناعاً، وتبدو الصورة وكأنها معدّلة بشكلٍ كبير، على غرار ما قد تراه في برنامج فوتوشوب، أو أنها تشبه رسماً رقمياً أكثر من كونها صورة طبيعية أو أصلية، أما نتيجة الإصدار الجديد فكانت مبهرة بحق، وتُعدّ بحد ذاتها دليلًا على قدرات هذه التقنية، فالصورة الناتجة واقعية للغاية، لدرجة أنه يكاد يكون من المستحيل تمييزها عن صورة استوديو احترافية حقيقية.

تعليقات

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *