هناك كلب جديد في عالم معايير الذكاء الاصطناعي التوليدي واسمه هو Gemini 1.5 Pro.
أخيرًا، تم تجاوز البطل السابق، ChatGPT-4o من OpenAI، في الأول من أغسطس/آب عندما أطلقت Google بهدوء إصدارًا تجريبيًا لأحدث طراز لها.
وصل التحديث الأخير لنظام Gemini دون ضجة ويُصنف حاليًا على أنه تجريبي. لكنه سرعان ما نال اهتمام مجتمع الذكاء الاصطناعي عبر وسائل التواصل الاجتماعي حيث بدأت التقارير تتسرب بأنه يتفوق على منافسيه في درجات المعايير.
معايير الذكاء الاصطناعي
لقد كان ChatGPT من OpenAI هو حامل لواء الذكاء الاصطناعي التوليدي منذ إطلاق GPT-3. لقد تفوق أحدث طراز GPT-4o وأقرب منافس له Claude-3 من Anthropic على معظم النماذج الأخرى في معظم المعايير الشائعة خلال العام الماضي أو نحو ذلك مع القليل من المنافسة.
أحد أكثر معايير التقييم شيوعًا هو ما يسمى بـ LMSYS Chatbot Arena. فهو يختبر النماذج في مجموعة متنوعة من المهام ويحدد درجة الكفاءة الإجمالية. حصل GPT-4o على درجة 1286 بينما حصل Claude-3 على درجة محترمة 1271.
حصلت النسخة السابقة من Gemini 1.5 Pro على 1261 نقطة. لكن النسخة التجريبية (Gemini 1.5 Pro 0801) التي تم إصدارها في الأول من أغسطس حصلت على 1300 نقطة.
يشير هذا إلى أنه أكثر قدرة بشكل عام من منافسيه، ولكن المعايير ليست بالضرورة تمثيلًا دقيقًا لما يمكن لنموذج الذكاء الاصطناعي فعله وما لا يمكنه فعله.
الإثارة المجتمعية
في غياب المقارنات الأعمق المتاحة، ندخل عصرًا حيث نضج سوق روبوتات الدردشة بالذكاء الاصطناعي بما يكفي لتقديم خيارات متعددة. وفي النهاية، يعود الأمر إلى المستخدمين النهائيين لتحديد نموذج الذكاء الاصطناعي الذي يناسبهم بشكل أفضل.
وبحسب بعض القصص، فقد كانت هناك موجة من الإثارة حول أحدث إصدار من برنامج Gemini، حيث وصفه المستخدمون على وسائل التواصل الاجتماعي بأنه “جيد للغاية”. وذهب أحد مستخدمي Reddit إلى حد كتابة أنه “يتفوق على 40 من حيث الجودة”.
من غير الواضح في الوقت الحالي ما إذا كانت النسخة التجريبية من Gemini 1.5 Pro ستصبح النسخة الافتراضية في المستقبل. وفي حين تظل متاحة بشكل عام وقت نشر هذه المقالة، فإن حقيقة كونها في مرحلة الإصدار المبكر أو الاختبار تشير إلى أنه من الممكن إلغاء النموذج أو تغييره لأسباب تتعلق بالسلامة أو التوافق.
متعلق ب: جوجل تعلن عن تطورات في السلامة والشفافية في نماذج الذكاء الاصطناعي