تأثير Deepseek-R1 و Web3-AI

جعلت الأوزان المفتوحة (على عكس الطبيعة المفتوحة المصدر) للإصدار أن النموذج يمكن الوصول إليه بسهولة لمجتمع الذكاء الاصطناعى ، مما يؤدي إلى زيادة من الحيوانات المستنسخة في غضون ساعات. علاوة على ذلك ، تركت Deepseek-R1 بصماتها على سباق الذكاء الاصطناعى المستمر بين الصين والولايات المتحدة ، مما يعزز ما كان واضحًا بشكل متزايد: النماذج الصينية ذات جودة عالية بشكل استثنائي وقادر على قيادة الابتكار بالأفكار الأصلية.
على عكس معظم التطورات في الذكاء الاصطناعى التوليدي ، والتي يبدو أنها توسيع الفجوة بين Web2 و Web3 في عالم نماذج الأساس ، فإن إصدار Deepseek-R1 يحمل آثارًا حقيقية ويمثل فرصًا مثيرة للاهتمام لـ Web3-AA. لتقييم هذه ، يجب علينا أولاً إلقاء نظرة فاحصة على الابتكارات والتفاضلات الرئيسية لـ Deepseek-R1.
داخل Deepseek-R1
كان Deepseek-R1 نتيجة لإدخال الابتكارات الإضافية في إطار عمل راسخ لنماذج الأساس. بعبارات واسعة ، يتبع Deepseek-R1 نفس منهجية التدريب مثل معظم نماذج الأساس البارزة. يتكون هذا النهج من ثلاث خطوات رئيسية:
- pretring: تم تجهيز النموذج في البداية للتنبؤ بالكلمة التالية باستخدام كميات هائلة من البيانات غير المسماة.
- صقل خاضع للإشراف (SFT): تعمل هذه الخطوة على تحسين النموذج في مجالين حرجة: التعليمات التالية والإجابة على الأسئلة.
- التوافق مع التفضيلات البشرية: يتم إجراء مرحلة صقل أخيرة لمحاذاة استجابات النموذج مع التفضيلات البشرية.
تلتزم معظم نماذج الأساس الرئيسية – بما في ذلك تلك التي طورتها Openai و Google و Nothropic – لهذه العملية العامة نفسها. على مستوى عالٍ ، لا يبدو إجراء التدريب في Deepseek-R1 مختلفًا بشكل كبير. Buthowever ، بدلاً من تدريب نموذج أساسي من نقطة الصفر ، قام R1 بالاستفادة من النموذج الأساسي لسلفه ، Deepseek-V3-base ، والذي يضم 617 مليار معلمة رائعة.
في جوهرها ، Deepseek-R1 هو نتيجة تطبيق SFT على قاعدة بيانات Deepseek-V3 مع مجموعة بيانات التفكير على نطاق واسع. يكمن الابتكار الحقيقي في بناء مجموعات بيانات التفكير هذه ، والتي يصعب بناءها.
الخطوة الأولى: DEEPSEEK-R1-ZERO
واحدة من أهم جوانب Deepseek-R1 هي أن العملية لم تنتج نموذجًا واحدًا فقط ولكن اثنين. ربما كان الابتكار الأكثر أهمية لـ Deepseek-R1 هو إنشاء نموذج وسيط يسمى R1-Zero ، وهو متخصص في مهام التفكير. تم تدريب هذا النموذج بالكامل تقريبًا باستخدام تعلم التعزيز ، مع الحد الأدنى من الاعتماد على البيانات المسمى.
التعلم التعزيز هو تقنية يتم فيها مكافأة النموذج لإنشاء إجابات صحيحة ، وتمكينها من تعميم المعرفة بمرور الوقت.
R1-Zero مثير للإعجاب للغاية ، حيث كان قادرًا على مطابقة GPT-O1 في مهام التفكير. ومع ذلك ، كافح النموذج مع المزيد من المهام العامة مثل الإجابة على الأسئلة وقابلية القراءة. ومع ذلك ، فإن الغرض من R1-Zero لم يكن أبدًا إنشاء نموذج عام ولكنه يثبت أنه من الممكن تحقيق إمكانيات التفكير الحديثة باستخدام التعلم التعزيز وحده-حتى لو لم يكن النموذج جيدًا في مجالات أخرى .
الخطوة الثانية: Deepseek-R1
تم تصميم Deepseek-R1 ليكون نموذجًا للأغراض العامة يتفوق على التفكير ، مما يعني أنه يحتاج إلى التفوق على R1-Zero. ولتحقيق ذلك ، بدأت Deepseek مرة أخرى باستخدام طراز V3 ، ولكن هذه المرة ، قام بتثبيته على مجموعة بيانات التفكير الصغيرة.
كما ذكرنا سابقًا ، يصعب إنتاج مجموعات بيانات التفكير. هذا هو المكان الذي لعب فيه R1-Zero دورًا مهمًا. تم استخدام النموذج الوسيط لإنشاء مجموعة بيانات التفكير الاصطناعية ، والتي تم استخدامها بعد ذلك لضبط Deepseek V3. أسفرت هذه العملية عن نموذج تفكير وسيط آخر ، والذي تم وضعه لاحقًا من خلال مرحلة تعلم تعزيز واسعة النطاق باستخدام مجموعة بيانات من 600000 عينة ، تم إنشاؤها أيضًا بواسطة R1-Zero. وكانت النتيجة النهائية لهذه العملية Deepseek-R1.
على الرغم من أنني قد حذفت العديد من التفاصيل الفنية لعملية R1 Pretring ، وهنا هما الوجبات السريعة الرئيسية:
- أثبت R1-Zero أنه من الممكن تطوير قدرات التفكير المتطورة باستخدام تعلم التعزيز الأساسي. على الرغم من أن R1-Zero لم يكن نموذجًا عامًا قويًا ، إلا أنه قام بنجاح بإنشاء بيانات المنطق اللازمة لـ R1.
- قام R1 بتوسيع خط أنابيب ما قبل التدريب التقليدي الذي تستخدمه معظم نماذج الأساس من خلال دمج R1-Zero في العملية. بالإضافة إلى ذلك ، استفد من كمية كبيرة من بيانات التفكير الاصطناعي الناتجة عن R1-Zero.
ونتيجة لذلك ، ظهر Deepseek-R1 كنموذج يتوافق مع قدرات التفكير في GPT-O1 أثناء بناءها باستخدام عملية تدريبي أكثر بساطة وأرخص بشكل كبير.
يوافق الجميع على أن R1 يمثل علامة فارقة مهمة في تاريخ الذكاء الاصطناعى التوليدي ، الذي من المحتمل أن يعيد تشكيل نماذج الأساس. عندما يتعلق الأمر بـ Web3 ، سيكون من المثير للاهتمام استكشاف كيف يؤثر R1 على المشهد المتطور لـ Web3-AI.
Deepseek-R1 و Web3-AI
حتى الآن ، كافح Web3 من أجل إنشاء حالات استخدام مقنعة تضيف قيمة بوضوح إلى إنشاء نماذج الأساس واستخدامه. إلى حد ما ، يبدو أن سير العمل التقليدي لنماذج الأساس المسبق هو نقيض بنيات Web3. ومع ذلك ، على الرغم من كونها في مراحلها المبكرة ، فقد أبرز إصدار Deepseek-R1 العديد من الفرص التي يمكن أن تتماشى بشكل طبيعي مع بنيات Web3-AI.
1) تعزيز شبكات صقل الرفع
أثبت R1-Zero أنه من الممكن تطوير نماذج التفكير باستخدام تعلم التعزيز الخالص. من الناحية الحسابية ، يكون التعلم التعزيز قابلًا للتوازي للغاية ، مما يجعله مناسبًا تمامًا للشبكات اللامركزية. تخيل شبكة Web3 حيث يتم تعويض العقد لضبط نموذج على مهام التعلم التعزيز ، كل منها يطبق استراتيجيات مختلفة. هذا النهج أكثر جدوى بكثير من النماذج الأخرى المسبقة التي تتطلب طبولوجيا معالجة GPU معقدة والبنية التحتية المركزية.
2) توليد مجموعة بيانات التفكير الاصطناعي
كانت مساهمة رئيسية أخرى من DeepSeek-R1 تعرض أهمية مجموعات بيانات التفكير التي تم إنشاؤها صناعياً للمهام المعرفية. هذه العملية مناسبة أيضًا بشكل جيد بالنسبة لشبكة لا مركزية ، حيث تنفذ العقد وظائف توليد مجموعات البيانات ويتم تعويضها حيث يتم استخدام مجموعات البيانات هذه في نماذج الأساس المسبق أو الصياغة. نظرًا لأن هذه البيانات يتم إنشاؤها صناعياً ، يمكن أن تكون الشبكة بأكملها مؤتمتة بالكامل دون تدخل بشري ، مما يجعلها مناسبة مثالية لبنية Web3.
3) الاستدلال اللامركزي لنماذج التفكير المقطرة الصغيرة
Deepseek-R1 هو نموذج ضخم مع 671 مليار معلمة. ومع ذلك ، بعد إصدارها فورًا تقريبًا ، ظهرت موجة من نماذج التفكير المقطرة ، تتراوح من 1.5 إلى 70 مليار معلمة. هذه النماذج الأصغر هي أكثر عملية للاستدلال في الشبكات اللامركزية. على سبيل المثال ، يمكن تضمين نموذج R1 المقطر من 1.5B – 2B في بروتوكول DEFI أو يتم نشره في العقد من شبكة DEPIN. أكثر بكل بساطة ، من المحتمل أن نرى ارتفاع نقاط نهاية الاستدلال فعالة من حيث التكلفة مدعومة بشبكات حسابية لا مركزية. يعتبر التفكير أحد المجالات التي تضيق فيها فجوة الأداء بين النماذج الصغيرة والكبيرة ، مما يخلق فرصة فريدة لـ Web3 للاستفادة من هذه النماذج المقطرة بكفاءة في إعدادات الاستدلال اللامركزية.
4) تفكير بيانات البيانات
واحدة من الميزات المميزة لنماذج التفكير هي قدرتها على توليد آثار التفكير لمهمة معينة. تتيح DeepSeek-R1 هذه الآثار كجزء من ناتج الاستدلال ، مما يعزز أهمية الأصل والتتبع لمهام التفكير. تعمل الإنترنت اليوم بشكل أساسي على المخرجات ، مع القليل من الرؤية في الخطوات الوسيطة التي تؤدي إلى تلك النتائج. يعرض Web3 فرصة لتتبع كل خطوة من الخطوات والتحقق منها ، مما قد يخلق “إنترنت جديدًا من التفكير” حيث تصبح الشفافية والتحقق هي القاعدة.
Web3-AAI لديها فرصة في عصر التفكير بعد R1
تميز إطلاق Deepseek-R1 بنقطة تحول في تطور الذكاء الاصطناعي. من خلال الجمع بين الابتكارات الذكية ونماذج راسخة ، فقد تحدى سير عمل الذكاء الاصطناعى التقليدي وفتحت حقبة جديدة في الذكاء الاصطناعى التي تركز على المنطق. على عكس العديد من نماذج الأساس السابقة ، تقدم Deepseek-R1 عناصر تقترب من الذكاء الاصطناعي من Web3.
الجوانب الرئيسية لمجموعات بيانات التفكير الاصطناعي ، والتدريب الأكثر موازية والحاجة المتزايدة للتتبع – تتماشى بشكل طبيعي مع مبادئ Web3. على الرغم من أن Web3-AAI قد ناضلت من أجل الحصول على جر ذي معنى ، إلا أن عصر التفكير الجديد بعد R1 قد يقدم أفضل فرصة حتى الآن بالنسبة لـ Web3 لتلعب دورًا أكثر أهمية في مستقبل الذكاء الاصطناعي.
self.__next_f.push((1,”tics.com”}),(“$”,”link”,null,{“rel”:”preconnect”,”href”:”https://consent.cookiebot.com”}),(“$”,”link”,null,{“rel”:”preconnect”,”href”:”https://consentcdn.cookiebot.com”}),(“$”,”link”,null,{“rel”:”preconnect”,”href”:”https://cdn.sanity.io”}),((“$”,”link”,null,{“rel”:”preconnect”,”href”:”https://securepubads.g.doubleclick.net”}),(“$”,”link”,null,{“rel”:”preconnect”,”href”:”https://adservice.google.com”}),(“$”,”link”,null,{“rel”:”preconnect”,”href”:”https://a.pub.network/”,”crossOrigin”:”anonymous”}),(“$”,”link”,null,{“rel”:”preconnect”,”href”:”https://b.pub.network/”,”crossOrigin”:”anonymous”}),(“$”,”link”,null,{“rel”:”preconnect”,”href”:”https://c.pub.network/”,”crossOrigin”:”anonymous”}),(“$”,”link”,null,{“rel”:”preconnect”,”href”:”https://d.pub.network/”,”crossOrigin”:”anonymous”}),(“$”,”link”,null,{“rel”:”preconnect”,”href”:”https://c.amazon-adsystem.com”,”crossOrigin”:”anonymous”}),(“$”,”link”,null,{“rel”:”preconnect”,”href”:”https://s.amazon-adsystem.com”,”crossOrigin”:”anonymous”}),(“$”,”link”,null,{“rel”:”preconnect”,”href”:”https://btloader.com/”,”crossOrigin”:”anonymous”}),(“$”,”link”,null,{“rel”:”preconnect”,”href”:”https://api.btloader.com/”,”crossOrigin”:”anonymous”}),(“$”,”link”,null,{“rel”:”preconnect”,”href”:”https://confiant-integrations.global.ssl.fastly.net”,”crossOrigin”:”anonymous”}),(“$”,”link”,null,{“rel”:”preload”,”href”:”https://a.pub.network/coindesk/pubfig.min.js”,”as”:”script”}),(“$”,”link”,null,{“rel”:”stylesheet”,”href”:”https://a.pub.network/coindesk/cls.css”})),(“$”,”link”,null,{“rel”:”preconnect”,”href”:”https://connect.facebook.net”}),(“$”,”link”,null,{“rel”:”preconnect”,”href”:”https://cdn.jwplayer.com”}),(“$”,”link”,null,{“rel”:”preconnect”,”href”:”https://cloudfront-us-east-1.images.arcpublishing.com”}),(“$”,”link”,null,{“rel”:”preconnect”,”href”:”https://downloads.coindesk.com”}),(“$”,”link”,null,{“rel”:”icon”,”sizes”:”any”,”href”:”https://coindesk-next-ivjh6x6st-coindesk.vercel.app/favicons/production/favicon.ico”}),(“$”,”link”,null,{“rel”:”icon”,”type”:”image/svg+xml”,”href”:”https://coindesk-next-ivjh6x6st-coindesk.vercel.app/favicons/production/favicon.svg”}),(“$”,”link”,null,{“rel”:”icon”,”type”:”image/x-icon”,”href”:”https://coindesk-next-ivjh6x6st-coindesk.vercel.app/favicons/production/android-chrome-192×192.png”}),(“$”,”link”,null,{“rel”:”icon”,”type”:”image/png”,”sizes”:”16×16″,”href”:”https://coindesk-next-ivjh6x6st-coindesk.vercel.app/favicons/production/favicon-16×16.png”}),(“$”,”link”,null,{“rel”:”icon”,”type”:”image/png”,”sizes”:”32×32″,”href”:”https://coindesk-next-ivjh6x6st-coindesk.vercel.app/favicons/production/favicon-32×32.png”}),(“$”,”link”,null,{“rel”:”icon”,”type”:”image/png”,”sizes”:”48×48″,”href”:”https://coindesk-next-ivjh6x6st-coindesk.vercel.app/favicons/production/favicon-48×48.png”}),(“$”,”link”,null,{“rel”:”icon”,”type”:”image/png”,”sizes”:”64×64″,”href”:”https://coindesk-next-ivjh6x6st-coindesk.vercel.app/favicons/production/favicon-64×64.png”}),(“$”,”link”,null,{“rel”:”apple-touch-icon”,”href”:”https://coindesk-next-ivjh6x6st-coindesk.vercel.app/favicons/production/apple-touch-icon-60×60.png”}),(“$”,”link”,null,{“rel”:”apple-touch-icon”,”sizes”:”120×120″,”href”:”https://coindesk-next-ivjh6x6st-coindesk.vercel.app/favicons/production/apple-touch-icon-120×120.png”}),(“$”,”link”,null,{“rel”:”apple-touch-icon”,”sizes”:”152×152″,”href”:”https://coindesk-next-ivjh6x6st-coindesk.vercel.app/favicons/production/apple-touch-icon-152×152.png”}),(“$”,”link”,null,{“rel”:”apple-touch-icon”,”sizes”:”167×167″,”href”:”https://coindesk-next-ivjh6x6st-coindesk.vercel.app/favicons/production/apple-touch-icon-167×167.png”}),(“$”,”link”,null,{“rel”:”apple-touch-icon”,”sizes”:”180×180″,”href”:”https://coindesk-next-ivjh6x6st-coindesk.vercel.app/favicons/production/apple-touch-icon-180×180.png”}),(“$”,”link”,null,{“rel”:”icon”,”type”:”image/png”,”sizes”:”512×512″,”href”:”https://coindesk-next-ivjh6x6st-coindesk.vercel.app/favicons/production/android-chrome-512×512.png”}),(“$”,”link”,null,{“rel”:”icon”,”type”:”image/png”,”sizes”:”16×16″,”href”:”https://coindesk-next-ivjh6x6st-“))