خمس طرق لتعلم الآلة يجب أن يعرفها متداولو العملات المشفرة
في مقال حديث ، ناقشت أهمية تقنيات التعلم الآلي التي تدعم تقنية GPT-3 الخاصة بـ OpenAI في سوق العملات المشفرة. قد يكون GPT-3 – الذي يمكنه الإجابة عن الأسئلة وإجراء تحليل لغوي وإنشاء نص – أشهر الإنجازات في السنوات الأخيرة في مجال التعلم العميق. ولكن ، بأي حال من الأحوال ، هو الأكثر قابلية للتطبيق على مساحة التشفير. في هذه المقالة ، أود مناقشة بعض المجالات الجديدة للتعلم العميق التي يمكن أن يكون لها تأثير شبه فوري في النماذج الكمية المطبقة على التشفير.
جيسوس رودريغيز هو الرئيس التنفيذي لـ IntoTheBlock ، وهي منصة معلومات السوق لأصول التشفير. وقد شغل مناصب قيادية في كبرى شركات التكنولوجيا وصناديق التحوط. وهو مستثمر نشط ومتحدث ومؤلف ومحاضر ضيف في جامعة كولومبيا في نيويورك.
تعد النماذج مثل GPT-3 أو BERT من Google نتيجة لاختراق هائل في التعلم العميق المعروف باسم نماذج اللغة سابقة التدريب والمحول. يمكن القول إن هذه التقنيات تمثل أكبر معلم في السنوات القليلة الماضية في صناعة التعلم العميق ولم يمر تأثيرها دون أن يلاحظه أحد في أسواق رأس المال.
في العام الماضي ، كانت هناك جهود بحثية نشطة في التمويل الكمي لاستكشاف كيفية تطبيق نماذج المحولات على فئات الأصول المختلفة. ومع ذلك ، فإن نتائج هذه الجهود لا تزال سطحية تبين أن المحولات بعيدة كل البعد عن الاستعداد للعمل في مجموعات البيانات المالية وتظل قابلة للتطبيق في الغالب على البيانات النصية. لكن لا يوجد سبب للشعور بالسوء. في حين أن تكييف المحولات مع السيناريوهات المالية لا يزال يمثل تحديًا نسبيًا ، فإن المجالات الجديدة الأخرى من مساحة التعلم العميق تبشر بالخير عند تطبيقها في النماذج الكمية على فئات الأصول المختلفة بما في ذلك التشفير.
من زوايا عديدة ، يبدو أن التشفير يشبه فئة الأصول المثالية للنماذج الكمية القائمة على التعلم العميق. هذا بسبب الحمض النووي الرقمي وشفافية الأصول المشفرة وأن ظهور العملة المشفرة قد تزامن مع نهضة التعلم الآلي وظهور التعلم العميق.
بعد عقود من النضال واثنين مما يسمى “فصول الشتاء للذكاء الاصطناعي” ، أصبح التعلم العميق أخيرًا حقيقيًا وسائدًا إلى حد ما عبر مجالات مختلفة من صناعة البرمجيات. لقد كان التمويل الكمي أحد أسرع مستخدمي تقنيات وأبحاث التعلم العميق الجديدة. من الشائع جدًا لبعض الصناديق الكمية الكبيرة في السوق أن تجرب نفس أنواع الأفكار الصادرة عن مختبرات أبحاث الذكاء الاصطناعي عالية التقنية مثل Facebook أو Google أو Microsoft.
أنظر أيضا: جيسوس رودريغيز – 10 أسباب للإستراتيجيات الكمية لفشل التشفير
بعض التطورات الأكثر إثارة في التمويل الكمي الحديث لا تأتي من التقنيات البراقة مثل المحولات ، ولكن من اختراقات التعلم الآلي المثيرة التي تم تطويرها بشكل أكبر للسيناريوهات الكمية. العديد من هذه الطرق قابلة للتطبيق تمامًا على تقنيات كمية الأصول المشفرة وبدأت في تحقيق تقدم في نماذج كمية التشفير.
أدناه ، أدرجت خمسة مجالات ناشئة للتعلم العميق ذات أهمية خاصة لسيناريوهات التشفير الكمي. حاولت أن أبقي التفسيرات بسيطة نسبيًا ومصممة لسيناريوهات التشفير.
1) رسم الشبكات العصبية
تعد مجموعات بيانات Blockchain مصدرًا فريدًا لـ alpha للنماذج الكمومية في مساحة التشفير. من منظور هيكلي ، تكون بيانات blockchain ذات تسلسل هرمي في جوهرها ويتم تمثيلها بواسطة رسم بياني مع عقد تمثل عناوين متصلة بواسطة حواف تمثل المعاملات. تخيل سيناريو يحاول فيه نموذج كمي التنبؤ بتقلبات Bitcoin في تبادل معين بناءً على خصائص العناوين التي تحول الأموال إلى البورصة. يحتاج هذا النوع من النماذج إلى العمل بكفاءة عبر البيانات الهرمية. لكن معظم تقنيات التعلم الآلي مصممة للعمل مع مجموعات البيانات المجدولة ، وليس الرسوم البيانية.
الشبكات العصبية للرسم البياني (GNNs) هي نظام جديد للتعلم العميق يركز على النماذج التي تعمل بكفاءة على هياكل بيانات الرسم البياني. تعد شبكات GNN مجالًا جديدًا نسبيًا للتعلم العميق تم اختراعه فقط في عام 2005. ومع ذلك ، شهدت شبكات GNN الكثير من عمليات التبني من شركات مثل Uber و Google و Microsoft و DeepMind وغيرها.
في سيناريو العينة الخاص بنا ، يمكن لشبكة GNN أن تستخدم رسمًا بيانيًا كمدخل يمثل التدفقات داخل وخارج التبادلات واستنتاج المعرفة ذات الصلة ذات الصلة بتأثيرها على السعر. في سياق الأصول المشفرة ، تمتلك شبكات GNN القدرة على تمكين طرق كمية جديدة تعتمد على مجموعات بيانات blockchain.
2) النماذج التوليدية
أحد قيود النماذج الكمية للتعلم الآلي هو عدم وجود مجموعات بيانات تاريخية كبيرة. افترض أنك تحاول بناء نموذج تنبؤي لسعر ChainLink (LINK) استنادًا إلى سلوكه التاريخي في التداول. على الرغم من أن المفهوم يبدو جذابًا ، إلا أنه قد يكون صعبًا لأن LINK لديها ما يزيد قليلاً عن عام من بيانات التداول التاريخية في البورصات مثل Coinbase. لن تكون مجموعة البيانات الصغيرة هذه كافية لمعظم الشبكات العصبية العميقة لتعميم أي معرفة ذات صلة.
النماذج التوليدية هي نوع من أساليب التعلم العميق المتخصصة في توليد البيانات التركيبية التي تتطابق مع توزيع مجموعة بيانات التدريب. في السيناريو الخاص بنا ، تخيل أننا نقوم بتدريب نموذج توليدي في توزيع دفتر طلبات الارتباط في Coinbase من أجل إنشاء طلبات جديدة تتناسب مع توزيع دفتر الطلبات الحقيقي.
بدمج مجموعة البيانات الحقيقية والمجموعة الاصطناعية ، يمكننا بناء مجموعة بيانات كبيرة بما يكفي لتدريب نموذج التعلم العميق المتطور. مفهوم النموذج التوليدي ليس جديدًا بشكل خاص ولكنه اكتسب الكثير من الجذب في العام الأخير مع ظهور تقنيات شائعة مثل الشبكات العصبية التوليدية (GANs) التي أصبحت واحدة من أكثر الطرق شيوعًا في مجالات مثل تصنيف الصور و تم استخدامها بنجاح ملائم مع مجموعات البيانات المالية المتسلسلة الزمنية.
3) التعلم شبه تحت الإشراف
مجموعات البيانات المصنفة نادرة في مساحة التشفير وهذا يحد بشدة من نوع النماذج الكمية للتعلم الآلي التي يمكن بناؤها في سيناريوهات العالم الحقيقي. تخيل أننا نحاول بناء نموذج ML يقوم بتنبؤات الأسعار بناءً على نشاط مكاتب OTC. لتدريب هذا النموذج ، سنحتاج إلى مجموعة بيانات كبيرة تحمل عناوين تنتمي إلى مكاتب OTC وهي نوع مجموعة البيانات التي لا يمتلكها سوى عدد قليل من الكيانات في سوق التشفير.
التعلم شبه الخاضع للإشراف هو أسلوب تعلم عميق يركز على إنشاء نماذج يمكنها التعلم من خلال مجموعات بيانات صغيرة معنونة وكمية كبيرة من البيانات غير المصنفة. يشبه التعلم شبه الخاضع للإشراف قيام المعلم بتقديم بعض المفاهيم إلى مجموعة من الطلاب وترك المفاهيم الأخرى للواجبات المنزلية والدراسة الذاتية.
في سيناريو العينة الخاص بنا ، تخيل أننا نقوم بتدريب نموذج مع مجموعة صغيرة من الصفقات ذات العلامات من مكاتب OTC ومجموعة كبيرة من الصفقات غير المصنفة. سيتعلم نموذج التعلم شبه الخاضع للإشراف الخاص بنا الميزات الرئيسية من مجموعة البيانات المصنفة مثل حجم التجارة أو تكرارها وسيستخدم مجموعة البيانات غير المصنفة لتوسيع التدريب.
4) تعلم التمثيل
يعد استخراج الميزات واختيارها عنصرًا أساسيًا في أي نموذج للتعلم الآلي الكمي وهو ذو صلة خاصة بالمشكلات غير المفهومة جيدًا مثل تنبؤات الأصول المشفرة. تخيل أننا نحاول بناء نموذج تنبؤي لسعر البيتكوين بناءً على سجلات دفتر الطلبات.
أحد أهم جوانب جهودنا هو تحديد السمات أو الميزات التي يمكن أن تعمل كمتنبئين. هل هو متوسط السعر أم الحجم أم مائة عامل آخر؟ تتمثل الطريقة التقليدية في الاعتماد على الخبراء المتخصصين في صنع هذه الميزات يدويًا ، ولكن قد يصعب توسيع نطاقها والحفاظ عليها بمرور الوقت.
يعد التعلم التمثيلي مجالًا للتعلم العميق يركز على أتمتة تعلم التمثيلات أو الميزات الصلبة من أجل بناء نماذج أكثر فعالية. بدلاً من الاعتماد على نمذجة الميزات البشرية ، يحاول التعلم التمثيلي استقراء الميزات مباشرةً من مجموعات البيانات غير المسماة. في مثالنا ، يمكن لطريقة التعلم التمثيلي تحليل دفتر الطلبات وتحديد مئات الآلاف من الميزات المحتملة التي يمكن أن تكون بمثابة تنبؤات لأسعار البيتكوين. من المستحيل تحقيق هذا المستوى من التحجيم والأتمتة في هندسة الميزات اليدوية.
5) بحث العمارة العصبية
تظل عملية إنشاء نماذج التعلم الآلي الكمي ذاتية للغاية في العديد من الجوانب. لنأخذ سيناريو نموذج يحاول التنبؤ بسعر Ethereum بناءً على النشاط في مجموعة من بروتوكولات DeFi. نظرًا لطبيعة المشكلة ، سيكون لعلماء البيانات تفضيلات معينة حول نوع النموذج والهندسة المعمارية التي يجب استخدامها.
في السيناريو الخاص بنا ، ستستند معظم هذه الأفكار إلى معرفة المجال والآراء الشخصية حول الطريقة التي يمكن أن يؤثر بها النشاط في بروتوكولات DeFi على سعر Ethereum. بالنظر إلى أن التعلم الآلي يعتمد على بناء المعرفة والمعرفة ليست وحدة منفصلة ، يكاد يكون من المستحيل مناقشة مزايا طريقة ما مقابل أخرى لمشكلة معينة.
يعد البحث عن العمارة العصبية (NAS) أحد مجالات التعلم العميق التي تحاول أتمتة نماذج الإنشاء باستخدام التعلم الآلي. نوع من استخدام التعلم الآلي لإنشاء التعلم الآلي. نظرًا لوجود مشكلة ومجموعة بيانات مستهدفة ، ستقوم أساليب NAS بتقييم المئات من بنى الشبكات العصبية الممكنة وإخراج تلك ذات النتائج الواعدة.
في سيناريو العينة الخاص بنا ، يمكن لطريقة NAS معالجة مجموعة بيانات تتضمن التداولات في البورصات اللامركزية وإنتاج بعض النماذج التي يمكن أن تتنبأ بسعر Ethereum بناءً على تلك السجلات.
المزيد قادم
تمثل الأساليب الموضحة أعلاه بعض المجالات الناشئة والأكثر تطورًا للتعلم العميق والتي من المحتمل أن يكون لها تأثير في النماذج الكمية للتشفير على المدى القصير. وهذه هي بلا شك المجالات الوحيدة التي يجب الانتباه إليها في التعلم العميق لكميات التشفير.
إن تخصصات التعلم العميق الأخرى مثل التعلم المعزز والتعلم تحت الإشراف الذاتي وحتى المحولات تشق طريقها بسرعة في الفضاء الكمي. يحدث البحث والتجريب حول تقنيات التعلم العميق المطبقة على النماذج الكمية في كل مكان ، ومن المتوقع أن يكون التشفير مستفيدًا كبيرًا من تلك الموجة من الابتكار.