الكأس المقدس لـ Crypto AI: استكشاف الحدود للتدريب اللامركزي
في سلسلة القيمة الكاملة للذكاء الاصطناعي، يُعتبر تدريب النماذج هو المرحلة الأكثر استهلاكًا للموارد والأعلى من حيث العوائق التقنية، حيث يحدد مباشرة القدرة القصوى للنموذج وفعالية التطبيق الفعلية. بالمقارنة مع استدعاءات المرحلة الاستنتاجية الخفيفة الوزن، تتطلب عملية التدريب استثمارات مستمرة من قوة الحوسبة الكبيرة، وعمليات معالجة بيانات معقدة، ودعم خوارزميات تحسين عالية الكثافة، مما يجعلها "الصناعة الثقيلة" الحقيقية لبناء أنظمة الذكاء الاصطناعي. من منظور نماذج الهيكل، يمكن تقسيم أساليب التدريب إلى أربع فئات: التدريب المركزي، التدريب الموزع، التعلم الفيدرالي، والتدريب اللامركزي الذي يتم مناقشته في هذه المقالة.
تدريب مركزي هو الطريقة التقليدية الأكثر شيوعًا، حيث يتم تنفيذ جميع عمليات التدريب من قبل مؤسسة واحدة داخل مجموعة عالية الأداء محليًا، حيث يتم تنسيق تشغيل جميع مكونات الأجهزة، والبرامج الأساسية، ونظام جدولة المجموعة، وإطار التدريب بواسطة نظام تحكم موحد. هذه البنية التحتية المتكاملة تعزز كفاءة مشاركة الذاكرة، وتزامن التدرجات، وآليات تحمل الأخطاء، مما يجعلها مثالية لتدريب نماذج كبيرة مثل GPT وGemini، وتتمتع بمزايا الكفاءة العالية، وسيطرة الموارد، ولكنها تعاني أيضًا من مشكلات الاحتكار البيانات، وحواجز الموارد، واستهلاك الطاقة، والمخاطر الفردية.
التدريب الموزع هو الطريقة الرئيسية لتدريب النماذج الكبيرة في الوقت الحالي، حيث يتمثل جوهره في تقسيم مهمة تدريب النموذج وتوزيعها على عدة آلات تعمل بالتعاون، لتجاوز قيود حساب وتخزين الآلة الواحدة. على الرغم من أن لديه خصائص "اللامركزية" من الناحية الفيزيائية، إلا أن النظام الإجمالي لا يزال يتم التحكم فيه وتنسيقه من قبل مؤسسة مركزية، وغالبًا ما يعمل في بيئة شبكة محلية عالية السرعة، من خلال تقنية ناقل الاتصال العالي NVLink، حيث يتولى العقد الرئيسية تنسيق المهام الفرعية بشكل موحد. تشمل الطرق الرئيسية ما يلي:
التوازي في البيانات: كل عقدة تدرب معلمات بيانات مختلفة يتم مشاركة الأوزان النموذجية، يجب مطابقة أوزان النموذج
التوازي النموذجي: نشر أجزاء مختلفة من النموذج على عقد مختلفة لتحقيق قابلية توسع قوية
أنابيب متوازية: تنفيذ تسلسلي على مراحل، لزيادة معدل الإنتاج
التوازي باستخدام المصفوفات: تقليل دقة تقسيم حساب المصفوفة، وزيادة درجة التوازي
التدريب الموزع هو مزيج من "التحكم المركزي + التنفيذ الموزع"، وهو مشابه لمدير واحد يقوم بإدارة موظفي "المكاتب" المتعددين عن بُعد للتعاون في إكمال المهام. في الوقت الحالي، يتم تدريب جميع النماذج الكبيرة الرئيسية تقريبًا بهذه الطريقة.
اللامركزية التدريب تمثل مسارًا مستقبليًا أكثر انفتاحًا وخصائص مقاومة للرقابة. تتمثل الخصائص الأساسية في: عدة عقد غير موثوقة ( قد تكون أجهزة كمبيوتر منزلية، أو وحدات معالجة الرسوميات السحابية، أو أجهزة طرفية ) تعمل معًا لإكمال مهام التدريب بدون منسق مركزي، عادةً من خلال بروتوكولات تدفع توزيع المهام والتعاون، وبمساعدة آليات الحوافز المشفرة لضمان نزاهة المساهمات. تشمل التحديات الرئيسية التي تواجه هذا النموذج:
صعوبة التنسيق بين الأجهزة المتنوعة وتقسيم المهام: صعوبة التنسيق بين الأجهزة غير المتجانسة وكفاءة منخفضة في تقسيم المهام
اختناقات في كفاءة الاتصال: الاتصال الشبكي غير مستقر، واختناق مزامنة التدرجات واضح
نقص التنفيذ الموثوق: نقص في بيئة التنفيذ الموثوقة، مما يجعل من الصعب التحقق مما إذا كانت العقدة تشارك فعلاً في الحساب
نقص التنسيق الموحد: لا يوجد جهاز تحكم مركزي، توزيع المهام، وآلية التراجع عن الأخطاء معقدة
يمكن فهم التدريب اللامركزي على أنه: مجموعة من المتطوعين العالميين، كل منهم يساهم بقوة الحوسبة لتدريب النموذج بشكل تعاوني، لكن "التدريب اللامركزي واسع النطاق القابل للتطبيق حقًا" لا يزال تحديًا هندسيًا نظاميًا، يشمل بنية النظام، بروتوكولات الاتصال، أمان التشفير، الآليات الاقتصادية، والتحقق من النموذج على مستويات متعددة، لكن ما إذا كان يمكن "التعاون بفعالية + تحفيز الصدق + النتائج الصحيحة" لا يزال في مرحلة استكشاف النموذج الأولي المبكر.
تعتبر التعلم الفيدرالي شكلًا انتقاليًا بين التوزيع واللامركزية، حيث يركز على الاحتفاظ بالبيانات محليًا، وتجمع نموذج المعلمات مركزيًا، وهو مناسب للسيناريوهات التي تركز على الامتثال للخصوصية مثل الرعاية الصحية والمالية (. يتمتع التعلم الفيدرالي ببنية هندسية للتدريب الموزع وقدرة على التعاون المحلي، بينما يحتفظ أيضًا بمزايا توزيع البيانات في التدريب اللامركزي، لكنه لا يزال يعتمد على جهة تنسيق موثوقة، ولا يتمتع بخصائص مفتوحة تمامًا ومناهضة للرقابة. يمكن اعتباره نوعًا من "اللامركزية الخاضعة للرقابة" في سيناريوهات الامتثال للخصوصية، حيث تكون مهام التدريب، وبنية الثقة، وآلية الاتصال معتدلة نسبيًا، مما يجعله أكثر ملاءمة كهيكل نشر انتقالي في الصناعة.
اللامركزية تدريب الحدود، الفرص والطرق الواقعية
من حيث نمط التدريب، فإن التدريب اللامركزي ليس مناسبًا لجميع أنواع المهام. في بعض السيناريوهات، بسبب هيكل المهام المعقد، وارتفاع متطلبات الموارد أو صعوبة التعاون، فإنه ليس مناسبًا بطبيعته لإكماله بكفاءة بين العقد غير المتجانسة وذات الثقة المنخفضة. على سبيل المثال، تدريب النماذج الكبيرة غالبًا ما يعتمد على ذاكرة عالية، زمن استجابة منخفض وعرض نطاق ترددي عالي، مما يجعل من الصعب تقسيمه ومزامنته بشكل فعال في الشبكات المفتوحة؛ المهام التي تتطلب خصوصية البيانات وقيود السيادة قوية مقيدة بالقوانين والامتثال والقيود الأخلاقية، وبالتالي لا يمكن مشاركتها بشكل مفتوح؛ بينما المهام التي تفتقر إلى حوافز التعاون الأساسية تفتقر إلى الدافع للمشاركة الخارجية. تشكل هذه الحدود مجتمعة القيود الواقعية الحالية للتدريب اللامركزي.
لكن هذا لا يعني أن التدريب اللامركزي هو مفهوم زائف. في الواقع، تظهر التدريب اللامركزي آفاق تطبيق واضحة في أنواع المهام الخفيفة الهيكل، سهلة التوازي، والمحفزة. تشمل هذه المهام، على سبيل المثال لا الحصر: ضبط LoRA، مهام ما بعد التدريب المرتبطة بمحاذاة السلوك مثل RLHF، DPO)، تدريب وتسمية البيانات من خلال الحشود، تدريب نماذج الأساس الصغيرة القابلة للتحكم في الموارد، وسيناريوهات التدريب التعاوني التي تشارك فيها الأجهزة الطرفية. تتمتع هذه المهام عمومًا بخصائص عالية من التوازي، وانخفاض الترابط، والتحمل للقوى الحوسبية غير المتجانسة، مما يجعلها مناسبة جدًا للتدريب التعاوني عبر الشبكات P2P، وبروتوكولات Swarm، والمُحسِّنات الموزعة.
تحليل مشاريع التدريب الكلاسيكية اللامركزية
في الوقت الحالي، تشمل المشاريع الرئيسية الممثلة في مجال التدريب اللامركزي والتعلم الفيدرالي مشاريع blockchain مثل Prime Intellect وPluralis.ai وGensyn وNous Research وFlock.io. من حيث الابتكار التكنولوجي وصعوبة التنفيذ الهندسي، قدمت Prime Intellect وNous Research وPluralis.ai العديد من الاستكشافات الأصلية في تصميم الأنظمة والخوارزميات، مما يمثل الاتجاهات الرائدة في الأبحاث النظرية الحالية؛ بينما تكون مسارات التنفيذ لـ Gensyn وFlock.io واضحة نسبيًا، حيث يمكن رؤية تقدم هندسي أولي. ستقوم هذه المقالة بتحليل التقنيات الأساسية والهياكل الهندسية وراء هذه المشاريع الخمسة، كما ستناقش الاختلافات والعلاقات التكاملية بينها في نظام تدريب الذكاء الاصطناعي اللامركزي.
( Prime Intellect: رائد شبكة التعلم المعزز التعاوني القابلة للتحقق من المسار التدريبي
تسعى Prime Intellect إلى بناء شبكة تدريب AI لا تتطلب الثقة، مما يسمح لأي شخص بالمشاركة في التدريب والحصول على مكافآت موثوقة مقابل مساهماته الحسابية. تأمل Prime Intellect في إنشاء نظام تدريب AI اللامركزي القابل للتحقق، المفتوح، والذي يحتوي على آلية تحفيزية كاملة من خلال ثلاثة وحدات رئيسية: PRIME-RL + TOPLOC + SHARDCAST.
)# 01، هيكل بروتوكول Prime Intellect و قيمة الوحدات الرئيسية
![كأس القدر في Crypto AI: استكشاف الحدود في التدريب اللامركزي]###https://img-cdn.gateio.im/webp-social/moments-69eb6c2dab3d6284b890285c71e7a47f.webp###
(# 02، شرح آلية تدريب Prime Intellect الرئيسية
#PRIME-RL: هيكل مهمة التعلم المعزز غير المتزامن المفكك
PRIME-RL هو إطار نموذج المهمة والتنفيذ المصمم من قبل Prime Intellect لسيناريوهات التدريب اللامركزية، مصمم خصيصًا للشبكات المتنوعة والمشاركة غير المتزامنة. يعتمد على التعلم المعزز كهدف ملائم أولوي، حيث يفصل بشكل هيكلي عمليات التدريب والاستدلال ورفع الأوزان، مما يمكّن كل عقدة تدريب من إكمال دورة المهمة بشكل مستقل محليًا، والتعاون من خلال واجهات معيارية وآليات التحقق والتجميع. بالمقارنة مع العمليات التقليدية للتعلم الخاضع للإشراف، فإن PRIME-RL أكثر ملاءمة لتحقيق التدريب المرن في بيئات بدون جدولة مركزية، مما يقلل من تعقيد النظام، ويفتح المجال لدعم المهام المتعددة بالتوازي وتطور الاستراتيجيات.
#TOPLOC:آلية التحقق من سلوك التدريب الخفيف
TOPLOC)المراقبة الموثوقة & فحص الموقع### هو آلية أساسية للتحقق من قابلية التدريب اقترحها Prime Intellect، تُستخدم لتحديد ما إذا كان العقدة قد أكملت فعلاً تعلم السياسة بشكل فعال بناءً على بيانات المراقبة. على عكس الحلول الثقيلة مثل ZKML، لا يعتمد TOPLOC على إعادة حساب النموذج الكامل، بل من خلال تحليل "تسلسل المراقبة↔تحديث السياسة" بين المسارات المحلية المتسقة، يُكمل التحقق من الهيكل الخفيف. إنه أول من يحول مسارات السلوك أثناء عملية التدريب إلى كائنات قابلة للتحقق، وهو الابتكار الأساسي لتحقيق توزيع مكافآت التدريب دون الحاجة إلى الثقة، مما يوفر مسارًا قابلاً للتطبيق لبناء شبكة تدريب تعاونية لامركزية قابلة للتدقيق والتحفيز.
#SHARDCAST: بروتوكول تجميع ونشر الوزن غير المتزامن
SHARDCAST هو بروتوكول لنقل الوزن وتجميعه مصمم بواسطة Prime Intellect، مُ optimized لبيئات الشبكة الحقيقية غير المتزامنة، ذات النطاق الترددي المحدود وحالات العقد المتغيرة. يجمع بين آلية نقل gossip واستراتيجيات التزامن المحلي، مما يسمح لعدة عقد بتقديم تحديثات جزئية باستمرار في حالات غير متزامنة، مما يحقق التقارب التدريجي للأوزان وتطورات متعددة النسخ. مقارنةً بأساليب AllReduce المركزية أو المتزامنة، يُحسّن SHARDCAST بشكل ملحوظ من قابلية توسيع التدريب اللامركزي وقدرته على تحمل الأخطاء، وهو الأساس المركزي لبناء توافق الأوزان المستقر وتدريب مستمر يتكرر.
#OpenDiLoCo: إطار الاتصالات غير المتزامنة المتناثرة
OpenDiLoCo هو إطار عمل لتحسين الاتصالات تم تطويره بشكل مستقل ومفتوح المصدر من قبل فريق Prime Intellect بناءً على مفهوم DiLoCo الذي اقترحته DeepMind، وهو مصمم خصيصًا لمواجهة التحديات الشائعة في التدريب اللامركزي مثل قيود عرض النطاق الترددي، وتنوع الأجهزة، وعدم استقرار العقد. تعتمد هيكله على التوازي البياني، من خلال بناء هياكل طوبولوجية نادرة مثل Ring وExpander وSmall-World، مما يتجنب تكاليف الاتصال العالية للتزامن العالمي، ويعتمد فقط على العقد الجارة المحلية لإكمال التدريب التعاوني للنموذج. مع الجمع بين التحديثات غير المتزامنة وآلية تحمل النقاط الفاشلة، يتيح OpenDiLoCo لمجموعات GPU الاستهلاكية والأجهزة الطرفية المشاركة بشكل مستقر في مهام التدريب، مما يعزز بشكل كبير إمكانية المشاركة في التدريب العالمي، وهو أحد البنى التحتية الأساسية للاتصالات لبناء شبكة تدريب لامركزية.
#PCCL: مكتبة الاتصالات التعاونية
PCCL(Prime Collective Communication Library) هو مكتبة اتصالات خفيفة الوزن مصممة خصيصاً من قبل Prime Intellect لبيئة تدريب الذكاء الاصطناعي اللامركزية، تهدف إلى حل عنق الزجاجة في التكيف الذي تواجهه مكتبات الاتصالات التقليدية في الأجهزة غير المتجانسة والشبكات ذات النطاق الترددي المنخفض. تدعم PCCL البنية النادرة، وضغط التدرجات، والتزامن منخفض الدقة، واستعادة النقاط المقطوعة، ويمكن تشغيلها على وحدات معالجة الرسوميات الاستهلاكية والعقد غير المستقرة، وهي مكون أساسي يدعم قدرة الاتصالات غير المتزامنة لبروتوكول OpenDiLoCo. لقد عززت بشكل كبير من تحمل النطاق الترددي لشبكات التدريب وتوافق الأجهزة، مما مهد الطريق لبناء شبكة تدريب تعاونية مفتوحة حقاً وموثوقة.
(# 03، شبكة Prime Intellect للتحفيز وتوزيع الأدوار
بني Prime Intellect شبكة تدريب قابلة للتحقق وغير مرخصة، مزودة بآلية حوافز اقتصادية، مما يسمح لأي شخص بالمشاركة في المهام والحصول على مكافآت بناءً على المساهمات الحقيقية. يعتمد البروتوكول على ثلاث فئات من الأدوار الأساسية:
م initiator: تعريف بيئة التدريب، النموذج الأولي، دالة المكافأة ومعايير التحقق
عقدة التدريب: تنفيذ التدريب المحلي، تقديم تحديثات الوزن ومسارات المراقبة
عقد التحقق: استخدام آلية TOPLOC للتحقق من صحة سلوك التدريب، والمشاركة في حساب المكافآت وتجميع الاستراتيجيات
تتضمن العملية الأساسية للبروتوكول نشر المهام، تدريب العقد، التحقق من المسارات، تجميع الأوزان )SHARDCAST### وتوزيع المكافآت، مما يشكل حلقة تحفيزية حول "سلوك التدريب الحقيقي".
(# 04، INTELLECT-2: إطلاق أول نموذج تدريب قابل للتحقق اللامركزية
قامت Prime Intellect بإصدار INTELLECT-2 في مايو 2025، وهو أول نموذج كبير للتعلم المعزز يتم تدريبه من خلال التعاون بين عقد لامركزية غير موثوقة وغير متزامنة على مستوى العالم، مع حجم معلمات يصل إلى 32B. تم تدريب نموذج INTELLECT-2 بالتعاون بين أكثر من 100 عقدة GPU غير متجانسة منتشرة عبر ثلاث قارات، باستخدام بنية غير متزامنة تمامًا، واستغرقت عملية التدريب أكثر من 400 ساعة، مما يظهر جدوى واستقرار الشبكة التعاونية غير المتزامنة. هذا النموذج ليس فقط突破ًا في الأداء، ولكنه أيضًا يمثل Prime Intellect.
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
تسجيلات الإعجاب 14
أعجبني
14
6
مشاركة
تعليق
0/400
FudVaccinator
· 07-22 12:29
إذن فإن الأموال الكبيرة محتكرة في يد المركزية.
شاهد النسخة الأصليةرد0
MissedAirdropBro
· 07-20 13:31
مرة أخرى وجبة من التحليل التحليل. أشعر بالتعب.
شاهد النسخة الأصليةرد0
ZenChainWalker
· 07-20 10:38
من يقرضني بضع بطاقات 3090 لتعديل النماذج
شاهد النسخة الأصليةرد0
OldLeekConfession
· 07-20 10:38
يا له من شيء رائع، أليس هو مجرد جهاز جري حرره الذكاء الاصطناعي؟
اختراق تدريب الذكاء الاصطناعي اللامركزي: Prime Intellect تبني شبكة تعاونية قابلة للتحقق
الكأس المقدس لـ Crypto AI: استكشاف الحدود للتدريب اللامركزي
في سلسلة القيمة الكاملة للذكاء الاصطناعي، يُعتبر تدريب النماذج هو المرحلة الأكثر استهلاكًا للموارد والأعلى من حيث العوائق التقنية، حيث يحدد مباشرة القدرة القصوى للنموذج وفعالية التطبيق الفعلية. بالمقارنة مع استدعاءات المرحلة الاستنتاجية الخفيفة الوزن، تتطلب عملية التدريب استثمارات مستمرة من قوة الحوسبة الكبيرة، وعمليات معالجة بيانات معقدة، ودعم خوارزميات تحسين عالية الكثافة، مما يجعلها "الصناعة الثقيلة" الحقيقية لبناء أنظمة الذكاء الاصطناعي. من منظور نماذج الهيكل، يمكن تقسيم أساليب التدريب إلى أربع فئات: التدريب المركزي، التدريب الموزع، التعلم الفيدرالي، والتدريب اللامركزي الذي يتم مناقشته في هذه المقالة.
تدريب مركزي هو الطريقة التقليدية الأكثر شيوعًا، حيث يتم تنفيذ جميع عمليات التدريب من قبل مؤسسة واحدة داخل مجموعة عالية الأداء محليًا، حيث يتم تنسيق تشغيل جميع مكونات الأجهزة، والبرامج الأساسية، ونظام جدولة المجموعة، وإطار التدريب بواسطة نظام تحكم موحد. هذه البنية التحتية المتكاملة تعزز كفاءة مشاركة الذاكرة، وتزامن التدرجات، وآليات تحمل الأخطاء، مما يجعلها مثالية لتدريب نماذج كبيرة مثل GPT وGemini، وتتمتع بمزايا الكفاءة العالية، وسيطرة الموارد، ولكنها تعاني أيضًا من مشكلات الاحتكار البيانات، وحواجز الموارد، واستهلاك الطاقة، والمخاطر الفردية.
التدريب الموزع هو الطريقة الرئيسية لتدريب النماذج الكبيرة في الوقت الحالي، حيث يتمثل جوهره في تقسيم مهمة تدريب النموذج وتوزيعها على عدة آلات تعمل بالتعاون، لتجاوز قيود حساب وتخزين الآلة الواحدة. على الرغم من أن لديه خصائص "اللامركزية" من الناحية الفيزيائية، إلا أن النظام الإجمالي لا يزال يتم التحكم فيه وتنسيقه من قبل مؤسسة مركزية، وغالبًا ما يعمل في بيئة شبكة محلية عالية السرعة، من خلال تقنية ناقل الاتصال العالي NVLink، حيث يتولى العقد الرئيسية تنسيق المهام الفرعية بشكل موحد. تشمل الطرق الرئيسية ما يلي:
التدريب الموزع هو مزيج من "التحكم المركزي + التنفيذ الموزع"، وهو مشابه لمدير واحد يقوم بإدارة موظفي "المكاتب" المتعددين عن بُعد للتعاون في إكمال المهام. في الوقت الحالي، يتم تدريب جميع النماذج الكبيرة الرئيسية تقريبًا بهذه الطريقة.
اللامركزية التدريب تمثل مسارًا مستقبليًا أكثر انفتاحًا وخصائص مقاومة للرقابة. تتمثل الخصائص الأساسية في: عدة عقد غير موثوقة ( قد تكون أجهزة كمبيوتر منزلية، أو وحدات معالجة الرسوميات السحابية، أو أجهزة طرفية ) تعمل معًا لإكمال مهام التدريب بدون منسق مركزي، عادةً من خلال بروتوكولات تدفع توزيع المهام والتعاون، وبمساعدة آليات الحوافز المشفرة لضمان نزاهة المساهمات. تشمل التحديات الرئيسية التي تواجه هذا النموذج:
يمكن فهم التدريب اللامركزي على أنه: مجموعة من المتطوعين العالميين، كل منهم يساهم بقوة الحوسبة لتدريب النموذج بشكل تعاوني، لكن "التدريب اللامركزي واسع النطاق القابل للتطبيق حقًا" لا يزال تحديًا هندسيًا نظاميًا، يشمل بنية النظام، بروتوكولات الاتصال، أمان التشفير، الآليات الاقتصادية، والتحقق من النموذج على مستويات متعددة، لكن ما إذا كان يمكن "التعاون بفعالية + تحفيز الصدق + النتائج الصحيحة" لا يزال في مرحلة استكشاف النموذج الأولي المبكر.
تعتبر التعلم الفيدرالي شكلًا انتقاليًا بين التوزيع واللامركزية، حيث يركز على الاحتفاظ بالبيانات محليًا، وتجمع نموذج المعلمات مركزيًا، وهو مناسب للسيناريوهات التي تركز على الامتثال للخصوصية مثل الرعاية الصحية والمالية (. يتمتع التعلم الفيدرالي ببنية هندسية للتدريب الموزع وقدرة على التعاون المحلي، بينما يحتفظ أيضًا بمزايا توزيع البيانات في التدريب اللامركزي، لكنه لا يزال يعتمد على جهة تنسيق موثوقة، ولا يتمتع بخصائص مفتوحة تمامًا ومناهضة للرقابة. يمكن اعتباره نوعًا من "اللامركزية الخاضعة للرقابة" في سيناريوهات الامتثال للخصوصية، حيث تكون مهام التدريب، وبنية الثقة، وآلية الاتصال معتدلة نسبيًا، مما يجعله أكثر ملاءمة كهيكل نشر انتقالي في الصناعة.
اللامركزية تدريب الحدود، الفرص والطرق الواقعية
من حيث نمط التدريب، فإن التدريب اللامركزي ليس مناسبًا لجميع أنواع المهام. في بعض السيناريوهات، بسبب هيكل المهام المعقد، وارتفاع متطلبات الموارد أو صعوبة التعاون، فإنه ليس مناسبًا بطبيعته لإكماله بكفاءة بين العقد غير المتجانسة وذات الثقة المنخفضة. على سبيل المثال، تدريب النماذج الكبيرة غالبًا ما يعتمد على ذاكرة عالية، زمن استجابة منخفض وعرض نطاق ترددي عالي، مما يجعل من الصعب تقسيمه ومزامنته بشكل فعال في الشبكات المفتوحة؛ المهام التي تتطلب خصوصية البيانات وقيود السيادة قوية مقيدة بالقوانين والامتثال والقيود الأخلاقية، وبالتالي لا يمكن مشاركتها بشكل مفتوح؛ بينما المهام التي تفتقر إلى حوافز التعاون الأساسية تفتقر إلى الدافع للمشاركة الخارجية. تشكل هذه الحدود مجتمعة القيود الواقعية الحالية للتدريب اللامركزي.
لكن هذا لا يعني أن التدريب اللامركزي هو مفهوم زائف. في الواقع، تظهر التدريب اللامركزي آفاق تطبيق واضحة في أنواع المهام الخفيفة الهيكل، سهلة التوازي، والمحفزة. تشمل هذه المهام، على سبيل المثال لا الحصر: ضبط LoRA، مهام ما بعد التدريب المرتبطة بمحاذاة السلوك مثل RLHF، DPO)، تدريب وتسمية البيانات من خلال الحشود، تدريب نماذج الأساس الصغيرة القابلة للتحكم في الموارد، وسيناريوهات التدريب التعاوني التي تشارك فيها الأجهزة الطرفية. تتمتع هذه المهام عمومًا بخصائص عالية من التوازي، وانخفاض الترابط، والتحمل للقوى الحوسبية غير المتجانسة، مما يجعلها مناسبة جدًا للتدريب التعاوني عبر الشبكات P2P، وبروتوكولات Swarm، والمُحسِّنات الموزعة.
تحليل مشاريع التدريب الكلاسيكية اللامركزية
في الوقت الحالي، تشمل المشاريع الرئيسية الممثلة في مجال التدريب اللامركزي والتعلم الفيدرالي مشاريع blockchain مثل Prime Intellect وPluralis.ai وGensyn وNous Research وFlock.io. من حيث الابتكار التكنولوجي وصعوبة التنفيذ الهندسي، قدمت Prime Intellect وNous Research وPluralis.ai العديد من الاستكشافات الأصلية في تصميم الأنظمة والخوارزميات، مما يمثل الاتجاهات الرائدة في الأبحاث النظرية الحالية؛ بينما تكون مسارات التنفيذ لـ Gensyn وFlock.io واضحة نسبيًا، حيث يمكن رؤية تقدم هندسي أولي. ستقوم هذه المقالة بتحليل التقنيات الأساسية والهياكل الهندسية وراء هذه المشاريع الخمسة، كما ستناقش الاختلافات والعلاقات التكاملية بينها في نظام تدريب الذكاء الاصطناعي اللامركزي.
( Prime Intellect: رائد شبكة التعلم المعزز التعاوني القابلة للتحقق من المسار التدريبي
تسعى Prime Intellect إلى بناء شبكة تدريب AI لا تتطلب الثقة، مما يسمح لأي شخص بالمشاركة في التدريب والحصول على مكافآت موثوقة مقابل مساهماته الحسابية. تأمل Prime Intellect في إنشاء نظام تدريب AI اللامركزي القابل للتحقق، المفتوح، والذي يحتوي على آلية تحفيزية كاملة من خلال ثلاثة وحدات رئيسية: PRIME-RL + TOPLOC + SHARDCAST.
)# 01، هيكل بروتوكول Prime Intellect و قيمة الوحدات الرئيسية
![كأس القدر في Crypto AI: استكشاف الحدود في التدريب اللامركزي]###https://img-cdn.gateio.im/webp-social/moments-69eb6c2dab3d6284b890285c71e7a47f.webp###
(# 02، شرح آلية تدريب Prime Intellect الرئيسية
#PRIME-RL: هيكل مهمة التعلم المعزز غير المتزامن المفكك
PRIME-RL هو إطار نموذج المهمة والتنفيذ المصمم من قبل Prime Intellect لسيناريوهات التدريب اللامركزية، مصمم خصيصًا للشبكات المتنوعة والمشاركة غير المتزامنة. يعتمد على التعلم المعزز كهدف ملائم أولوي، حيث يفصل بشكل هيكلي عمليات التدريب والاستدلال ورفع الأوزان، مما يمكّن كل عقدة تدريب من إكمال دورة المهمة بشكل مستقل محليًا، والتعاون من خلال واجهات معيارية وآليات التحقق والتجميع. بالمقارنة مع العمليات التقليدية للتعلم الخاضع للإشراف، فإن PRIME-RL أكثر ملاءمة لتحقيق التدريب المرن في بيئات بدون جدولة مركزية، مما يقلل من تعقيد النظام، ويفتح المجال لدعم المهام المتعددة بالتوازي وتطور الاستراتيجيات.
#TOPLOC:آلية التحقق من سلوك التدريب الخفيف
TOPLOC)المراقبة الموثوقة & فحص الموقع### هو آلية أساسية للتحقق من قابلية التدريب اقترحها Prime Intellect، تُستخدم لتحديد ما إذا كان العقدة قد أكملت فعلاً تعلم السياسة بشكل فعال بناءً على بيانات المراقبة. على عكس الحلول الثقيلة مثل ZKML، لا يعتمد TOPLOC على إعادة حساب النموذج الكامل، بل من خلال تحليل "تسلسل المراقبة↔تحديث السياسة" بين المسارات المحلية المتسقة، يُكمل التحقق من الهيكل الخفيف. إنه أول من يحول مسارات السلوك أثناء عملية التدريب إلى كائنات قابلة للتحقق، وهو الابتكار الأساسي لتحقيق توزيع مكافآت التدريب دون الحاجة إلى الثقة، مما يوفر مسارًا قابلاً للتطبيق لبناء شبكة تدريب تعاونية لامركزية قابلة للتدقيق والتحفيز.
#SHARDCAST: بروتوكول تجميع ونشر الوزن غير المتزامن
SHARDCAST هو بروتوكول لنقل الوزن وتجميعه مصمم بواسطة Prime Intellect، مُ optimized لبيئات الشبكة الحقيقية غير المتزامنة، ذات النطاق الترددي المحدود وحالات العقد المتغيرة. يجمع بين آلية نقل gossip واستراتيجيات التزامن المحلي، مما يسمح لعدة عقد بتقديم تحديثات جزئية باستمرار في حالات غير متزامنة، مما يحقق التقارب التدريجي للأوزان وتطورات متعددة النسخ. مقارنةً بأساليب AllReduce المركزية أو المتزامنة، يُحسّن SHARDCAST بشكل ملحوظ من قابلية توسيع التدريب اللامركزي وقدرته على تحمل الأخطاء، وهو الأساس المركزي لبناء توافق الأوزان المستقر وتدريب مستمر يتكرر.
#OpenDiLoCo: إطار الاتصالات غير المتزامنة المتناثرة
OpenDiLoCo هو إطار عمل لتحسين الاتصالات تم تطويره بشكل مستقل ومفتوح المصدر من قبل فريق Prime Intellect بناءً على مفهوم DiLoCo الذي اقترحته DeepMind، وهو مصمم خصيصًا لمواجهة التحديات الشائعة في التدريب اللامركزي مثل قيود عرض النطاق الترددي، وتنوع الأجهزة، وعدم استقرار العقد. تعتمد هيكله على التوازي البياني، من خلال بناء هياكل طوبولوجية نادرة مثل Ring وExpander وSmall-World، مما يتجنب تكاليف الاتصال العالية للتزامن العالمي، ويعتمد فقط على العقد الجارة المحلية لإكمال التدريب التعاوني للنموذج. مع الجمع بين التحديثات غير المتزامنة وآلية تحمل النقاط الفاشلة، يتيح OpenDiLoCo لمجموعات GPU الاستهلاكية والأجهزة الطرفية المشاركة بشكل مستقر في مهام التدريب، مما يعزز بشكل كبير إمكانية المشاركة في التدريب العالمي، وهو أحد البنى التحتية الأساسية للاتصالات لبناء شبكة تدريب لامركزية.
#PCCL: مكتبة الاتصالات التعاونية
PCCL(Prime Collective Communication Library) هو مكتبة اتصالات خفيفة الوزن مصممة خصيصاً من قبل Prime Intellect لبيئة تدريب الذكاء الاصطناعي اللامركزية، تهدف إلى حل عنق الزجاجة في التكيف الذي تواجهه مكتبات الاتصالات التقليدية في الأجهزة غير المتجانسة والشبكات ذات النطاق الترددي المنخفض. تدعم PCCL البنية النادرة، وضغط التدرجات، والتزامن منخفض الدقة، واستعادة النقاط المقطوعة، ويمكن تشغيلها على وحدات معالجة الرسوميات الاستهلاكية والعقد غير المستقرة، وهي مكون أساسي يدعم قدرة الاتصالات غير المتزامنة لبروتوكول OpenDiLoCo. لقد عززت بشكل كبير من تحمل النطاق الترددي لشبكات التدريب وتوافق الأجهزة، مما مهد الطريق لبناء شبكة تدريب تعاونية مفتوحة حقاً وموثوقة.
(# 03، شبكة Prime Intellect للتحفيز وتوزيع الأدوار
بني Prime Intellect شبكة تدريب قابلة للتحقق وغير مرخصة، مزودة بآلية حوافز اقتصادية، مما يسمح لأي شخص بالمشاركة في المهام والحصول على مكافآت بناءً على المساهمات الحقيقية. يعتمد البروتوكول على ثلاث فئات من الأدوار الأساسية:
تتضمن العملية الأساسية للبروتوكول نشر المهام، تدريب العقد، التحقق من المسارات، تجميع الأوزان )SHARDCAST### وتوزيع المكافآت، مما يشكل حلقة تحفيزية حول "سلوك التدريب الحقيقي".
(# 04، INTELLECT-2: إطلاق أول نموذج تدريب قابل للتحقق اللامركزية
قامت Prime Intellect بإصدار INTELLECT-2 في مايو 2025، وهو أول نموذج كبير للتعلم المعزز يتم تدريبه من خلال التعاون بين عقد لامركزية غير موثوقة وغير متزامنة على مستوى العالم، مع حجم معلمات يصل إلى 32B. تم تدريب نموذج INTELLECT-2 بالتعاون بين أكثر من 100 عقدة GPU غير متجانسة منتشرة عبر ثلاث قارات، باستخدام بنية غير متزامنة تمامًا، واستغرقت عملية التدريب أكثر من 400 ساعة، مما يظهر جدوى واستقرار الشبكة التعاونية غير المتزامنة. هذا النموذج ليس فقط突破ًا في الأداء، ولكنه أيضًا يمثل Prime Intellect.