Crypto AI'nin Kutsal Kâsesi: Merkeziyetsizlikte Eğitimdeki Sınırları Zorlamak
AI'nin tüm değer zincirinde, model eğitimi en fazla kaynak tüketen ve en yüksek teknik engeli olan aşamadır, doğrudan modelin yetenek sınırını ve gerçek uygulama etkisini belirler. Çıkarım aşamasının hafif kullanımına kıyasla, eğitim süreci sürekli büyük ölçekli hesaplama gücü yatırımı, karmaşık veri işleme süreçleri ve yüksek yoğunlukta optimizasyon algoritması desteği gerektirir; bu, AI sisteminin inşasında gerçek bir "ağır sanayi"dir. Mimari paradigması açısından, eğitim yöntemleri dört türe ayrılabilir: merkezi eğitim, dağıtık eğitim, federatif öğrenme ve bu makalede ana odak olan Merkeziyetsizlik eğitimi.
Merkeziyetsiz eğitim, tek bir kuruluşun yerel yüksek performans kümeleri içinde tüm eğitim süreçlerini tamamladığı en yaygın geleneksel yöntemdir. Donanım, alt yazılım, küme planlama sistemi ve eğitim çerçevesinin tüm bileşenleri, tek bir kontrol sistemi tarafından koordine edilen bir şekilde çalışır. Bu derin işbirliği mimarisi, bellek paylaşımı, gradyan senkronizasyonu ve hata toleransı mekanizmalarının verimliliğini en üst düzeye çıkarır ve GPT, Gemini gibi büyük ölçekli modellerin eğitimine çok uygundur. Yüksek verimlilik ve kontrol edilebilir kaynaklar gibi avantajlara sahip olmasına rağmen, aynı zamanda veri tekelcilği, kaynak engelleri, enerji tüketimi ve tek nokta riski gibi sorunları da barındırmaktadır.
Dağıtık eğitim, günümüzde büyük model eğitiminin ana akım yöntemidir. Temelinde, model eğitim görevlerinin parçalanarak birden fazla makineye dağıtılarak iş birliği içinde gerçekleştirilmesi yatmaktadır. Bu, tek makine hesaplama ve depolama darboğazlarını aşmayı amaçlamaktadır. Fiziksel olarak "dağıtık" özelliklere sahip olmasına rağmen, genel olarak merkezi bir kurum tarafından kontrol edilen planlama ve senkronizasyon ile çalışmaktadır. Genellikle yüksek hızlı yerel ağ ortamlarında çalışır ve NVLink yüksek hızlı bağlantı teknolojisi ile ana düğüm, alt görevleri koordine eder. Ana akım yöntemler arasında şunlar bulunmaktadır:
Veri paralelliği: Her düğüm farklı veri parametreleri ile eğitim yapar, model ağırlıklarının eşleşmesi gerekir.
Model paralelliği: Modelin farklı kısımlarını farklı düğümlere dağıtarak güçlü ölçeklenebilirlik sağlamak
Boru hattı paralel: Aşamalı seri yürütme, throughput'u artırma
Tensör paralelliği: Matris hesaplamalarını ince bir şekilde bölerek paralel granüllüğü artırma
Dağıtık eğitim, "merkezi kontrol + dağıtık yürütme" kombinasyonudur, aynı patronun uzaktan birden fazla "ofis" çalışanının iş birliği yaparak görevleri tamamlamasını benzetir. Şu anda neredeyse tüm ana akım büyük modeller bu şekilde eğitim almaktadır.
Merkeziyetsizlik eğitimi, daha açık ve sansüre dayanıklı bir gelecek yolu anlamına gelir. Temel özellikleri şunlardır: birbirine güvenmeyen birden fazla düğüm ( ev bilgisayarları, bulut GPU'ları veya kenar cihazları ) merkezi bir koordinatör olmadan eğitim görevlerini işbirliği içinde tamamlayabilir; genellikle protokoller aracılığıyla görev dağıtımı ve işbirliği sağlanır ve katkının dürüstlüğünü güvence altına almak için şifreleme teşvik mekanizmaları kullanılır. Bu modelin karşılaştığı başlıca zorluklar şunlardır:
Cihaz çeşitliliği ve parçalama zorluğu: Heterojen cihazların koordine edilmesi zordur, görev parçalama verimliliği düşüktür.
İletişim verimliliği darboğazı: Ağ iletişimi istikrarsız, gradyan senkronizasyonu darboğazı belirgin.
Birlikte koordinasyon eksikliği: Merkezi bir denetleyici yok, görev dağıtımı, hata geri alma mekanizması karmaşık
Merkeziyetsizlik eğitimi, dünya genelindeki bir grup gönüllünün, her birinin model eğitimi için hesaplama gücü katkısında bulunarak işbirliği yaptığı anlamına gelebilir; ancak "gerçekten uygulanabilir büyük ölçekli merkeziyetsiz eğitim" hâlâ sistematik bir mühendislik zorluğudur ve sistem mimarisi, iletişim protokolleri, şifre güvenliği, ekonomik mekanizmalar, model doğrulaması gibi birçok düzeyi kapsamaktadır. Ancak "işbirliği etkili + dürüstlüğü teşvik etme + doğru sonuçlar" sağlanıp sağlanamayacağı hâlâ erken prototip keşif aşamasındadır.
Federated learning, as a transitional form between distributed and Merkeziyetsizlik, emphasizes local data retention and centralized aggregation of model parameters, and is suitable for privacy-compliant scenarios such as healthcare and finance (. Federated learning has the engineering structure of distributed training and local collaboration capabilities, while also possessing the data dispersion advantages of decentralized training, but still relies on trusted coordinating parties and does not have the characteristics of being completely open and resistant to censorship. It can be seen as a "controlled decentralization" solution in privacy-compliant scenarios, relatively mild in terms of training tasks, trust structures, and communication mechanisms, making it more suitable as a transitional deployment architecture in the industry.
Merkeziyetsizlik eğitiminin sınırları, fırsatları ve gerçek yolları
Eğitim paradigması açısından, merkeziyetsiz eğitim her görev türü için uygun değildir. Bazı senaryolarında, görev yapısının karmaşık olması, kaynak gereksinimlerinin son derece yüksek olması veya işbirliği zorluğunun büyük olması nedeniyle, doğal olarak heterojen, güvenilir olmayan düğümler arasında verimli bir şekilde tamamlanması uygun değildir. Örneğin, büyük model eğitimi genellikle yüksek bellek, düşük gecikme ve yüksek bant genişliğine dayanır, açık ağlarda etkili bir şekilde bölünmesi ve senkronize edilmesi zordur; veri gizliliği ve egemenlik kısıtlamalarının güçlü olduğu görevler, yasal uyumluluk ve etik kısıtlamalar nedeniyle açıkça paylaşılamaz; işbirliği teşviklerinin yetersiz olduğu görevlerde ise dış katılım motivasyonu eksiktir. Bu sınırlar, mevcut merkeziyetsiz eğitimin gerçek kısıtlamalarını oluşturmaktadır.
Ancak bu, merkeziyetsizlikle eğitimlerin sahte bir kavram olduğu anlamına gelmez. Aslında, yapı olarak hafif, paralel hale getirilebilir ve teşvik edilebilir görev türlerinde merkeziyetsiz eğitimlerin belirgin bir uygulama potansiyeli vardır. Bunun arasında, ancak bunlarla sınırlı olmamak üzere: LoRA ince ayarı, davranış uyumlu son eğitim görevleri ), RLHF, DPO (, veri kalabalıklaştırma eğitimi ve etiketleme görevleri, kaynak kontrolüne sahip küçük temel model eğitimi ve kenar cihazların katıldığı işbirlikçi eğitim senaryoları bulunmaktadır. Bu görevler genel olarak yüksek paralellik, düşük bağlanabilirlik ve heterojen hesaplama gücüne tolerans gösterme özelliklerine sahiptir ve bu nedenle P2P ağları, Swarm protokolleri, dağıtık optimizatörler gibi yollarla işbirlikçi eğitim için oldukça uygundur.
![Crypto AI'nin Kutsal Kâsesi: Merkeziyetsizlik eğitiminde öncü keşif])https://img-cdn.gateio.im/webp-social/moments-adb92bc4dfbaf26863cb0b4bb1081cd7.webp(
Merkeziyetsizlik eğitimi klasik proje analizi
Şu anda merkeziyetsizlik eğitim ve federated öğrenme öncülüğünde, temsil niteliği taşıyan blok zinciri projeleri arasında Prime Intellect, Pluralis.ai, Gensyn, Nous Research ve Flock.io bulunmaktadır. Teknik yenilikçilik ve mühendislik uygulama zorluğu açısından, Prime Intellect, Nous Research ve Pluralis.ai sistem mimarisi ve algoritma tasarımında daha fazla özgün keşif önermiştir ve mevcut teorik araştırmaların öncü yönlerini temsil etmektedir; Gensyn ve Flock.io'nun uygulama yolları ise göreceli olarak nettir ve ilk mühendislik ilerlemelerini görebilmekteyiz. Bu makalede, bu beş projenin arkasındaki temel teknolojileri ve mühendislik mimarisi yollarını sırayla analiz edecek ve merkeziyetsiz AI eğitim sistemindeki farklılıklarını ve tamamlayıcı ilişkilerini daha da tartışacağız.
) Prime Intellect: Eğitim izleri doğrulanabilir güçlendirilmiş öğrenme işbirlikçi ağ öncüsü
Prime Intellect, güvene ihtiyaç duymayan bir AI eğitim ağı inşa etmeye kararlıdır, böylece herkes eğitim sürecine katılabilir ve hesaplama katkıları için güvenilir ödüller alabilir. Prime Intellect, PRİME-RL + TOPLOC + SHARDCAST üç ana modülü aracılığıyla, doğrulanabilir, açık ve teşvik mekanizmalarının eksiksiz olduğu bir AI Merkeziyetsizlik eğitim sistemi inşa etmeyi hedeflemektedir.
01, Prime Intellect protokol yığını yapısı ve ana modül değerleri
![Crypto AI'nin Kutsal Kadehi: Merkeziyetsizlik Eğitiminin Sınırlarını Keşfetmek]###https://img-cdn.gateio.im/webp-social/moments-69eb6c2dab3d6284b890285c71e7a47f.webp(
)# 02, Prime Intellect eğitiminin ana mekanizmalarının detaylı açıklaması
#PRIME-RL: Koparılmış Asenkron Güçlendirme Öğrenme Görev Mimarisi
PRIME-RL, Prime Intellect tarafından merkeziyetsiz eğitim senaryoları için özelleştirilmiş bir görev modelleme ve yürütme çerçevesidir. Heterojen ağlar ve asenkron katılımcılar için özel olarak tasarlanmıştır. Güçlendirme öğrenimini öncelikli uyum nesnesi olarak kullanır, eğitim, çıkarım ve ağırlık yükleme süreçlerini yapısal olarak ayrıştırır, böylece her eğitim düğümü yerel olarak bağımsız bir görev döngüsü tamamlayabilir ve standart arayüzler aracılığıyla doğrulama ve toplama mekanizmaları ile iş birliği yapabilir. Geleneksel denetimli öğrenme süreçleri ile karşılaştırıldığında, PRIME-RL, merkezi bir planlama ortamında esnek eğitim sağlamak için daha uygundur; bu, sistem karmaşıklığını azaltır ve çoklu görev paralelliği ve strateji evrimi için bir temel oluşturur.
#TOPLOC:Ağırlıklandırılmış Eğitim Davranış Doğrulama Mekanizması
TOPLOC###Güvenilir Gözlem & Politika-Yerel Kontrol(, Prime Intellect tarafından önerilen eğitim doğrulama çekirdek mekanizmasıdır ve bir düğümün gerçekten gözlem verilerine dayalı olarak etkili bir politika öğrenimi gerçekleştirip gerçekleştirmediğini belirlemek için kullanılır. ZKML gibi ağır çözümlerden farklı olarak, TOPLOC tam model yeniden hesaplamasına dayanmaz, bunun yerine "gözlem dizisi↔politika güncellemesi" arasındaki yerel tutarlılık izini analiz ederek hafif yapı doğrulaması gerçekleştirir. Eğitim sürecindeki davranış izlerini doğrulanabilir nesnelere dönüştüren ilk yöntemdir ve güvene dayanmayan eğitim ödül dağıtımını gerçekleştirmek için anahtar yeniliklerdendir. Denetlenebilir ve teşvik edici bir Merkeziyetsizlik işbirlikçi eğitim ağı kurmak için uygulanabilir bir yol sunar.
#SHARDCAST: Asenkron Ağırlık Toplama ve Yayılma Protokolü
SHARDCAST, Prime Intellect tarafından tasarlanan ağırlık yayılımı ve toplama protokolüdür, asenkron, bant genişliği kısıtlı ve düğüm durumlarının sürekli değiştiği gerçek ağ ortamları için optimize edilmiştir. Gossip yayılım mekanizmasını ve yerel senkronizasyon stratejilerini birleştirerek, birden fazla düğümün senkronize olmayan durumlarda sürekli olarak kısmi güncellemeler göndermesine olanak tanır, ağırlıkların kademeli olarak yakınsamasını ve çoklu versiyon evrimini gerçekleştirir. Merkezi veya senkronize AllReduce yöntemlerine kıyasla, SHARDCAST, merkeziyetsizlik eğitiminin ölçeklenebilirliğini ve hata toleransını önemli ölçüde artırır, kararlı ağırlık konsensüsü ve sürekli eğitim iterasyonları oluşturmanın temel temelidir.
#OpenDiLoCo: Seyrek Asenkron İletişim Çerçevesi
OpenDiLoCo, Prime Intellect ekibi tarafından DeepMind'ın önerdiği DiLoCo kavramına dayalı olarak bağımsız bir şekilde uygulanmış ve açık kaynak olarak sunulmuş bir iletişim optimizasyon çerçevesidir. Bu çerçeve, merkeziyetsizlik eğitimi sırasında sıkça karşılaşılan bant genişliği kısıtlılığı, heterojen cihazlar ve düzensiz düğümler gibi zorluklar için özel olarak tasarlanmıştır. Mimari, veri paralelliğine dayanmakta olup, Ring, Expander, Small-World gibi seyrek topoloji yapıları inşa ederek, küresel senkronizasyonun yüksek iletişim maliyetlerinden kaçınmakta ve yalnızca yerel komşu düğümlere dayanarak model işbirliği eğitimini tamamlamaktadır. Asenkron güncellemeler ve kesinti toleransı mekanizmasıyla bir araya geldiğinde, OpenDiLoCo, tüketici sınıfı GPU'ların ve kenar cihazların eğitim görevlerine stabil bir şekilde katılabilmesini sağlamakta ve küresel işbirliği eğitimine katılımı önemli ölçüde artırmakta, merkeziyetsizlik eğitim ağı inşa etmenin temel iletişim altyapılarından biri olmaktadır.
#PCCL: İşbirliği İletişim Kütüphanesi
PCCL)Prime Collective Communication Library(, Prime Intellect tarafından Merkeziyetsizlik AI eğitim ortamı için özel olarak tasarlanmış hafif bir iletişim kütüphanesidir ve geleneksel iletişim kütüphanelerinin heterojen cihazlar ve düşük bant genişliği ağlarındaki adaptasyon darboğazlarını çözmeyi hedeflemektedir. PCCL, seyrek topolojiyi, gradyan sıkıştırmayı, düşük hassasiyet senkronizasyonunu ve kesintiden kurtarmayı destekler, tüketici sınıfı GPU'lar ve kararsız düğümler üzerinde çalışabilir ve OpenDiLoCo protokolünün asenkron iletişim yeteneklerini destekleyen alt bileşenidir. Bu, eğitim ağının bant genişliği toleransını ve cihaz uyumluluğunu önemli ölçüde artırır ve gerçek anlamda açık, güvene dayanmayan işbirliği eğitim ağını oluşturmanın "son bir mil" iletişim altyapısını sağlamaktadır.
)# 03, Prime Intellect teşvik ağı ve rol dağılımı
Prime Intellect, herkesin görevlere katılmasını ve gerçek katkılara dayalı ödüller almasını sağlayan, izin gerektirmeyen, doğrulanabilir ve ekonomik teşvik mekanizmalarına sahip bir eğitim ağı inşa etti. Protokol, üç temel rol türü temelinde çalışmaktadır:
Görev başlatıcısı: Eğitim ortamını, başlangıç modelini, ödül fonksiyonunu ve doğrulama standartlarını tanımlar.
Eğitim Düğümü: Yerel eğitimi yürüt, ağırlık güncellemelerini ve gözlem izini gönder
Doğrulama Düğümü: Eğitim davranışının gerçekliğini doğrulamak için TOPLOC mekanizmasını kullanın ve ödül hesaplama ve strateji toplama süreçlerine katılın.
Protokolün temel süreçleri, görev yayınlama, düğüm eğitimi, iz doğrulama, ağırlık birleştirme ###SHARDCAST( ve ödül dağıtımını içerir ve "gerçek eğitim davranışı" etrafında bir teşvik kapalı döngüsü oluşturur.
![Crypto AI'nin Kutsal Kâsesi: Merkeziyetsizlik ile Eğitimdeki Sınırları Zorlama])https://img-cdn.gateio.im/webp-social/moments-b11af8d10db6e8baa0c19e87aa18dd82.webp(
)# 04, INTELLECT-2: İlk doğrulanabilir Merkeziyetsizlik eğitim modelinin yayımlanması
Prime Intellect, Mayıs 2025'te INTELLECT-2'yi piyasaya sürdü. Bu, dünya genelinde asenkron, güvene ihtiyaç duymayan Merkeziyetsizlik düğümleriyle birlikte eğitilen ilk büyük ölçekli pekiştirme öğrenme modelidir ve 32B parametre boyutuna sahiptir. INTELLECT-2 modeli, üç kıtada yer alan 100'den fazla GPU heterojen düğüm tarafından iş birliği içinde eğitildi ve tamamen asenkron bir mimari kullanarak 400 saatten fazla eğitim süresi geçirdi. Bu, asenkron iş birliği ağının uygulanabilirliğini ve istikrarını göstermektedir. Bu model sadece performans açısından bir atılım değil, aynı zamanda Prime Intellect'in.
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
14 Likes
Reward
14
6
Share
Comment
0/400
FudVaccinator
· 07-22 12:29
Büyük fonlar merkezileşmiş ellerde mi?
View OriginalReply0
MissedAirdropBro
· 07-20 13:31
Yine bir analiz yapma yemeği, uykum geldi.
View OriginalReply0
ZenChainWalker
· 07-20 10:38
Bana birkaç 3090 verin, modelleri tarayayım.
View OriginalReply0
OldLeekConfession
· 07-20 10:38
Aman Tanrım, bu sadece AI ile serbest bırakılan bir koşu bandı değil mi?
Merkeziyetsizlik AI eğitiminin突破:Prime Intellect doğrulanabilir işbirliği ağı oluşturuyor
Crypto AI'nin Kutsal Kâsesi: Merkeziyetsizlikte Eğitimdeki Sınırları Zorlamak
AI'nin tüm değer zincirinde, model eğitimi en fazla kaynak tüketen ve en yüksek teknik engeli olan aşamadır, doğrudan modelin yetenek sınırını ve gerçek uygulama etkisini belirler. Çıkarım aşamasının hafif kullanımına kıyasla, eğitim süreci sürekli büyük ölçekli hesaplama gücü yatırımı, karmaşık veri işleme süreçleri ve yüksek yoğunlukta optimizasyon algoritması desteği gerektirir; bu, AI sisteminin inşasında gerçek bir "ağır sanayi"dir. Mimari paradigması açısından, eğitim yöntemleri dört türe ayrılabilir: merkezi eğitim, dağıtık eğitim, federatif öğrenme ve bu makalede ana odak olan Merkeziyetsizlik eğitimi.
Merkeziyetsiz eğitim, tek bir kuruluşun yerel yüksek performans kümeleri içinde tüm eğitim süreçlerini tamamladığı en yaygın geleneksel yöntemdir. Donanım, alt yazılım, küme planlama sistemi ve eğitim çerçevesinin tüm bileşenleri, tek bir kontrol sistemi tarafından koordine edilen bir şekilde çalışır. Bu derin işbirliği mimarisi, bellek paylaşımı, gradyan senkronizasyonu ve hata toleransı mekanizmalarının verimliliğini en üst düzeye çıkarır ve GPT, Gemini gibi büyük ölçekli modellerin eğitimine çok uygundur. Yüksek verimlilik ve kontrol edilebilir kaynaklar gibi avantajlara sahip olmasına rağmen, aynı zamanda veri tekelcilği, kaynak engelleri, enerji tüketimi ve tek nokta riski gibi sorunları da barındırmaktadır.
Dağıtık eğitim, günümüzde büyük model eğitiminin ana akım yöntemidir. Temelinde, model eğitim görevlerinin parçalanarak birden fazla makineye dağıtılarak iş birliği içinde gerçekleştirilmesi yatmaktadır. Bu, tek makine hesaplama ve depolama darboğazlarını aşmayı amaçlamaktadır. Fiziksel olarak "dağıtık" özelliklere sahip olmasına rağmen, genel olarak merkezi bir kurum tarafından kontrol edilen planlama ve senkronizasyon ile çalışmaktadır. Genellikle yüksek hızlı yerel ağ ortamlarında çalışır ve NVLink yüksek hızlı bağlantı teknolojisi ile ana düğüm, alt görevleri koordine eder. Ana akım yöntemler arasında şunlar bulunmaktadır:
Dağıtık eğitim, "merkezi kontrol + dağıtık yürütme" kombinasyonudur, aynı patronun uzaktan birden fazla "ofis" çalışanının iş birliği yaparak görevleri tamamlamasını benzetir. Şu anda neredeyse tüm ana akım büyük modeller bu şekilde eğitim almaktadır.
Merkeziyetsizlik eğitimi, daha açık ve sansüre dayanıklı bir gelecek yolu anlamına gelir. Temel özellikleri şunlardır: birbirine güvenmeyen birden fazla düğüm ( ev bilgisayarları, bulut GPU'ları veya kenar cihazları ) merkezi bir koordinatör olmadan eğitim görevlerini işbirliği içinde tamamlayabilir; genellikle protokoller aracılığıyla görev dağıtımı ve işbirliği sağlanır ve katkının dürüstlüğünü güvence altına almak için şifreleme teşvik mekanizmaları kullanılır. Bu modelin karşılaştığı başlıca zorluklar şunlardır:
Merkeziyetsizlik eğitimi, dünya genelindeki bir grup gönüllünün, her birinin model eğitimi için hesaplama gücü katkısında bulunarak işbirliği yaptığı anlamına gelebilir; ancak "gerçekten uygulanabilir büyük ölçekli merkeziyetsiz eğitim" hâlâ sistematik bir mühendislik zorluğudur ve sistem mimarisi, iletişim protokolleri, şifre güvenliği, ekonomik mekanizmalar, model doğrulaması gibi birçok düzeyi kapsamaktadır. Ancak "işbirliği etkili + dürüstlüğü teşvik etme + doğru sonuçlar" sağlanıp sağlanamayacağı hâlâ erken prototip keşif aşamasındadır.
Federated learning, as a transitional form between distributed and Merkeziyetsizlik, emphasizes local data retention and centralized aggregation of model parameters, and is suitable for privacy-compliant scenarios such as healthcare and finance (. Federated learning has the engineering structure of distributed training and local collaboration capabilities, while also possessing the data dispersion advantages of decentralized training, but still relies on trusted coordinating parties and does not have the characteristics of being completely open and resistant to censorship. It can be seen as a "controlled decentralization" solution in privacy-compliant scenarios, relatively mild in terms of training tasks, trust structures, and communication mechanisms, making it more suitable as a transitional deployment architecture in the industry.
Merkeziyetsizlik eğitiminin sınırları, fırsatları ve gerçek yolları
Eğitim paradigması açısından, merkeziyetsiz eğitim her görev türü için uygun değildir. Bazı senaryolarında, görev yapısının karmaşık olması, kaynak gereksinimlerinin son derece yüksek olması veya işbirliği zorluğunun büyük olması nedeniyle, doğal olarak heterojen, güvenilir olmayan düğümler arasında verimli bir şekilde tamamlanması uygun değildir. Örneğin, büyük model eğitimi genellikle yüksek bellek, düşük gecikme ve yüksek bant genişliğine dayanır, açık ağlarda etkili bir şekilde bölünmesi ve senkronize edilmesi zordur; veri gizliliği ve egemenlik kısıtlamalarının güçlü olduğu görevler, yasal uyumluluk ve etik kısıtlamalar nedeniyle açıkça paylaşılamaz; işbirliği teşviklerinin yetersiz olduğu görevlerde ise dış katılım motivasyonu eksiktir. Bu sınırlar, mevcut merkeziyetsiz eğitimin gerçek kısıtlamalarını oluşturmaktadır.
Ancak bu, merkeziyetsizlikle eğitimlerin sahte bir kavram olduğu anlamına gelmez. Aslında, yapı olarak hafif, paralel hale getirilebilir ve teşvik edilebilir görev türlerinde merkeziyetsiz eğitimlerin belirgin bir uygulama potansiyeli vardır. Bunun arasında, ancak bunlarla sınırlı olmamak üzere: LoRA ince ayarı, davranış uyumlu son eğitim görevleri ), RLHF, DPO (, veri kalabalıklaştırma eğitimi ve etiketleme görevleri, kaynak kontrolüne sahip küçük temel model eğitimi ve kenar cihazların katıldığı işbirlikçi eğitim senaryoları bulunmaktadır. Bu görevler genel olarak yüksek paralellik, düşük bağlanabilirlik ve heterojen hesaplama gücüne tolerans gösterme özelliklerine sahiptir ve bu nedenle P2P ağları, Swarm protokolleri, dağıtık optimizatörler gibi yollarla işbirlikçi eğitim için oldukça uygundur.
![Crypto AI'nin Kutsal Kâsesi: Merkeziyetsizlik eğitiminde öncü keşif])https://img-cdn.gateio.im/webp-social/moments-adb92bc4dfbaf26863cb0b4bb1081cd7.webp(
Merkeziyetsizlik eğitimi klasik proje analizi
Şu anda merkeziyetsizlik eğitim ve federated öğrenme öncülüğünde, temsil niteliği taşıyan blok zinciri projeleri arasında Prime Intellect, Pluralis.ai, Gensyn, Nous Research ve Flock.io bulunmaktadır. Teknik yenilikçilik ve mühendislik uygulama zorluğu açısından, Prime Intellect, Nous Research ve Pluralis.ai sistem mimarisi ve algoritma tasarımında daha fazla özgün keşif önermiştir ve mevcut teorik araştırmaların öncü yönlerini temsil etmektedir; Gensyn ve Flock.io'nun uygulama yolları ise göreceli olarak nettir ve ilk mühendislik ilerlemelerini görebilmekteyiz. Bu makalede, bu beş projenin arkasındaki temel teknolojileri ve mühendislik mimarisi yollarını sırayla analiz edecek ve merkeziyetsiz AI eğitim sistemindeki farklılıklarını ve tamamlayıcı ilişkilerini daha da tartışacağız.
) Prime Intellect: Eğitim izleri doğrulanabilir güçlendirilmiş öğrenme işbirlikçi ağ öncüsü
Prime Intellect, güvene ihtiyaç duymayan bir AI eğitim ağı inşa etmeye kararlıdır, böylece herkes eğitim sürecine katılabilir ve hesaplama katkıları için güvenilir ödüller alabilir. Prime Intellect, PRİME-RL + TOPLOC + SHARDCAST üç ana modülü aracılığıyla, doğrulanabilir, açık ve teşvik mekanizmalarının eksiksiz olduğu bir AI Merkeziyetsizlik eğitim sistemi inşa etmeyi hedeflemektedir.
01, Prime Intellect protokol yığını yapısı ve ana modül değerleri
![Crypto AI'nin Kutsal Kadehi: Merkeziyetsizlik Eğitiminin Sınırlarını Keşfetmek]###https://img-cdn.gateio.im/webp-social/moments-69eb6c2dab3d6284b890285c71e7a47f.webp(
)# 02, Prime Intellect eğitiminin ana mekanizmalarının detaylı açıklaması
#PRIME-RL: Koparılmış Asenkron Güçlendirme Öğrenme Görev Mimarisi
PRIME-RL, Prime Intellect tarafından merkeziyetsiz eğitim senaryoları için özelleştirilmiş bir görev modelleme ve yürütme çerçevesidir. Heterojen ağlar ve asenkron katılımcılar için özel olarak tasarlanmıştır. Güçlendirme öğrenimini öncelikli uyum nesnesi olarak kullanır, eğitim, çıkarım ve ağırlık yükleme süreçlerini yapısal olarak ayrıştırır, böylece her eğitim düğümü yerel olarak bağımsız bir görev döngüsü tamamlayabilir ve standart arayüzler aracılığıyla doğrulama ve toplama mekanizmaları ile iş birliği yapabilir. Geleneksel denetimli öğrenme süreçleri ile karşılaştırıldığında, PRIME-RL, merkezi bir planlama ortamında esnek eğitim sağlamak için daha uygundur; bu, sistem karmaşıklığını azaltır ve çoklu görev paralelliği ve strateji evrimi için bir temel oluşturur.
#TOPLOC:Ağırlıklandırılmış Eğitim Davranış Doğrulama Mekanizması
TOPLOC###Güvenilir Gözlem & Politika-Yerel Kontrol(, Prime Intellect tarafından önerilen eğitim doğrulama çekirdek mekanizmasıdır ve bir düğümün gerçekten gözlem verilerine dayalı olarak etkili bir politika öğrenimi gerçekleştirip gerçekleştirmediğini belirlemek için kullanılır. ZKML gibi ağır çözümlerden farklı olarak, TOPLOC tam model yeniden hesaplamasına dayanmaz, bunun yerine "gözlem dizisi↔politika güncellemesi" arasındaki yerel tutarlılık izini analiz ederek hafif yapı doğrulaması gerçekleştirir. Eğitim sürecindeki davranış izlerini doğrulanabilir nesnelere dönüştüren ilk yöntemdir ve güvene dayanmayan eğitim ödül dağıtımını gerçekleştirmek için anahtar yeniliklerdendir. Denetlenebilir ve teşvik edici bir Merkeziyetsizlik işbirlikçi eğitim ağı kurmak için uygulanabilir bir yol sunar.
#SHARDCAST: Asenkron Ağırlık Toplama ve Yayılma Protokolü
SHARDCAST, Prime Intellect tarafından tasarlanan ağırlık yayılımı ve toplama protokolüdür, asenkron, bant genişliği kısıtlı ve düğüm durumlarının sürekli değiştiği gerçek ağ ortamları için optimize edilmiştir. Gossip yayılım mekanizmasını ve yerel senkronizasyon stratejilerini birleştirerek, birden fazla düğümün senkronize olmayan durumlarda sürekli olarak kısmi güncellemeler göndermesine olanak tanır, ağırlıkların kademeli olarak yakınsamasını ve çoklu versiyon evrimini gerçekleştirir. Merkezi veya senkronize AllReduce yöntemlerine kıyasla, SHARDCAST, merkeziyetsizlik eğitiminin ölçeklenebilirliğini ve hata toleransını önemli ölçüde artırır, kararlı ağırlık konsensüsü ve sürekli eğitim iterasyonları oluşturmanın temel temelidir.
#OpenDiLoCo: Seyrek Asenkron İletişim Çerçevesi
OpenDiLoCo, Prime Intellect ekibi tarafından DeepMind'ın önerdiği DiLoCo kavramına dayalı olarak bağımsız bir şekilde uygulanmış ve açık kaynak olarak sunulmuş bir iletişim optimizasyon çerçevesidir. Bu çerçeve, merkeziyetsizlik eğitimi sırasında sıkça karşılaşılan bant genişliği kısıtlılığı, heterojen cihazlar ve düzensiz düğümler gibi zorluklar için özel olarak tasarlanmıştır. Mimari, veri paralelliğine dayanmakta olup, Ring, Expander, Small-World gibi seyrek topoloji yapıları inşa ederek, küresel senkronizasyonun yüksek iletişim maliyetlerinden kaçınmakta ve yalnızca yerel komşu düğümlere dayanarak model işbirliği eğitimini tamamlamaktadır. Asenkron güncellemeler ve kesinti toleransı mekanizmasıyla bir araya geldiğinde, OpenDiLoCo, tüketici sınıfı GPU'ların ve kenar cihazların eğitim görevlerine stabil bir şekilde katılabilmesini sağlamakta ve küresel işbirliği eğitimine katılımı önemli ölçüde artırmakta, merkeziyetsizlik eğitim ağı inşa etmenin temel iletişim altyapılarından biri olmaktadır.
#PCCL: İşbirliği İletişim Kütüphanesi
PCCL)Prime Collective Communication Library(, Prime Intellect tarafından Merkeziyetsizlik AI eğitim ortamı için özel olarak tasarlanmış hafif bir iletişim kütüphanesidir ve geleneksel iletişim kütüphanelerinin heterojen cihazlar ve düşük bant genişliği ağlarındaki adaptasyon darboğazlarını çözmeyi hedeflemektedir. PCCL, seyrek topolojiyi, gradyan sıkıştırmayı, düşük hassasiyet senkronizasyonunu ve kesintiden kurtarmayı destekler, tüketici sınıfı GPU'lar ve kararsız düğümler üzerinde çalışabilir ve OpenDiLoCo protokolünün asenkron iletişim yeteneklerini destekleyen alt bileşenidir. Bu, eğitim ağının bant genişliği toleransını ve cihaz uyumluluğunu önemli ölçüde artırır ve gerçek anlamda açık, güvene dayanmayan işbirliği eğitim ağını oluşturmanın "son bir mil" iletişim altyapısını sağlamaktadır.
)# 03, Prime Intellect teşvik ağı ve rol dağılımı
Prime Intellect, herkesin görevlere katılmasını ve gerçek katkılara dayalı ödüller almasını sağlayan, izin gerektirmeyen, doğrulanabilir ve ekonomik teşvik mekanizmalarına sahip bir eğitim ağı inşa etti. Protokol, üç temel rol türü temelinde çalışmaktadır:
Protokolün temel süreçleri, görev yayınlama, düğüm eğitimi, iz doğrulama, ağırlık birleştirme ###SHARDCAST( ve ödül dağıtımını içerir ve "gerçek eğitim davranışı" etrafında bir teşvik kapalı döngüsü oluşturur.
![Crypto AI'nin Kutsal Kâsesi: Merkeziyetsizlik ile Eğitimdeki Sınırları Zorlama])https://img-cdn.gateio.im/webp-social/moments-b11af8d10db6e8baa0c19e87aa18dd82.webp(
)# 04, INTELLECT-2: İlk doğrulanabilir Merkeziyetsizlik eğitim modelinin yayımlanması
Prime Intellect, Mayıs 2025'te INTELLECT-2'yi piyasaya sürdü. Bu, dünya genelinde asenkron, güvene ihtiyaç duymayan Merkeziyetsizlik düğümleriyle birlikte eğitilen ilk büyük ölçekli pekiştirme öğrenme modelidir ve 32B parametre boyutuna sahiptir. INTELLECT-2 modeli, üç kıtada yer alan 100'den fazla GPU heterojen düğüm tarafından iş birliği içinde eğitildi ve tamamen asenkron bir mimari kullanarak 400 saatten fazla eğitim süresi geçirdi. Bu, asenkron iş birliği ağının uygulanabilirliğini ve istikrarını göstermektedir. Bu model sadece performans açısından bir atılım değil, aynı zamanda Prime Intellect'in.