Coral Protokolü'nün çoklu ajan sistemi, GAIA Benchmark'ta Microsoft destekli Magnetic-UI'yi %34 oranında geride bırakarak, daha küçük modellerin akıllı orkestrasyonunun geleneksel büyük ölçekli AI yaklaşımlarına rakip olabileceğini veya onları geçebileceğini gösterdi.
İşbirlikçi yapay zeka için merkeziyetsiz altyapı, Coral Protokolü çoklu ajan sisteminin Microsoft destekli Magnetic-UI'yi GAIA Benchmark'ta %34 oranında geride bıraktığını bildirdi—model parametrelerini genişletmekten daha etkili bir yaklaşım olarak yatay ölçeklemenin daha iyi sonuçlar verebileceğini öne süren eşsiz bir sonuç. Protokolün sistemi, yalnızca model boyutunu artırmaya odaklanmak yerine çoklu ajanlar arasında akıllı orkestrasyonu kullanıyor.
Bu performans, mini ajanlar kullanarak GAIA Benchmark'ta doğrulanan en yüksek puanı işaretledi ve NVIDIA'nın iyi koordine edilmiş daha küçük modellerin AI'nın geleceğinde önemli bir rol oynayabileceği önermesini destekliyor. Coral'ın geliştiricilerine göre, sonuç, AI ölçeklenebilirliğine yaklaşımda saf bir sistem gücü artışından ziyade kavramsal bir kaymayı yansıtıyor.
Açık bir protokol olarak Coral, merkezi genel modellere güvenmek yerine, dünya genelindeki uzmanlaşmış ajanlar arasında koordinasyonu sağlayarak AI yeteneklerinin genişlemesini kolaylaştırır. Mimarisi, ajanlar arasında paralel, güvenli etkileşim için olanak tanır ve gelişmiş akıl yürütme, planlama ve problem çözme gerektiren görevlerde her boyuttaki dil modellerinin işlevselliğini artırır.
"Bu atılım, AI altyapısında bir dönüm noktasını işaret ediyor," dedi Coral CTO'su Caelum Forder yazılı bir açıklamada. "Yatay ölçeklendirmenin sadece mümkün olmadığını, aynı zamanda pratik olduğunu kanıtlıyor ve Coral bunu yapmanın en etkili yolu. Ajanlar İnterneti artık çalışan bir gerçeklik. Eğer bir ajan geliştiriciyseniz, sadece Coralise edin. Eğer bir uygulama geliştiriciyseniz, altyapımızı kullanarak daha iyi ve daha az maliyetle inşa edin," diye ekledi.
Coral, GAIA Benchmark'ı geçerek İleri Düzey Ajanik Sistemlerde Küçük Modellerin Gücünü Doğruladı
Gelişmiş ajans sistemleri geliştirmek için artan rekabet ortamında, odak noktası büyük ölçüde büyüyen görev karmaşıklığını yönetmek için modelleri ölçeklendirmeye kalmıştır. Coral'ın son performansı, daha küçük sistemlerin hız, güvenlik veya verimlilikten ödün vermeden yüksek performans sunabileceğini öne süren son NVIDIA çalışması ile uyumlu olarak bu yaygın yaklaşımı sorgulamaktadır. GAIA Benchmark, gelişmiş AI için kapsamlı bir değerlendirme seti olarak, sistemlerin gerçek dünya görevlerini ne kadar iyi yönettiğini değerlendirmek için tasarlanmıştır; bu görevler genellikle insan uzmanlardan önemli zaman ve beceri gerektirir. Araştırma, analitik ve akıl yürütme yeteneklerini test eden 450 karmaşık istem içeren bu benchmark, genel amaçlı büyük dil modeli (LLM) ajanlarının etkinliğini değerlendirmek için önemli bir endüstri metriği olarak hizmet etmektedir.
Coral'ın benchmark testinde kullanılan GAIA Agent Sistemi, Coral Protokolü'ne dayanmakta ve CAMEL'in OWL tasarım ilkelerinden yararlanmaktadır. Araştırma, analiz, eleştiri, planlama ve web gezintisi gibi çeşitli görevleri yerine getiren özel ajanları içermektedir ve bunların hepsi Coral'ın MCP sunucu altyapısı üzerinden iletişim kurmaktadır.
Küçük modeller için GAIA Benchmark sıralamalarına liderlik etmesi, Coral'ın AI sistemlerinin işlevselliğini grafik tabanlı bir yapı aracılığıyla genişletme potansiyelini gösteriyor. Bu sonuç, daha geniş veri işleme, daha pürüzsüz ekosistem entegrasyonu ve geliştirilmiş ajanlar arası iletişim sağlamak için küçük modeller kullanarak yüksek performanslı, hafif ajanlar oluşturulabileceğini öne sürüyor.
"Ajan sistemlerde küçük modellerin rolü bugüne kadar yeterince vurgulanmadı, ancak rüzgarlar dönmeye başlıyor," dedi Caelum Forder. "Bu tür modellerin daha önce bilinen sınırlarının ötesinde ölçeklenebileceğini ve mevcut oyuncuları geride bırakabileceğini kanıtladık. Onların ajanik yapay zekanın geleceğinde merkezi bir rol oynayacaklarına inanıyorum," diye ekledi.
View Original
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
Coral Protokolü, AI Mini-Model için En İyi GAIA Benchmark ile Microsoft'u %34 Geride Bıraktı
Kısaca
Coral Protokolü'nün çoklu ajan sistemi, GAIA Benchmark'ta Microsoft destekli Magnetic-UI'yi %34 oranında geride bırakarak, daha küçük modellerin akıllı orkestrasyonunun geleneksel büyük ölçekli AI yaklaşımlarına rakip olabileceğini veya onları geçebileceğini gösterdi.
İşbirlikçi yapay zeka için merkeziyetsiz altyapı, Coral Protokolü çoklu ajan sisteminin Microsoft destekli Magnetic-UI'yi GAIA Benchmark'ta %34 oranında geride bıraktığını bildirdi—model parametrelerini genişletmekten daha etkili bir yaklaşım olarak yatay ölçeklemenin daha iyi sonuçlar verebileceğini öne süren eşsiz bir sonuç. Protokolün sistemi, yalnızca model boyutunu artırmaya odaklanmak yerine çoklu ajanlar arasında akıllı orkestrasyonu kullanıyor.
Bu performans, mini ajanlar kullanarak GAIA Benchmark'ta doğrulanan en yüksek puanı işaretledi ve NVIDIA'nın iyi koordine edilmiş daha küçük modellerin AI'nın geleceğinde önemli bir rol oynayabileceği önermesini destekliyor. Coral'ın geliştiricilerine göre, sonuç, AI ölçeklenebilirliğine yaklaşımda saf bir sistem gücü artışından ziyade kavramsal bir kaymayı yansıtıyor.
Açık bir protokol olarak Coral, merkezi genel modellere güvenmek yerine, dünya genelindeki uzmanlaşmış ajanlar arasında koordinasyonu sağlayarak AI yeteneklerinin genişlemesini kolaylaştırır. Mimarisi, ajanlar arasında paralel, güvenli etkileşim için olanak tanır ve gelişmiş akıl yürütme, planlama ve problem çözme gerektiren görevlerde her boyuttaki dil modellerinin işlevselliğini artırır.
"Bu atılım, AI altyapısında bir dönüm noktasını işaret ediyor," dedi Coral CTO'su Caelum Forder yazılı bir açıklamada. "Yatay ölçeklendirmenin sadece mümkün olmadığını, aynı zamanda pratik olduğunu kanıtlıyor ve Coral bunu yapmanın en etkili yolu. Ajanlar İnterneti artık çalışan bir gerçeklik. Eğer bir ajan geliştiriciyseniz, sadece Coralise edin. Eğer bir uygulama geliştiriciyseniz, altyapımızı kullanarak daha iyi ve daha az maliyetle inşa edin," diye ekledi.
Coral, GAIA Benchmark'ı geçerek İleri Düzey Ajanik Sistemlerde Küçük Modellerin Gücünü Doğruladı
Gelişmiş ajans sistemleri geliştirmek için artan rekabet ortamında, odak noktası büyük ölçüde büyüyen görev karmaşıklığını yönetmek için modelleri ölçeklendirmeye kalmıştır. Coral'ın son performansı, daha küçük sistemlerin hız, güvenlik veya verimlilikten ödün vermeden yüksek performans sunabileceğini öne süren son NVIDIA çalışması ile uyumlu olarak bu yaygın yaklaşımı sorgulamaktadır. GAIA Benchmark, gelişmiş AI için kapsamlı bir değerlendirme seti olarak, sistemlerin gerçek dünya görevlerini ne kadar iyi yönettiğini değerlendirmek için tasarlanmıştır; bu görevler genellikle insan uzmanlardan önemli zaman ve beceri gerektirir. Araştırma, analitik ve akıl yürütme yeteneklerini test eden 450 karmaşık istem içeren bu benchmark, genel amaçlı büyük dil modeli (LLM) ajanlarının etkinliğini değerlendirmek için önemli bir endüstri metriği olarak hizmet etmektedir.
Coral'ın benchmark testinde kullanılan GAIA Agent Sistemi, Coral Protokolü'ne dayanmakta ve CAMEL'in OWL tasarım ilkelerinden yararlanmaktadır. Araştırma, analiz, eleştiri, planlama ve web gezintisi gibi çeşitli görevleri yerine getiren özel ajanları içermektedir ve bunların hepsi Coral'ın MCP sunucu altyapısı üzerinden iletişim kurmaktadır.
Küçük modeller için GAIA Benchmark sıralamalarına liderlik etmesi, Coral'ın AI sistemlerinin işlevselliğini grafik tabanlı bir yapı aracılığıyla genişletme potansiyelini gösteriyor. Bu sonuç, daha geniş veri işleme, daha pürüzsüz ekosistem entegrasyonu ve geliştirilmiş ajanlar arası iletişim sağlamak için küçük modeller kullanarak yüksek performanslı, hafif ajanlar oluşturulabileceğini öne sürüyor.
"Ajan sistemlerde küçük modellerin rolü bugüne kadar yeterince vurgulanmadı, ancak rüzgarlar dönmeye başlıyor," dedi Caelum Forder. "Bu tür modellerin daha önce bilinen sınırlarının ötesinde ölçeklenebileceğini ve mevcut oyuncuları geride bırakabileceğini kanıtladık. Onların ajanik yapay zekanın geleceğinde merkezi bir rol oynayacaklarına inanıyorum," diye ekledi.