Протокол Coral перевершує Microsoft на 34% з найкращим Бенчмарком GAIA для міні-моделі ШІ

Коротко

Багатоагентна система Coral Protocol перевершила Magnetic-UI, підтримуваний Microsoft, на 34% за GAIA Benchmark, що демонструє, що інтелектуальна оркестрація менших моделей може конкурувати або перевершувати традиційні підходи до великомасштабного ШІ.

Протокол Coral встановлює новий стандарт для міні-агентських систем штучного інтелекту, перевершуючи Microsoft на 34% у тесті GAIA

Децентралізована інфраструктура для колаборативного ШІ, Coral Protocol повідомила, що її багатагентна система перевершила підтримуваний Microsoft Magnetic-UI на 34% за результатами GAIA Benchmark — безпрецедентний результат, який свідчить про те, що горизонтальне масштабування може бути більш ефективним підходом, ніж розширення параметрів моделі. Система протоколу використовує інтелектуальну оркестрацію між кількома агентами, а не зосереджується лише на збільшенні розміру моделі.

Ця продуктивність стала найвищим перевіреним балом на GAIA Benchmark з використанням міні-агентів, підтримуючи припущення NVIDIA про те, що добре скоординовані менші моделі можуть відігравати ключову роль у майбутньому ШІ. За словами розробників Coral, результат відображає концептуальний зсув у підході до масштабованості ШІ, а не просто збільшення потужності системи.

Як відкритий протокол, Coral сприяє розширенню можливостей ШІ, забезпечуючи координацію між спеціалізованими агентами у всьому світі, замість того, щоб покладатися на централізовані загальні моделі. Його архітектура дозволяє паралельну, безпечну взаємодію між агентами, що підвищує функціональність мовних моделей усіх розмірів у завданнях, що вимагають просунутого міркування, планування та розв'язання проблем.

«Цей прорив є переломним моментом у інфраструктурі ШІ», - сказав технічний директор Coral Келум Фордера у письмовій заяві. «Це доказ того, що горизонтальне масштабування не лише можливе – воно практичне, і Coral є найефективнішим способом це зробити. Інтернет агентів тепер є робочою реальністю. Якщо ви розробник агента, просто Coralise це. Якщо ви розробник додатків, створюйте краще за менше, використовуючи нашу інфраструктуру», - додав він.

Coral очолює еталон GAIA, підтверджує потужність невеликих моделей у передових агентних системах

На фоні зростаючої конкуренції у розробці просунутих агентних систем, велика частина уваги залишалася зосередженою на масштабуванні моделей для управління зростаючою складністю завдань. Недавні виклики продуктивності Coral ставлять під сумнів цей панівний підхід, узгоджуючись з висновками нещодавнього дослідження NVIDIA, що свідчить про те, що менші системи можуть забезпечити високу продуктивність без шкоди для швидкості, безпеки чи ефективності. GAIA Benchmark, цілісний оцінювальний пакет для просунутих ШІ, призначений для оцінки того, як добре системи справляються з реальними завданнями, які зазвичай вимагали б значного часу та навичок від людських експертів. Він складається з 450 складних запитів, які тестують дослідницькі, аналітичні та розумові здібності, і служить ключовим галузевим показником для оцінки ефективності універсальних великих мовних моделей (LLM) агентів.

Система GAIA Agent компанії Coral, що використовувалася в бенчмарковому тесті, заснована на протоколі Coral і черпає з принципів дизайну OWL компанії CAMEL. Вона включає спеціалізованих агентів для виконання різноманітних завдань, зокрема дослідження, аналізу, критики, планування та навігації в Інтернеті, всі з яких спілкуються через інфраструктуру серверів MCP компанії Coral.

Лідерство в рейтингах GAIA Benchmark для менших моделей вказує на потенціал Coral розширити функціональність систем штучного інтелекту через структуру на основі графів. Цей результат свідчить про те, що можна створювати високоефективні, легкі агентів, використовуючи менші моделі — що полегшує обробку даних, інтеграцію в екосистему та покращену комунікацію між агентами.

«Роль малих моделей в агентних системах до цього часу була недооцінена, але часи починають змінюватися», - сказав Келум Фордер. «Ми довели, що такі моделі можуть масштабуватися за межі своїх попередньо відомих меж і конкурувати з існуючими. Я впевнений, що вони матимуть центральну роль у майбутньому агентного ШІ», - підсумував він.

Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Поділіться
Прокоментувати
0/400
Немає коментарів
  • Закріпити