Протокол Coral превосходит Microsoft на 34% с лучшим Бенчмарком GAIA для мини-модели ИИ

Кратко

Мультиагентная система Coral Protocol превзошла Magnetic-UI, поддерживаемый Microsoft, на 34% по сравнению с GAIA Benchmark, что демонстрирует, что интеллектуальная оркестрация меньших моделей может соперничать или превосходить традиционные масштабные подходы в области ИИ.

Протокол Coral устанавливает новый стандарт для мини-агентских AI систем, превосходя Microsoft на 34% по тесту GAIA

Децентрализованная инфраструктура для совместного ИИ, Coral Protocol сообщила, что ее многопользовательская система превзошла Magnetic-UI, поддерживаемый Microsoft, на 34% по результатам GAIA Benchmark — беспрецедентный результат, который предполагает, что горизонтальное масштабирование может предложить более эффективный подход, чем увеличение параметров модели. Система протокола использует интеллектуальную оркестрацию между несколькими агентами, а не сосредотачивается исключительно на увеличении размера модели.

Это достижение стало самым высоким подтвержденным результатом на GAIA Benchmark с использованием мини-агентов, поддерживая предположение NVIDIA о том, что хорошо скоординированные меньшие модели могут сыграть ключевую роль в будущем ИИ. По словам разработчиков Coral, результат отражает концептуальный сдвиг в подходе к масштабируемости ИИ, а не просто увеличение мощности системы.

Как открытый протокол, Coral содействует расширению возможностей ИИ, позволяя координацию между специализированными агентами по всему миру, вместо того чтобы полагаться на централизованные общие модели. Его архитектура позволяет параллельное, безопасное взаимодействие между агентами, улучшая функциональность языковых моделей всех размеров в задачах, требующих продвинутого рассуждения, планирования и решения проблем.

«Этот прорыв отмечает поворотный момент в инфраструктуре ИИ», — сказал технический директор Coral Кэлюм Форддер в письменном заявлении. «Это доказательство того, что горизонтальное масштабирование не только возможно — оно практично, и Coral является самым эффективным способом сделать это. Интернет агентов теперь является рабочей реальностью. Если вы разработчик агентов, просто используйте Coral. Если вы разработчик приложений, создавайте лучше за меньшие деньги, используя нашу инфраструктуру», — добавил он.

Coral превосходит бенчмарк GAIA, проверяет мощность малых моделей в передовых агентных системах

На фоне растущей конкуренции в разработке продвинутых агентных систем, основное внимание по-прежнему уделяется масштабированию моделей для управления растущей сложностью задач. Недавние результаты Coral ставят под сомнение этот преобладающий подход, что соответствует выводам недавнего исследования NVIDIA, предполагающего, что более мелкие системы могут обеспечивать высокую производительность без ущерба для скорости, безопасности или эффективности. GAIA Benchmark, комплексный набор оценок для продвинутого ИИ, предназначен для оценки того, как хорошо системы справляются с реальными задачами, которые обычно требуют значительного времени и навыков от человеческих экспертов. Состоящий из 450 сложных подсказок, которые тестируют исследовательские, аналитические и рассуждательные способности, этот бенчмарк служит ключевым отраслевым показателем для оценки эффективности универсальных больших языковых моделей (LLM) агентов.

Система GAIA Agent от Coral, использованная в эталонном тесте, основана на протоколе Coral и заимствует принципы дизайна OWL от CAMEL. Она включает в себя специализированных агентов для выполнения ряда задач, включая исследование, анализ, критику, планирование и навигацию в интернете, все из которых общаются через серверную инфраструктуру MCP от Coral.

Лидирование в рейтингах GAIA Benchmark для небольших моделей указывает на потенциал Coral расширить функциональность систем ИИ за счет графовой структуры. Этот результат предполагает, что высокоэффективные, легкие агенты могут быть созданы с использованием небольших моделей, что облегчает обработку более широких данных, более плавную интеграцию в экосистему и улучшенную коммуникацию между агентами.

«Роль малых моделей в агентных системах до сих пор недооценивалась, но времена начинают меняться», — сказал Кэлем Фордэр. «Мы доказали, что такие модели могут масштабироваться за пределы своих ранее известных границ и конкурировать с действующими игроками. Я уверен, что они сыграют центральную роль в будущем агентного ИИ», — заключил он.

Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
0/400
Нет комментариев
  • Закрепить