El Protocolo Coral supera a Microsoft en un 34% con el mejor Indicador de referencia GAIA para Mini-Modelo de IA

En resumen

El sistema multi-agente de Coral Protocol superó a Magnetic-UI respaldado por Microsoft en un 34% en el GAIA Benchmark, demostrando que la orquestación inteligente de modelos más pequeños puede rivalizar o superar los enfoques tradicionales de IA a gran escala.

El Protocolo Coral Establece un Nuevo Estándar Para Sistemas de IA Mini-Agente, Superando a Microsoft en un 34% en la Prueba GAIA

Infraestructura descentralizada para la IA colaborativa, Coral Protocol informó que su sistema de múltiples agentes superó a Magnetic-UI, respaldado por Microsoft, en un 34 % en el GAIA Benchmark—un resultado sin precedentes que sugiere que la escalabilidad horizontal puede ofrecer un enfoque más efectivo que la ampliación de parámetros del modelo. El sistema del protocolo aprovecha la orquestación inteligente a través de múltiples agentes, en lugar de centrarse únicamente en aumentar el tamaño del modelo.

Este rendimiento marcó la puntuación verificada más alta en el GAIA Benchmark utilizando mini agentes, apoyando la premisa de NVIDIA de que modelos más pequeños y bien coordinados podrían desempeñar un papel clave en el futuro de la IA. El resultado, según los desarrolladores de Coral, refleja un cambio conceptual en cómo se aborda la escalabilidad de la IA en lugar de un mero aumento en el poder del sistema.

Como un protocolo abierto, Coral facilita la expansión de las capacidades de IA al permitir la coordinación entre agentes especializados a nivel global, en lugar de depender de modelos generales centralizados. Su arquitectura permite la interacción paralela y segura entre los agentes, mejorando la funcionalidad de los modelos de lenguaje de todos los tamaños en tareas que requieren razonamiento avanzado, planificación y resolución de problemas.

“Este avance marca un punto de inflexión en la infraestructura de IA”, dijo el CTO de Coral, Caelum Forder, en un comunicado escrito. “Es prueba de que la escalabilidad horizontal no solo es posible, sino práctica, y Coral es la forma más efectiva de hacerlo. La Internet de Agentes es ahora una realidad funcional. Si eres un desarrollador de agentes, simplemente Coralízalo. Si eres un desarrollador de aplicaciones, constrúyelo mejor por menos utilizando nuestra infraestructura”, agregó.

Coral Tops GAIA Benchmark, Valida el Poder de los Modelos Pequeños en Sistemas Agentes Avanzados

En medio de la creciente competencia para desarrollar sistemas agentes avanzados, gran parte del enfoque ha permanecido en escalar modelos para gestionar la creciente complejidad de las tareas. El reciente rendimiento de Coral desafía este enfoque predominante, alineándose con los hallazgos de un estudio reciente de NVIDIA que sugiere que los sistemas más pequeños pueden ofrecer un alto rendimiento sin comprometer la velocidad, la seguridad o la eficiencia. El GAIA Benchmark, una suite de evaluación integral para IA avanzada, está diseñado para evaluar qué tan bien los sistemas manejan tareas del mundo real que normalmente exigirían un tiempo y habilidades sustanciales de expertos humanos. Compuesto por 450 complejos prompts que ponen a prueba las capacidades de investigación, análisis y razonamiento, el benchmark sirve como una métrica clave de la industria para evaluar la efectividad de los modelos de lenguaje de propósito general (LLM).

El sistema GAIA Agent de Coral, utilizado en la prueba de referencia, se basa en el Protocolo Coral y se inspira en los principios de diseño del OWL de CAMEL. Incorpora agentes especializados para llevar a cabo una variedad de tareas, incluyendo investigación, análisis, crítica, planificación y navegación web, todas las cuales se comunican a través de la infraestructura de servidor MCP de Coral.

Liderar las clasificaciones del GAIA Benchmark para modelos más pequeños indica el potencial de Coral para extender la funcionalidad de los sistemas de IA a través de una estructura basada en gráficos. Este resultado sugiere que se pueden crear agentes ligeros y de alto rendimiento utilizando modelos más pequeños, lo que facilita un manejo de datos más amplio, una integración más fluida en el ecosistema y una mejor comunicación entre agentes.

“El papel de los modelos pequeños en los sistemas agentes ha sido subestimado hasta la fecha, pero las mareas están comenzando a cambiar”, dijo Caelum Forder. “Hemos demostrado que tales modelos pueden escalar más allá de sus límites previamente conocidos y superar a los incumbentes. Estoy seguro de que tienen un papel central que desempeñar en el futuro de la IA agente”, concluyó.

Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Compartir
Comentar
0/400
Sin comentarios
Opere con criptomonedas en cualquier momento y lugar
qrCode
Escanee para descargar la aplicación Gate
Comunidad
Español
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)