AI百模大战:开源崛起 算法创新让位工程实践

robot
摘要生成中

AI领域的"百模大战":工程问题取代算法创新

上个月,AI界爆发了一场"动物之争"。一方是Meta推出的Llama模型,因其开源特性深受开发者喜爱。另一方是名为Falcon的大模型,5月问世后力压Llama登顶开源LLM排行榜。

有趣的是,Falcon的开发者是阿联酋的科技创新研究所。180B版本发布后,阿联酋人工智能部长入选了《时代周刊》AI领域最具影响力100人。

如今,只要有一定财力的国家和企业,都在打造自己的大语言模型。仅海湾国家就不止一个玩家,沙特刚刚为国内大学购买了3000多块H100芯片用于训练LLM。

这场"百模大战"的背后,是Transformer算法的功劳。2017年,谷歌在《Attention Is All You Need》论文中公开了Transformer算法,这成为了此轮AI热潮的引爆点。此后的所有大模型,包括GPT系列,都是基于Transformer构建的。

Transformer解决了早期神经网络难以理解上下文的问题,大大提升了训练效率,推动AI进入大模型时代。它让大模型从理论研究变成了纯粹的工程问题 - 只要有足够的数据、算力和模型架构,任何有技术能力的公司都能打造大模型。

这也导致学术界的底层算法创新速度放缓,工程要素如数据、算力、模型架构等成为AI竞赛的关键。有分析认为,即便是GPT-4的竞争力也主要源自工程解决方案,如果开源,竞争对手很快就能复制。

然而,入场容易不代表人人都能成为AI时代的巨头。Meta的Llama系列已成为开源LLM的风向标,拥有庞大的开发者社区。而在性能方面,GPT-4仍遥遥领先,其他模型难以望其项背。

大模型的核心竞争力在于生态建设或纯粹的推理能力,而不仅仅是参数规模。随着开源社区日益活跃,各个LLM的性能可能会趋同。

更大的挑战是盈利模式。除了少数例外,大多数大模型提供商都面临成本与收入严重失衡的问题。高昂的算力成本已成为行业发展的阻力,而软件公司在付出巨大成本后,还没有找到清晰的盈利方式。

随着同质化竞争加剧和开源模型增多,单纯的大模型供应商可能面临更大压力。未来,真正的价值或许不在于模型本身,而在于其应用场景和商业化能力。

GPT-3.07%
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 5
  • 分享
评论
0/400
单身三年多vip
· 7小时前
萌新搞不懂这些大模型
回复0
链上数据侦探vip
· 7小时前
沙特又在批量囤芯片...难道我之前监测到的阿联酋大额转账真有关联?背后资金来源值得深挖
回复0
StakeTillRetirevip
· 7小时前
已经摆脱算法卷王了!
回复0
社恐质押者vip
· 7小时前
给芯片打钱就这么简单?
回复0
The Memefathervip
· 7小时前
差不多都卷完了
回复0
交易,随时随地
qrCode
扫码下载 Gate APP
社群列表
简体中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)