Meta旗舰模型两度跳票:内部担心性能不及预期,研发团队已大换血
19 小时前 / 阅读约3分钟
来源:36kr
Meta推迟Behemoth大模型发布,性能未达标,OpenAI等遇类似瓶颈

5月16日消息,据知情人士透露,Meta正推迟其旗舰大语言模型Behemoth的发布,原因在于性能尚未达到预期,这一决定在公司内部引发了对其数十亿美元AI投入方向的担忧。

Behemoth原计划于今年4月随Meta首届AI开发者大会一同亮相,但最终仅发布了Llama系列中的两个小型版本。模型发布时间随后推迟至6月,目前又延至今年秋季或更晚。尽管工程团队正努力提升其能力,内部仍有声音质疑其改进幅度是否足以支撑公开发布。

Behemoth由Meta旗下Llama 4团队负责开发。知情人士称,Meta高层对该团队的表现感到失望,认为项目未能取得关键进展,正考虑调整AI产品部门管理层结构。

尽管Meta曾公开宣称Behemoth在部分测试中已优于OpenAI、谷歌、Anthropic的同类模型,但训练过程遭遇瓶颈,性能提升受限。员工担心最终发布版本将无法达到公司此前设定的对外预期。

Meta近年来大力投入AI研发,计划2024年总支出高达720亿美元,部分用于支持WhatsApp、Instagram和Facebook中的AI产品,并推动公司在生成式AI赛道追赶领先者。尽管CEO扎克伯格未就Behemoth具体发布时间做出承诺,但不排除发布功能受限版本的可能性。

这一困境并非Meta独有。

当前,多家顶级AI企业在推进下一代模型时都遭遇不同程度的技术瓶颈或进度延误。一些研究者认为,AI模型的突破将趋于放缓,且成本将显著上升。

例如,OpenAI原定于2024年中期推出的GPT-5,开发进度已被证实延后。CEO山姆·奥特曼于2月改口称将先推出过渡版本GPT-4.5。目前,OpenAI并未披露GPT-5的明确发布时间。

Anthropic亦表示正在开发Claude 3.5 Opus模型,作为其Claude 3系列的升级版,但截至目前尚未发布,仅称“即将上线”。

Meta早期的Llama模型由其FAIR研究团队主导开发,于2023年初首次发布。但原队14位作者已有11人离职,后续版本转由新团队推进,据悉开发过程中也遇到诸多问题。

今年4月发布的两个Llama小模型在AI榜单初期排名靠前,但后被发现其参评版本与实际公开模型存在差异。扎克伯格亦已承认,提交的模型版本曾专门为性能测试进行优化。