Meta发布高效新模型Llama 3.3 70B
2024-12-06 / 阅读约5分钟
来源:TechCrunch
Meta推出Llama3.370B,性能媲美405B模型但成本更低,已可在Hugging Face等平台下载。Meta加强AI基础设施建设,计划建10亿美元数据中心,为训练下一代Llama模型做准备。

图片来源:Larysa Amosova via Getty

Meta近日宣布了其Llama系列生成式AI模型的最新成员——Llama 3.3 70B。

在Meta X部门的一篇博文中,Meta生成式AI副总裁Ahmad Al-Dahle透露,仅以文本形式存在的Llama 3.3 70B模型,在成本更低的前提下,性能与Meta最大的Llama模型Llama 3.1 405B不相上下。

“通过利用最新的训练后技术进展……该模型在成本显著降低的同时,核心性能也得到了提升,”Al-Dahle写道。

Al-Dahle展示了一张图表,显示Llama 3.3 70B在包括MMLU(评估模型语言理解能力的基准测试)在内的多项行业基准测试中,表现优于Google的Gemini 1.5 Pro、OpenAI的GPT-4以及Amazon新发布的Nova Pro。Meta发言人通过电子邮件表示,该模型预计将在数学、常识知识、指令遵循及应用程序使用等领域带来显著改进。

介绍Llama 3.3——全新的70B模型,其性能与我们的405B模型相当,但运行更为简便且成本更低。通过引入包括在线偏好优化在内的最新训练后技术,该模型在……方面实现了核心性能的提升。pic.twitter.com/6oQ7b3Yuzc

— Ahmad Al-Dahle (@Ahmad_Al_Dahle) 2024年12月6日

Llama 3.3 70B现已可从AI开发平台Hugging Face及其他渠道(包括Llama官方网站)下载,这是Meta最新推出的“开放”模型,旨在广泛应用于各种场景并实现商业化,以在AI领域占据领先地位。

Meta的条款对部分开发人员使用Llama模型的方式有所限制;月活跃用户超过7亿的平台需申请特殊许可证。然而,对于许多人而言,Llama模型在严格意义上是否“开放”并不重要。据Meta称,Llama的下载量已突破6.5亿次。

Meta内部同样在利用Llama模型。Meta的AI助手完全基于Llama模型构建,据Meta CEO马克·扎克伯格透露,该助手目前每月活跃用户近6亿。扎克伯格声称,Meta AI有望成为世界上最常用的AI助手。

对于Meta而言,Llama的开放性既带来了机遇也带来了挑战。11月,有报道称中国军事研究人员曾利用Llama模型开发了一款防御聊天机器人。随后,Meta将其Llama模型提供给美国国防承包商使用。

Meta还对其遵守《人工智能法案》的能力表示担忧。该法案是欧盟为人工智能建立的监管框架法律,Meta认为其实施对其开放发布策略而言“过于不可预测”。此外,与欧盟隐私法GDPR相关的AI培训条款也是Meta面临的另一挑战。Meta在Instagram和Facebook用户(未选择退出的用户)的公开数据上训练AI模型,而这些数据在欧洲受到GDPR的保护。

今年早些时候,欧盟监管机构要求Meta在评估公司遵守GDPR的情况时停止使用欧洲用户数据进行训练。Meta同意了这一要求,并同时支持一封公开信,呼吁对GDPR进行“现代解读”,而非“拒绝进步”。

面对其他AI实验室所遇到的技术挑战,Meta正不断加强其计算基础设施,以训练和部署下一代Llama模型。该公司周三宣布,将在路易斯安那州建造一个耗资10亿美元的AI数据中心——这是Meta建造过的最大AI数据中心。

扎克伯格在Meta 2024年第二季度财报电话会议上表示,为了训练下一代Llama模型Llama 4,公司将需要比训练Llama 3多10倍的计算能力。Meta已采购了超过10万台Nvidia GPU集群用于模型开发,其资源规模与xAI等竞争对手相媲美。

训练生成式AI模型是一项成本高昂的任务。Meta 2024年第二季度的资本支出增长了近33%,达到85亿美元(一年前为64亿美元),这主要得益于对服务器、数据中心和网络基础设施的投资。