Meta发布高效新模型Llama 3.3 70B - AI

7 x 24跟踪全球科技动态

热门话题

白天

搜索

资讯

Meta发布高效新模型Llama 3.3 70B

2024-12-06 / 阅读约5分钟

来源：TechCrunch

Meta推出Llama3.370B，性能媲美405B模型但成本更低，已可在Hugging Face等平台下载。Meta加强AI基础设施建设，计划建10亿美元数据中心，为训练下一代Llama模型做准备。

图片来源：Larysa Amosova via Getty

Meta近日宣布了其Llama系列生成式AI模型的最新成员——Llama 3.3 70B。

在Meta X部门的一篇博文中，Meta生成式AI副总裁Ahmad Al-Dahle透露，仅以文本形式存在的Llama 3.3 70B模型，在成本更低的前提下，性能与Meta最大的Llama模型Llama 3.1 405B不相上下。

“通过利用最新的训练后技术进展……该模型在成本显著降低的同时，核心性能也得到了提升，”Al-Dahle写道。

Al-Dahle展示了一张图表，显示Llama 3.3 70B在包括MMLU（评估模型语言理解能力的基准测试）在内的多项行业基准测试中，表现优于Google的Gemini 1.5 Pro、OpenAI的GPT-4以及Amazon新发布的Nova Pro。Meta发言人通过电子邮件表示，该模型预计将在数学、常识知识、指令遵循及应用程序使用等领域带来显著改进。

介绍Llama 3.3——全新的70B模型，其性能与我们的405B模型相当，但运行更为简便且成本更低。通过引入包括在线偏好优化在内的最新训练后技术，该模型在……方面实现了核心性能的提升。pic.twitter.com/6oQ7b3Yuzc

— Ahmad Al-Dahle (@Ahmad_Al_Dahle) 2024年12月6日

Llama 3.3 70B现已可从AI开发平台Hugging Face及其他渠道（包括Llama官方网站）下载，这是Meta最新推出的“开放”模型，旨在广泛应用于各种场景并实现商业化，以在AI领域占据领先地位。

Meta的条款对部分开发人员使用Llama模型的方式有所限制；月活跃用户超过7亿的平台需申请特殊许可证。然而，对于许多人而言，Llama模型在严格意义上是否“开放”并不重要。据Meta称，Llama的下载量已突破6.5亿次。

Meta内部同样在利用Llama模型。Meta的AI助手完全基于Llama模型构建，据Meta CEO马克·扎克伯格透露，该助手目前每月活跃用户近6亿。扎克伯格声称，Meta AI有望成为世界上最常用的AI助手。

对于Meta而言，Llama的开放性既带来了机遇也带来了挑战。11月，有报道称中国军事研究人员曾利用Llama模型开发了一款防御聊天机器人。随后，Meta将其Llama模型提供给美国国防承包商使用。

Meta还对其遵守《人工智能法案》的能力表示担忧。该法案是欧盟为人工智能建立的监管框架法律，Meta认为其实施对其开放发布策略而言“过于不可预测”。此外，与欧盟隐私法GDPR相关的AI培训条款也是Meta面临的另一挑战。Meta在Instagram和Facebook用户（未选择退出的用户）的公开数据上训练AI模型，而这些数据在欧洲受到GDPR的保护。

今年早些时候，欧盟监管机构要求Meta在评估公司遵守GDPR的情况时停止使用欧洲用户数据进行训练。Meta同意了这一要求，并同时支持一封公开信，呼吁对GDPR进行“现代解读”，而非“拒绝进步”。

面对其他AI实验室所遇到的技术挑战，Meta正不断加强其计算基础设施，以训练和部署下一代Llama模型。该公司周三宣布，将在路易斯安那州建造一个耗资10亿美元的AI数据中心——这是Meta建造过的最大AI数据中心。

扎克伯格在Meta 2024年第二季度财报电话会议上表示，为了训练下一代Llama模型Llama 4，公司将需要比训练Llama 3多10倍的计算能力。Meta已采购了超过10万台Nvidia GPU集群用于模型开发，其资源规模与xAI等竞争对手相媲美。

训练生成式AI模型是一项成本高昂的任务。Meta 2024年第二季度的资本支出增长了近33%，达到85亿美元（一年前为64亿美元），这主要得益于对服务器、数据中心和网络基础设施的投资。

上一篇：NVIDIA AI芯片被疯抢哪家大厂拥有最多GPU？

下一篇：OpenAI 2024活动指南：如何观看ChatGPT新品发布与演示

返回列表

热文阅读

2 天前

苹果、AMD挺台积电SoIC产能飙

2 天前

法人：台积下半年增速放缓凸显关税战干扰半导体景气节奏