小米 Mi-BRAG 智能引擎亮相:用 AI 问答代替产品说明书,登上评测榜首
9 小时前 / 阅读约4分钟
来源:IT之家
小米官方今日介绍了 Mi-BRAG 知识库问答框架,该框架通过四大核心技术体系重构知识处理范式,已在公司多个场景中落地应用,包括小爱同学的个人信息问答、汽车问答助手、商品问答等。
感谢IT之家网友 顺势而为 的线索投递!

IT之家 5 月 6 日消息,小米官方今日介绍了 Mi-BRAG 知识库问答框架,该框架通过四大核心技术体系重构知识处理范式,已在公司多个场景中落地应用,包括小爱同学的个人信息问答、汽车问答助手、商品问答等

  • 全格式兼容:搭载智能解析引擎,可无损处理 PDF、Word、Excel 等十余种文档格式,为企业构建统一知识库奠定基础;

  • 全模态解析:突破传统文本局限,精准解析复杂图片、表格、图文混排等多元信息;

  • 多语种问答:支持主流语言的文档解析与交互问答,打破知识流通的语种壁垒;

  • 细粒度溯源:采用动态溯源定位技术,对每个生成结果标注原始文档及引用位置,一键追溯信息源头,构建可信知识生态。

小米官方介绍称,大模型(LLM)虽具备强大的生成能力,但仍面临诸多挑战:知识更新成本高、企业私有知识理解不足、数据安全隐患等。RAG(Retrieval-Augmented Generation,检索增强生成)技术的引入为这些问题提供了有效的解决方案。

  • 弥补大模型的时新性大模型基于历史数据进行训练,无法获取最新信息。RAG 通过检索最新的文档或数据库,可为生成过程注入实时信息,确保输出内容的准确性与时效性;

  • 增强特定领域知识的准确性:大模型基于互联网公开数据,难以涵盖特点领域或者企业私有知识。RAG 技术通过构建外部知识库,实现特定知识注入,从而增强其在特定领域的表现;

  • 数据隐私与安全性:大模型直接处理企业敏感数据(如内部文档)可能引发隐私泄露风险。RAG 通过检索阶段调用私有数据库(如本地化存储的企业知识库),在生成答案时仅基于检索到的相关片段进行加工,避免原始数据被模型存储或泄露。

小米在场景上 TOC(小爱个人信息问答、智能文档问答等)和 TOB(集团内部提效:新产品研发、员工助手、智能客服)等大量应用场景亟须自研的 RAG 框架提供领域安全高可靠的智能知识中枢提升产品的智能化及用户体验。

小米大模型团队认为,一个完整的知识问答框架应该包含如上图所示的四个部分:知识库创建(B)、知识检索(R)、知识增强(A)和回复生成(G)。而知识库创建(B)模块其实特别重要,对问答效果会产生至关重要的影响,不应被忽视,所以小米大模型团队将框架命名为 Mi-BRAG 。Mi-BRAG 支持多种格式文档解析和图文混合的多模态问答,为用户提供更多应用选项。

在 RAG 的基础框架下,自研框架 Mi-BRAG 的技术创新主要分布在:

  • 知识库创建(B):跨模态的知识融合及构建“金字塔型”动态知识体系等;

  • 知识检索(R-A):用户 Query 理解的增强,多维语义增强等;

  • 回复生成(G):为知识注入场景定制模型,强化无关信息的拒答、精细化的溯源的能力。

第三方评测机构 SuperCLUE 通过单文档问答、多文档问答及搜索问答三大典型场景的综合评估,小米 2025 年 4 月在 SuperCLUE-RAG 生成能力评测中登上榜首。这主要归功于 Mi-BRAG 在抗噪声数据处理与信息整合方面的创新数据构建方法,以及其突破性的模型训练范式。

ASQA 是一个长格式的事实类数据集,测试集中的每个问题,需要多个简短答案来涵盖对问题的不同解释。因此,模型要综合多份文件中的信息进行回答。小米团队测试了 Mi-BRAG 和业界大模型在 ASQA 测试集上的表现,评测过程主要关注多文档生成溯源准召率。

IT之家从小米官方公告获悉,目前小米 Mi-BRAG 已在小爱同学个人信息问答,汽车问答助手,商品问答等场景落地,未来小米大模型团队将持续攻坚端侧算力优化与云边协同架构,内存压缩、功耗控制等关键技术领域实现突破;同时将深化多模态技术整合,打造覆盖文本、语音、视觉的全模态智能问答体系,持续拓展智能家居、汽车问答等应用场景,全面赋能小米「人车家全生态」战略体系。