Grab 自研语言模型解决亚洲语言识别难题
2 天前

新加坡超级应用公司Grab发现,当前大型语言模型对东南亚语言理解能力不足,且OCR系统处理多样化文档模板效果欠佳。为此,Grab计划于2025年自行构建视觉大型语言模型。该公司以阿里巴巴云的Qwen2-VL2B模型为基础,提取东南亚语言内容并建立内部合成数据管道,先通过低秩适配技术微调,再进行完整参数微调,成功开发出轻量级模型。该模型表现优于多种OCR工具和通用模型。未来,Grab将继续开发自有模型,以扩展文档处理技术。

简体中文 English