智源研究院发布开源中文互联网语料库CCI 4.0
1 天前

5月8日消息,智源研究院于5月6日在法国巴黎GOSIM全球开源创新论坛上发布了大型开源文本数据集CCI 4.0,涵盖中、英语,未来还将推出更多语言版本。此次发布由智源研究院牵头,联合阿里云、上海人工智能实验室、华为、出门问问、金山办公、昆仑万维等多家机构共同贡献。CCI 4.0数据集的发布将促进文本数据在人工智能领域的应用和发展。