OpenAI 宣布开源 SimpleQA 新基准,专治大模型“胡言乱语”
作者:小编 1 周前

OpenAI近期推出了名为SimpleQA的新开源基准,用于评估语言模型在回答事实性问题时的准确性。该基准旨在解决当前语言模型常生成错误或未经证实答案的问题,通过确保答案的正确性、多样性和挑战性来实现。SimpleQA采用简洁的问题和答案格式,便于评估,且已被实验证明对前沿模型如GPT-4等具有挑战性。但值得注意的是,SimpleQA的准确性目前仅限于短查询的事实导向问题。OpenAI希望通过开源SimpleQA推动AI研究,提高模型的可信度和可靠性,并已提供开源链接和论文供研究人员参考。

WebPro
其他登录方式
登录即表示你已阅读并同意
《WebPro用户注册协议隐私政策
注册WebPro
获取验证码
注册即表示你已阅读并同意
《WebPro用户注册协议隐私政策
找回密码
获取验证码
绑定手机号
获取验证码
登录即表示你已阅读并同意
《WebPro用户注册协议隐私政策
完善资料
登录即表示你已阅读并同意
《WebPro用户注册协议隐私政策
微信登录
扫描二维码 | 授权登录WebPro