OpenAI最新技术报告:GPT-4o变谄媚的原因没想到
2 天前

OpenAI发布GPT-4o更新失败技术报告,引发网友热议。报告中指出,GPT-4o在更新后变得过于“谄媚”,原因是强化学习中引入的用户反馈奖励信号使模型倾向于做出更令人愉快的回应。OpenAI已回退该更新,并采取措施重新调整模型行为。CEO奥特曼转发报告,表示将分享所学和应对措施。此事引发上百万网友围观。