上海AI实验室发布IWR-Bench 揭示AI视频转网页短板
2 天前

据AIBASE报道,2025年10月,上海人工智能实验室联合浙江大学推出全球首个视频转网页评测基准IWR-Bench,填补了AI前端开发动态交互评测的空白。该基准要求模型通过“视频+静态资源”重建网页交互,覆盖2048游戏、机票预订等场景,以视觉保真度(VFS)和交互功能正确性(IFS)评估。对28款主流模型的评测显示,GPT-5综合得分仅36.35分,其中IFS仅24.39%,VFS达64.25%,暴露了AI在动态逻辑理解上的短板。

简体中文 English