微软全面升级Windows 11,语音成为核心交互方式
来源:36kr 1 天前

10月17日,微软宣称要让每一台Windows 11电脑都变成“真正的AI PC”。通过全面升级Copilot功能,人机交互体验更自然,AI的表现更聪明。

微软此次升级包含三大核心功能: 

● 新的“Hey, Copilot”语音唤醒功能,用户可直接通过语音下达指令。

● 全球上线Copilot Vision,让AI能够"看见"并理解屏幕上的内容,并提供帮助。

● 预览阶段的Copilot Actions,支持AI助手直接在PC上执行任务。

这次重大升级标志着一项战略赌注:从单纯追求处理性能,转向打造智能化的对话式交互体验。微软希望让每一台Windows 11设备都成为这一新范式的载体,同时通过Copilot连接器整合Gmail等第三方服务。 

01 无需动手,语音成为核心交互方式

能对话的电脑?微软官宣全面接入Copilot,Windows 11 PC化身AI助手中心

微软官方表示,正全力推动语音成为继键盘、鼠标之后的核心PC交互方式: 随着“Hey, Copilot”唤醒功能的全面开放,用户无需再点击图标,直接说出唤醒词即可开启与AI的对话。系统会以麦克风图标和提示音回应,确认用户处于聆听状态。结束对话同样简单:既可以说“再见”,也可以直接停止说话。

微软认为,这一设计消除了传统语音助手的使用门槛,是微软将AI带给更广泛用户的关键举措。虽然这并非微软首次涉足语音交互领域,但该公司相信,基于现代AI技术打造的智能助手将能打破用户与电脑对话的心理障碍,实现以往未能达成的使用习惯变革。微软内部数据显示,使用语音与Copilot交互的频率是纯文本输入的两倍。

02 一个能“看懂”屏幕的AI助手,安全性能也高了 

Windows 11藏新招,任务栏新增Copilot,喊一声召唤AI外挂

微软表示,正在为其AI未来图景添加一个关键组件:能够“看懂”屏幕的Copilot Vision。这项功能现已全面上线,让AI首次具备了真正的视觉能力,它可以实时分析和理解用户屏幕上的内容,并在任何应用程序中提供精准的上下文帮助。

微软此前曾推出名为Recall的功能,旨在通过持续截屏记录用户操作,帮助用户回溯和找回过往内容。然而,这项功能自发布以来便陷入隐私争议。由于用户无法对截图内容进行精细筛选或控制,所有操作皆被默认记录,因此被认为“监视工具”。

此次微软吸取了Recall的教训,Vision采取了更谨慎的隐私保护策略。该功能默认关闭,用户需要在每个会话中主动点击独特的“眼镜”图标授权,才能启动屏幕共享。这种设计类似于Teams会议中的视图共享,确保用户对隐私的完全掌控。

一旦启用Vision功能,系统将具备实时分析屏幕内容的能力。该功能可提供软件操作的分步指引、协助排查系统问题,并能针对屏幕显示内容进行解答。 

并且,Vision应用范围已从早期的单一程序支持扩展为"桌面共享"模式,现在可以识别并理解用户跨多个应用程序窗口的完整操作流程。

微软Copilot团队这样描述其工作原理:“当你共享桌面或特定窗口时,Copilot就能看到你所看到的一切,并实时与你讨论其中的内容。”

这项技术的应用场景极其丰富:从为创意项目提供建议、帮助优化简历内容,到指导玩家掌握新游戏技巧等等。其“高光指引”功能尤为实用,能够直接在屏幕上用视觉方式标出需要点击的位置。

不过需要注意的是,Vision目前仅具备“观察”和“建议”的能力,无法直接代表用户操作系统。执行操作的任务由专门的Copilot Actions负责。为了满足不同用户习惯,微软还在开发纯文本交互模式,让不喜欢语音的用户也能享受这项服务。

03 向“智能体”演进:Copilot Actions开始接管PC

微软推出Copilot Actions模式,让AI帮你搞定单调乏味工作

在本次更新中,面向本地文件的Copilot Actions功能具有革命性的意义,它让AI首次能够在用户PC上直接执行多步骤操作任务。这标志着AI正从被动的“助手”向主动的“智能体”演进,它不再只是响应用户指令,而是能够主动为用户完成工作。

这一突破让Copilot变成了微软所称的“通用智能体”。现在的Copilot不仅能回答问题,更具备了实际操作能力,比如打开应用、输入文字、滚动页面,甚至执行复杂的多步骤任务。

用户只需用日常语言描述需求,比如“帮我整理上个月度假的照片”或“从这份PDF里提取所有数据”,智能体就会尝试通过与桌面和网络应用的交互来完成任务。 

当智能体在后台默默工作时,用户可以继续专注于其他事务。更重要的是,用户始终掌握着控制权,随时可以查看任务进度、审查智能体已执行的具体操作,或者在任意时刻中断任务、亲自接管。

04 当Xbox遇见AI游戏伙伴 升级娱乐体验

微软此次升级不仅限于办公或提高生产力领域,该公司也在探索AI如何融入娱乐体验。

例如在手持游戏设备领域,通过ROG Xbox Ally和ROG Xbox Ally X,微软将两种看似不相干的技术——便携游戏与人工智能助手,巧妙地融合为一体。

除了能够快速访问来自Xbox、PC Game Pass及其他主流游戏商店的内容,用户现在还可以直接与Copilot对话。

只需长按设备上的“库”按钮,即可唤出微软的个人游戏助手——Gaming Copilot。它能在游戏过程中实时提供攻略推荐、操作技巧与场景解读,而玩家无需退出当前游戏,也无需切换屏幕。

总而言之,微软正在将其AI PC定位为值得信赖的助手和伙伴。 微软执行副总裁尤素夫·梅赫迪(Yusuf Mehdi) 表示:“我们希望每位用户都能体验到,拥有一台不仅仅是工具,而是真正伙伴的PC意味着什么。”

简体中文 English