作者:相青,编辑:赵元
2022 年 11 月,ChatGPT 上线。两个月后,它的月活用户突破 1 亿,成为互联网历史上增长最快的消费级应用之一。
很多人当时认为,这只是一次搜索方式和内容生产方式的升级。但如今回头看,这场技术浪潮真正改变的,很可能是互联网本身的运行逻辑。
过去三年,AI 行业已经经历了三个明显阶段:模型时代、应用时代,以及正在到来的操作系统时代。
如果说 ChatGPT 代表了大模型的入口,那么最近爆火的 OpenClaw,则让人们看到了让 AI 从“回答问题的工具”,变成“替人做事的操作系统”的希望。
当 AI 能够调用工具、访问文件、操作软件、甚至主动执行任务都变得安全可靠 时 ,未来计算机系统的结构也可能随之改变。
一个类似 PC 时代 Windows、移动互联网时代 iOS/Android 的AI 操作系统,正在逐渐形成。
一、 不完美的启蒙者
与传统 AI 聊天工具不同,OpenClaw可以直接操作电脑、调用软件并执行任务,这是它能够爆火的关键因素。
必须正视的是,当前的OpenClaw远非一款成熟、易用的产品,甚至存在诸多明显短板。它的部署门槛较高,运行过程也并不丝滑,还面临着权限安全、隐私泄露、Token消耗过快等现实风险,这些问题都让它难以迅速成为大多数普通人的生产工具。
但这款“不完美”的产品,核心价值在于完成了一次关键的行业启蒙与认知突破——让更多人第一次直观感受到,AI 不仅能“动口”给出答案,还能“动手”完成任务。
随着OpenClaw的爆火 ,国内科技公司纷纷通过接入“龙虾”,开启AI入口之战。
除了Kimi等大模型公司接入OpenClaw ,最令人关注的是腾讯与字节等大厂的动作。
在AI领域推进相对谨慎的腾讯,这一次动作异常密集,一连发布5个龙虾产品,包括桌面AI智能体WorkBuddy、接入企业微信的OpenClaw、接入QQ的OpenClaw、腾讯云轻量云部署OpenClaw,以及腾讯电脑管家推出的QClaw。
更关键的是,其中已有产品可以关联QQ和微信。比如,安装QClaw后,就能直接在微信和龙虾对话,让它帮你干活。以后,当你休息时突然被领导安排一个工作,你直接在微信发一句话,就能让电脑帮你完成任务,包括改表格、发邮件、操作浏览器流程等,再也不用被打断休息了。
腾讯还在推进微信内部的官方智能体。
据The Information报道,腾讯正为微信打造一款新型AI Agent,该Agent将连接微信内运行的数百万个提供各类服务的小程序,涵盖从预约出租车到订购杂货等众多领域,以在竞争中超越阿里和字节跳动等对手。报道称,该项目被列为高优先级机密计划,拟于今年年中启动灰盒测试,三季度正式推出。
字节跳动、百度等也在做类似的布局。
火山引擎正式上线ArkClaw,据官方介绍,这是一款开箱即用的云上SaaS版OpenClaw。无需任何复杂配置,打开网页即可使用7×24小时在线的AI 助手,轻松养“虾”。
百度也推出了手机应用“红手指Operator”,将OpenClaw能力延伸至移动端,支持用户通过自然语言指令实现跨App任务自动化,实现打车、外卖订餐等跨App的交互操作。
这些公司动作为何如此迅速?
核心原因在于, AI 正经历从生产力工具向系统级入口的质变。与早期的聊天式 AI 不同,新一代 AI 智能体可以调用软件、操作设备并自动完成复杂任务。
如果说移动互联网时代的入口是 App ,那么在 AI 时代,入口很可能变成 AI 智能体。而这场AI时代的操作系统之争已经在全球范围内打响。
一方面,AI 公司正在强化 AI 的系统能力。
OpenAI 正在持续扩展 ChatGPT 的工具调用、任务执行和开发者接口,使 AI 可以直接连接各种软件服务。
最近,OpenAI推出的GPT-5.4,引入了原生计算机使用功能,使人工智能代理能够通过鼠标、键盘和视觉输入与操作系统、网站和应用程序进行交互,开发人员可以使用该模型在各种软件环境中自动执行多步骤工作流程。
同时,传统科技巨头正进行底层防御。
微软正在将 AI 深度嵌入 Windows 与 Office 体系,希望让 AI 成为新的操作入口;苹果则在 iPhone 与 macOS 中强化本地 AI 能力,试图将 AI 融入系统底层。
当 AI 能够调用应用、操作设备并执行复杂任务时,一种新的计算架构正在形成,用户 → AI → 应用服务,围绕这一入口的竞争,本质上是一场新的操作系统入口之争。
二、 下一轮AI竞争,拼的是行为数据
OpenClaw 的爆火,让 Agent 在短时间内成为 AI 行业最热的方向之一。但对科技公司来说,这场竞赛与当下 AI 产业的现实压力有着莫大关系。
过去几年,大模型训练主要依赖互联网公开文本,例如百科、新闻、书籍或论坛内容。但随着模型规模不断扩大,这些数据的价值正在下降。
已有研究指出,人工智能对数据的需求增长速度远远超过了真实且多样化的数据来源所能提供的速度,缺乏自然产生的真实数据,正使人工智能的发展面临严重风险。
研究机构 Epoch AI 曾在2024年发布的一项研究预测,科技公司将在十年(大约在 2026 年至 2032 年之间)耗尽人工智能语言模型可用的公开训练数据。
短期来看,像 OpenAI 和谷歌这样的科技公司正在竞相获取高质量的数据源,有时甚至为此付费,以训练其人工智能大型语言模型,例如,通过签署协议来获取 Reddit 论坛和新闻媒体源源不断的句子。
从长远来看,新的博客、新闻文章和社交媒体评论将不足以维持人工智能目前的开发轨迹,这将迫使企业利用现在被视为私人的敏感数据(例如电子邮件或短信),或者依赖聊天机器人自己输出的不太可靠的“合成数据”。
而下一阶段模型能力提升的关键,不只是更多文本,而是更接近真实行为的数据。
当用户让 AI 完成一个任务时,AI 会经历一系列具体步骤,比如搜索信息、打开网页、调用软件或填写表单。这些操作会形成完整的任务链路,也就是业内常说的任务轨迹数据。
与静态文本相比,这类数据更接近真实世界中的行动逻辑,对训练具备执行能力的 AI 模型具有更高价值。从这个角度看,科技公司大规模推广 Agent,也是为了抢先争夺下一轮竞争的数据源,训练自己的模型。
当越来越多用户通过 Agent 完成任务时,这些操作过程本身也会形成大量新的训练数据。
在使用 Agent 的过程中,用户往往需要不断给出指令、纠正错误、调整任务步骤。对于 AI 系统来说,这些交互过程实际上构成了一种高质量的强化学习数据。每一次任务执行、每一次修正,都在记录 AI 如何逐步完成复杂任务的完整轨迹。
一旦这些数据被汇总到云端,它们就可能成为训练下一代 Agent 模型的重要资源。
相比传统互联网文本,这类数据不仅包含语言信息,还包含任务拆解、工具调用和决策路径,对于提升模型的推理能力和执行能力具有更高价值。
三、 AI正进入“1995 时刻”?
如果将时间线拉回到30年前,1995 年的互联网正处于混沌期。
彼时 TCP/IP 协议已成熟,但大部分企业仍然在摸索互联网究竟能做什么,普通人进入互联网也需面对枯燥的指令。
直到 Windows 95 的出现,它通过图形化界面有效地封装了底层技术的复杂性,并通过标准化的 API 接口为开发者搭建了低门槛的创作环境。
这一改变,不仅让“联网”从极客行为转化为普通人点击图标的日常,更促成了 PC 软件生态的爆发,开启了互联网普及的黄金十年。
30年后的今天,AI 产业似乎也站在一个类似的“1995 时刻”。
大模型已展现出处理各种复杂任务的能力,比如可以写报告、生成视频、编写代码、分析数据、以及操作电脑、调用软件并执行任务,几乎无所不能。
但在实际使用中,普通用户仍然需要学习复杂的提示词,在不同网页和应用之间来回切换,寻找合适的模型或 Agent 完成任务。
换句话说,AI 的能力已经足够,但缺乏一个能将各种AI能力转化为系统效率的组织中枢。
以此来看,Windows 95 是 PC 时代的操作系统入口,那么 AI 时代也急需自己的“操作系统”。它将成为连接用户、Agent 和应用服务的统一中枢,包括理解用户意图、拆解任务、调度工具、生成结果,用户只需提出需求,其余由系统自动完成。
过去几十年,从 PC 时代的 Windows,到移动互联网时代的 iOS 与 Android,应用始终是网络世界的基本单位。用户使用手机或者电脑的过程一直是,打开应用,再在应用内部完成各种操作。
但在 AI 操作系统的架构下,这一逻辑可能发生变化。
当 AI 能够理解用户需求、调用工具并自动完成任务时,用户不再需要自己打开多个应用,而是只需要告诉 AI 想完成什么事情。AI 会在后台自动调用不同服务,并将最终结果返回给用户。
这种模式下,计算机系统的结构将变成:用户 → AI → 应用服务。
这意味着,AI 时代,计算机可能进入一种新的交互模式,即意图驱动:用户不再需要学习软件如何使用,而只需要表达自己的意图;计算机系统的任务,则是理解意图,并自动调用各种工具完成任务。
那么,这样的 AI 操作系统会以何种形态出现?目前行业正处于多路径演进的交汇点。
一种可能是新的硬件入口。OpenAI已经请了初代 iPhone 的设计师艾维参与研发首款人工智能消费产品,希望他能复制自己在设计苹果iPod、iPhone和iPad等最具标志性产品时所取得的成功。
据外媒报道,这款产品被定位为“第三核心设备”,可以放在口袋里,也可以和MacBook Pro、iPhone一起放在办公桌上。而且这款设备将小巧便携,能够感知周围环境和生活情境,并且完全没有屏幕。
另一种可能是在超级应用之上建立 AI 入口。如腾讯、阿里等平台型公司,都在尝试通过 AI 将现有的应用生态重新整合,让用户通过一个入口调用各种服务能力。
无论何种形态,如果这一模式真正成熟,那么 AI可能成为PC和移动互联网之后,下一代计算平台的核心基础设施,而在这种新架构下,今天以 App 为核心的流量分发体系,也可能被重新改写,真正的商业权力将从“应用流量”转移至“意图分发权”。

