王坚九问九答:六年前我们看的是泳池,如今中美面朝同一片大海
来源:36kr 1 小时前

智东西6月12日报道,今日,2026智源大会在中关村国际创新中心举办,中国工程院院士、阿里云创始人王坚智源研究院理事长黄铁军在现场播客对话上分享了一系列前沿判断和新颖观点。 

如何比别人更早看到未来?王坚认为,我们需要给自己超出现有框架的思考方式。“我们在讲人工智能(AI)时,也被这个词限定了。”他认为,我们应该像前面图灵奖得主Whitfield Diffie所说的一样,在动物智能、人类智能以及机器智能这一更大的框架下去思考AI叙事。 

▲中国工程院院士、阿里云创始人王坚

人类会不会被机器智能统治?他的观点非常鲜明:“我坚定不相信AI会替代人类。狗的鼻子比人灵敏很多,但我们从来不觉得这对人有什么威胁。” 

王坚认为,我们今天讲所有大模型的问题,其实原来都是来形容人的。我是一个无药可救的乐观主义者,所以我一直相信人类自己创造的问题,人类一定会解决的。 

谈及中国AI的叙事,黄铁军对年轻从业者提出建议:要有自己的想法,更要在该下决心时下决心,不适合拿交作业、一定成功的心态面对不确定性。王坚则补充:今天中国和美国看到的是同一片大海,六年前我们可能还困在游泳池里,如今早已面朝同一片天地,这场远行远未到头。 

▲智源研究院理事长黄铁军

当被问及人与 AI 的关系,黄铁军称人类与AI会像父母与孩子般共存融合,人类会借AI拓展人类边界。王坚认为人类天然畏惧新技术,AI 影响未必能超越火在历史上的作用,他以早年大众畏惧纸笔类比当下 AI,并提出“一定要让token变得‘不值钱’”,让其如纸张般廉价。 

王坚、黄铁军与主持人卫诗婕的对话全文纪要如下,智东西做了不改变原意的编辑:

1、作为云计算之父,您在云计算、城市大脑、AI基建、太空计算这些关键节点上总比别人先看到未来,这一切是基于怎样的一套底层的思维模型?

王坚:其实没有。今天上午听了两位图灵奖得主发言,我还是很感触的。特别是第二位Andrew Barto,他在讲强化学习的时候提到了一位心理学家叫桑代克,大概是80年代初我们学心理学课本的时候学的。所以大家可以设想一下,很多时候今天已经很难讲有一个想法,是你先想过还是说另外一个人先想过。所以这实际上变成一个问题:你想了之后有没有告诉大家,更困难的是说你有没有勇气可以去尝试一下,到最后就是当觉得没有希望的时候,你能不能非常有毅力地往前多走一步。 

2、您回答的非常宏观,我要拆解一下。您写的书里提到事情底层是有一些共通性的,我很好奇您分析问题的底层方法论?

王坚:其实也很难讲思维方式。前面第一位教授Whitfield Diffie的发言也令我很触动。他提到,我们都在讲AI,里面蛮挑战的一件事情是因为有这个词,我们就会自觉不自觉地搭了这么一个框架。就像我经常会讲,这个会场决定了我们怎么开会、你能说什么、你有什么方式讲,所以很少有人真正去想这件事情。 

所以其实现在我们在讲AI的时候,有意无意地被AI这几个字被限制住了。所以今天早上为什么Whitfield Diffie教授在讲这个事情,也触动我的神经。大家去看一下,我大概2017年在贵阳也讲了他今天讲的几乎一模一样的东西,就是为什么会有这个Animal intelligence(动物智能)和Human intelligence(人类智能),以及Machine intelligence(机器智能)?所以我觉得任何一件事情,你还是要给自己一个可以超出现有框架的思考框架。

所以对我来讲,思考今天面临的挑战,我是一定会在Animal intelligence、Human intelligence跟Machine intelligence的框架下来想这件事情。所以我坚定地不相信,今天大家都讲的AI会替代人类。

原因也很简单,我经常会说狗的鼻子比人要灵敏很多,可是我们从来没有觉得有什么伤害。所以当你有这样一个框架的时候,其实还是帮你多想了很多问题。所以我想每个人都应当建立一套独立的思考框架,可能会比较好一点。 

3、您提到我们要有相信的事情,同时让别人相信也很重要。当年阿里云每年10亿,连续10年投入,获得全力资源支持很重要。如何让大家相信你的相信?

王坚:一些东西在传播中会变得不准确。但是有一件事还是肯定的,我们暂且不用资源这个略显庸俗的词。我认为一个人做事需要别人帮助,但做事不要太机会主义。

我做过一个活动叫“2050”,就是完全让今天不出名的、没有资源的人来参与,但他们到这个活动来不是来找资源的。其实我们有一个很简单的想法,当你想做一件事情,当你讲一件事情的时候,其实在某种意义上讲,别人认为正不正确、怎么感受,在一定意义上是不重要的。重要的不是在台上讲的人说服了下面的人相信他,而是这个年轻人在台上讲了他对世界的看法、他要做一件事情的决心,最后台下的人信不信就变得不重要了。他自己在台上讲过这句话,他就会信了。 

所以我觉得很重要的事情是,你一定要说你自己相信的事情,要说你自己会去做的事情。我相信,如果这样的话,就一定会有人支持你。如果任何人是一个前提,就是说如果我想要做一个事情,没有人支持我我就不会做了,那基本上会觉得没有人会支持你。 

4、黄院长,智源可以说是中国AI界的黄埔军校,也是我们大家的未来的持续不断AI创新的摇篮,请您讲一讲中国AI叙事是基于一种怎样的相信?

黄铁军:智源很幸运,一个是成立在2018年这个很恰当的时间,很幸运北京市给了我们很自由的体制和长期稳定支持;而且我们很幸运的在这个恰当的时间点上做了一件正确的事,就是2020年上百人一起来攻关大模型。 

在那之前,国内外已经有不少专家研究和取得进展,但真的把真金白银几千万、几个亿投下去,是要决心的。所以我在恰当的时间就动手了,而且五个月推出1代大模型,然后接着过三个月第2代就已经追赶上了,所以我觉的时代给了我们一个机会。 

但是我也想再多说两句,这件事也是人类的一个渐进的过程。大模型实际上经过了几十年的积累,先别说神经网络,就是next token prediction(预测下一个词元),也是 2000年就被提出来了。当然那时候作为技术演进,提出者自己也不确定效果好不好,但这个方法探索出来了,后来很多技术汇聚在一起,才有了这么一次大的爆发。 

所以我想,中国现在处在一个科技创新爆发的时间点,这里边有很多很多的因素。但是最重要的是两个方面。第一你得有自己的想法,要不然那你只能随波逐流;第二个就是该下决心的时候下决心,我们不能拿那种交作业、一定成功的思路来看待这件事,科技的不确定性永远存在,所以要有想法,要该决定的时候就决定。 

5、从追赶到定义自己的故事,中国的AI叙事是什么样的?

王坚:其实刚才铁军讲那个智源的事情,我补充一下。我觉得智源还是蛮具有开创性的。我一直觉得那个时候以这样的规模、决心来做AI,在当时还是非常不容易的。所以让我想起一个词,就是我们以前经常讲一个东西,叫火箭科学,我们强调这个东西有多么扎实,但是没有比火箭更加危险、更不确定性的。 

今天上午一个谈话,主持人问说做安全是不是有它的确定性,结果嘉宾的回答就是实在很难说有什么确定性,对不对?所以我想做AI这件事情,从智源开始,这也是我特别佩服的地方。 

这跟以前我们做研究不太一样。以前做研究就是要拿点经费然后做一做,基本上做好了你就告诉全世界,做不好了没有人知道。但是现在做模型的时候,它其实跟以前不一样。因为哪怕不要说整个模型,哪怕你就是中间的一个环节,比如你做了三个月、五月训练,其实如果这个结果不好,他花掉的钱就相当于炸了一枚火箭,大概一个亿、两个亿。可是今天,大家知道你要好好训练一轮的话,到最后你花掉的电费,花掉的算力费大概也是在这个量级上。 

所以回到这个地方,就是中国AI叙事和美国的差别,其实没有那么简单,我也不好说。因为里面有个前提:基础研究就是全世界的,大概没有基础研究不是全世界的。所以你无论从哪里看到的论文,看到的书上的东西,基本上没有说你看不到的,应该大家都看得到。所以从这个角度讲的话,它就是全世界的。回到中国跟美国的AI叙事,大家来问我们跟他们差距多大?我是不太愿意用这种方式来描述我们之间的关系。 

用我自己的话来讲,因为在过去这些年大家的努力,我一直说至少中国美国在这个领域看到是同一片大海。如果六七年以前,我担心的就是我们看到是个游泳池,别人看到大海,尽管远处看看都是蓝蓝的,那你走近看才知道不是同一个天地。那基本上我今天还是可以说我们大家看到的是同一片天地。至于谁离得近一点远一点,可能是一个技术性的问题了。那这这场市场发展或者这么一个里程的话,我觉得远不是几天就可以走到头。所以我们还有很长的路可以来往前走。 

6、我们中国有机会提出自己的智能问题、技术路径和创新范式吗?

黄铁军:我觉得,我跟刚才王老师的意见一样,目前,中美在大模型为代表的这个工程实现上,确实是都做的很好,但是这个问题,不能解读为一个国家或者两个国家的问题,它是人类整个很多思想,很多一点一滴的积累的过程。很简单,你看今天两位图灵奖获得者,他们也不是说就在我们通常关注的著名的大学或者机构,Hinton、Sutton都在加拿大。当然我相信这个全球这么多学者,这么多研究人员,实际上是在一个巨大的相互作用的社区,社群在起作用。 

所以从未来,就刚才说叙事,其实我觉得,咱们中国在做,全世界也在做,其实几十年来一直是一个大逻辑。闭幕上的时候我还会讲,我今年特意选了一个题目叫,悟道一以贯之。这个当然不是我的悟道,这是孔子说的话,实际上这个道路本身就一直是那样子。这个道路是什么样子? 

你想想做智能,其实就两件事:一个就是今天我们大家天天说的数据驱动,如果再说的广一点就是功能驱动。今天,刚才两位图灵奖得主都讲到过,你收集到这些东西,然后去训练。然后形成一个模仿人的,或者是生物智能的一个东西。 

另外一个就是结构基础,就是那你用个什么样的生理和物理基础?我们人当然我们的人的身体,我们的大脑,现在机器有Transformer,也有正在这个改进的,甚至于革命的架构,所以就这俩东西在在不断的这个演进提升。我相信,我们中国的学者,应该在这些两大方面都会做出越来越多的贡献,具体例子我就不说了哈,时间有限,以前也做了一定不少贡献,我相信未来会做更多的贡献。 

所以总而言之,就是AI,或者大家说,AGI是个人类的大叙事,我们也可以说宇宙智能进化的一个大方向。我希望,我们作为研究者也好,开发者也好,企业也好,能够在这样的一个进程中,都有自己的贡献,留下自己的一个星星,都能汇聚成一个巨大的宇宙。

王坚:好,其实你问了个挺好的问题,我觉得铁军没有很好的回答你。你讲到关于智能的理解的这件事情。其实intelligence这个词还是蛮有意思的,大家知道翻回中文的话。当然大家都知道,就翻成了智能。但是另外一个,还有一个比较更直接的翻译,就是翻成情报,所以CIA就是这个intelligence,这个词还是蛮特别的。我为什么说,问了个很好问题? 

大家都知道我是心理学背景。其实从人的角度来理解这个intelligence是什么,其实到今天还是远远是个未知数。所以刚才为什么会讲这个Animal intelligence、Human intelligence和Machine intelligence。其实关于Animal intelligence这件事情,今天研究还是个谜。Human intelligence就更加深奥了。所以,三个谜搞在一起,其实还是个很复杂的事情。 

所以我想这是一个很长时间可以探索的一个问题,这里面的空间远远超出我们今天可以看到的实现,因为我们今天看到的东西,都是今天可以实现的东西。那到底现在这个状况,给大家创造出一个什么机会出来了?特别是对年轻的学者。我还是觉得应该用铁军自己说的话,我其实当时听到他的发言,我也学了很多,尽管我也想过,但从来没有这样表达出来。他讲过,但是后来,好像他自己也没讲清楚,我用铁军的话再说一下这个事情。 

你们有可能在座有人听见过,他讲过一件很有意思的事情,他就讲这个飞机是在没有大家彻底理解空气动力学的情况下飞起来了,你讲过这个话。其实这里面就关注到我们今天非常关键的问题,就是说,关于我们对这个世界本质的理解,跟我们要做的事情,它一定是交错的来上升的。 

只有当一个学科或一个领域承受到一定程度的时候,好像我们今天就可以离开这样的迭代来发展。我个人觉得就人工智能也好,叫机器智能也好,今天基本上还是在一个我们对它的认识在加深,有工程的迭代,这样的交互的情况下来做。所以严格意义上讲,在飞机飞起来以后,12年,才成立航空系,对不对? 

黄铁军:30多年。 

王坚:30多年,是吧?所以大家可以想想,飞机飞起来以后,30多年才成立了它的航空系的。所以从这个角度,如果假定我们今天讲AI是一个大的变革的话,我们可能真的还远没有到能够成立真正意义上的AI系的时候,所以这个对年轻人是极其有诱惑力的。 

也就是说这个世界,不要说有没有问题解决,这个世界的开始都是非常早期的,所以基本上就是一个世界开始的混沌期,这是我对这个事情的理解。那铁军讲的航空的例子,我觉得更好来佐证这件事情。 

所以绝对有机会提出自己的智能问题。不是绝对有机会,就是不提出都是你的过错。

7、今年陶哲轩和DeepMind的Agent智能体AlphaEvolve合体破解了一个尘封50多年的世界级数学难题Erdős,王坚教授,您认为AI是不是已经开始推动人类智能的边界了?您看到新范式了吗?

王坚:其实这个对我个人印象还是非常深的。也就是说,当我们今天的大语言模型出来以后,或者这样的一个架构出来以后,当然在语言上我们是首先看到的,是吧?尽管当时就是为了做机器翻译做出来的,但是这就想到了最早,大概在84年、85年的时候,当时就是达特茅斯开会的那10个人之一,就Herbert Simon到我们系里来讲课,讲AI。所以那个时候其实都是在讲逻辑的问题。反正你看那个时候所有AI的问题,都是那些编出来的问题,所以它叫toy problem,就是说玩具性的问题,无论是机器视觉也好。 

所以,到了今天,你就会发现一个质的变化,先不说从理论上、工程上,你就会发现一个非常质的变化,也就是说大家要解决的问题,再也不会是个toy problem,都是可能对人理解都是非常困难,这是一个非常非常质的变化,至少在我看来。这些问题都已经超出我们的想象,这是第一个。 

第二个,从今天发展,大家可以看到,很有意思的一件事,就是跟数据有关系,因为过去大语言模型所有的数据其实本质上都是文本,无论你从互联网上来也好。那么中间你看有一个非常有意思的事情,就是我们今天非常熟悉的,也变成一个潮流的vibe coding。在中间,就有出来一个东西叫代码,那大家知道代码这个,大家如果最早写过代码,你知道代码最简单的就是开始写的时候,在Linux上写代码的时候,你就用一个文本编辑器就好了。 

就是没有比文本编辑器再简单的编辑,所以从这个角度它还是文本。但是在这个领域有人说过一句话的,就是不要把代码当作文本,就don't treat code as a text。 

所以,从这个逻辑上,代码就不是文本,所以它为什么在那个领域,包括我们今天看到这个改变了我们程序员工作的方式,事实上,AI往前走了一大步,它真的在某种意义上,能够区分出来什么是我们讲的语言的文本,什么是我们写代码的文本。今天这个智源发布,谈到了像生命科学蛋白质这些事情嘛,再往下就是什么是真正的科学意义上的数据,这是完全不同的。所以我一直有时候觉得AI开始理解科学了,结果他们用的是不是科学论文里边的文本的话,我觉得这个是有它的非常大的局限性的,直到你能够理解真正意义上的科学的数据,这也就是智源今天在讲生命的里边做的个东西。但是,碰巧我们就理解了,也是碰巧今天有机会我们可以去理解真正意义上的科学的数据了。所以当你能够真正理解科学的数据的时候,科学一定会改变,所以它会彻底改变我们过去科学研究的一个方法。 

我们过去科学研究怎么来做的?就是一个科学家,或者一组科学家,他们自己去收集数据,完了自己理解数据,事实上只理解了一遍,最后写成论文发表,这个数据就从此放在那。所以,你看整个的逻辑就是一小部分人,甚至只有一个人,对一个非常困难收集起来的数据理解过一次,这个故事就结束了。所以,有AI就会发现,其实我们有的科学数据可以被不同的人、用不同的方式、在更大的规模上理解了,所以我想它对科学的影响是非常长远。 

如果从历史上你看有两件事情,很有意思的一件事情,因为我们讲数据的时候,有时候特别会讲我们要去收集一些新的数据。但你看AlphaFold,你看这个AlphaFold其实没有去新收集新的数据,它用的都是以前沉淀下来的数据,但是这个在科学发展历史上不是孤立的。伽利略也从来没有去收集过数据,他用的数据都是别人这个收集起来的。 

所以,我想我们到了这个时代,就是所有科学的数据都会因为AI的出现,会被重新理解一遍。这个时候,这个变化你大概可以想想会有多大。所以我想首当其冲一定是科学研究本身,就像当能理解代码的时候,首先受到冲击的就是程序员本身,我觉得这个逻辑是一致的。 

8、当Agent可以改变世界的时候,我们怎么去界定它的危机?怎么把它控制在一个可控范围内,确保它对人类有益?

黄铁军:我觉得,就是刚才讲的控制、确保这些词,大概都不现实,这个是一个互动,一个很复杂的事件。但是我们确实要考虑,共存。智能体也是智能体,智能,我们也是智能。我们每个人可能将来都自己都会有很多智能体,大家去互动。在这样的一个多智能体,包括人,机器智能体,包括物理智能体,具身在内的一个复杂的世界里边,总要有一个界面和共识。否则的话,咱人类世界也一样的。世界应该是什么?我大概两三年之前写过,也是个采访,我觉得就是理性世界。因为我们说智能体是黑箱。刚才说你不可理解,它只会告诉我们答案,它也不告诉我们怎么想到的。 

其实人类也一样,每个人人脑也是一个黑箱。那你到底跟一个人交流的时候,你到底是只相信他告诉你结论?你还是要跟他探讨一下,为什么你这么想。为什么你给我医生给我个建议背后有什么。我们肯定是关心这个问题。所以将来也是一样的哈,智能体,现在首先它能给出一个不错的答案,很好。 

但是接着,我相信大家就会挖背后的为什么了,会讨论,只有我们像医疗这种安全重要的领域,包括刚才蛋白质有害蛋白这些东西的时候,一定是要最后有一个明确结论,咱才能变成行动,变成后续的之前的,大概都是一个开放讨论。大家可以脑风暴,互相思考,人跟智能体之间,我相信应该是这样的一个过程。所以一方面,我觉得不能完全确保他的这个控制,但是,我觉着我们能够共同找出一条路来共存,来理性的发展下去。 

王坚:其实这个问题的结论,我觉得我跟铁军是100%一样的。但是为了表明我这个说100%不是为了自己偷懒,不表达自己的观点,我还是说一下。真的跟铁军,我没跟铁军对过这个问题,但真的跟他100%一样,我还是想说一下,用我的方法来表达一下。 

其实大家可以设想一下,比如说当大语言模型出来的时候,大家会批评一个东西嘛。批评他说当时就说,他有幻觉。有hallucination。大家可能,但是很少人想过,hallucination这个词,本来就是来形容人的。也就是说我们今天讲所有大模型的问题,你把它找出来看一看,其实原来都是来形容人的。

所以,人就是有这个问题的。有时候人的幻觉可能比我们想象的要严重的,要严重的多。我为什么这么看?反正这个大家理解,我是一个无药可救的乐观主义者,所以我一直相信人类自己创造的问题,人类一定会解决的,这是这是我所有背后的逻辑。 

所以,今天我觉得也是这样,比如说我在说稍微极端一点,我们经常会讲有个很牛的人,我们况且把他叫做大师吧。他讲了这个话,我没听懂。这个含义背后,你觉得是他脑子,你也可以把他理解成他脑子里是个黑箱,我们很难理解。所以今天我们碰到一个系统,这个系统的行为也好,什么东西也好,你今天不能够理解,我个人觉得不是一个灾难,我觉得是我们可以去试图理解,以后可以让我们整个的认识,往前走一大步,所以我想,这也一定是一个很重要的迭代过程。所以我想。 

所以今天,我曾经在一个场合说过一句话,其实今天我们对这个事情,对整个智能系统,或者你叫智能体的认识,我觉得还是值得重新去梳理一下的,哪怕你从测试角度都可以看得出来。所以比如今天我们做测试也好,做这个排名也好,所有的测试排名都是只测这个智能体,或者模型本身的能力。但我们也今天找不到一个方法,甚至不去测。这个模型跟人一起工作的时候,它的综合能力到底是什么?今天有没有方法?所以我个人觉得我们事实上应该找到很好的方法,怎么让一个智能体和人的工作一起的时候,评判它综合能力,我觉得如果有这个排名的话,我个人觉得会更加有意思一点,对。 

9、你们认为人和AI的关系应该是什么样的?

黄铁军:会形成特别美好的共存融合的关系。这有点像父母和孩子,AI是孩子,有冲突但不可分离。AI可以去宇宙之外,我们很难做到,我们通过智能这个桥梁连接。 

王坚:我们首先是大自然的孩子,是世界的一部分。任何新技术出来,人们对它都是恐惧的,刚开始使用火时也是一样的。我甚至觉得AI能不能对人类的影响超过火,还是个问号。正如人们常转述图灵的观点:一个人、一张纸、一支笔,配合固定运算规则,本质就是一台计算机。 

大家可以去稍微看看七八十年前的材料,中国一个普通的百姓看到一张纸、一支笔人都会哆嗦,当时会写字对人来说是一个多大的挑战。AI大概就处在这个地方。 

从技术角度来讲,我们的token太贵了。一定要让token变得“不值钱”,就像一张纸一样。

简体中文 English