DeepSeek:“边缘革命” 的可能性
16 小时前 / 阅读约10分钟
来源:36kr
连这样优秀的前沿大模型都以开源的方式呈现,那么大学似乎就更应该以“开源”的魄力面对公众和未来

专注通用人工智能的中国科技企业——杭州深度求索人工智能基础技术研究有限公司(简称DeepSeek)近期在世界人工智能赛道上掀起了一股旋风。

从产品角度看,DeepSeek的开源推理模型免费商用,直接面向用户,并可支持具体的开发, 提供相关应用场景模式服务,支持联网搜索与深度思考模式的网络实现;DeepSeek擅长处理复杂任务,其文本生成、自然语言理解及分析、编程与代码相关功能,均具有很强的应用模式合理设计及二次开发特征。

DeepSeek最显著的影响是促进了开源AI模型的采用。DeepSeek的成功证明,开源战略可以带来更快的创新和广泛采用,这被认为带来了AI行业的“开源时刻”。

DeepSeek的成功还表明了一种“边缘革命” 的可能性,即边缘者通过自身努力有可能会进入中心。对于AI的玩家而言,DeepSeek是一个闯入者,其母公司是做量化金融起家的。对于世界而言, 这同样蕴含了新的机会。在之前的人工智能发展中,似乎形成了某种霸权。美国的高科技大公司通过垄断算力从而垄断创新的可能性,发展中国家无法获得充足的算力,很难获得相应的人才,所以几乎与大模型的发展无缘。DeepSeek的成功让发展中国家看到了一种AI真正普惠的可能性,而今,每个国家的参与者只要去追踪这些新的知识,都可能重新上牌桌。当然,伴随着AI的进一步深入发展,其联动的全球治理问题就会变得更加重要。当大模型的参数变得超级大时,会产生大模型可能失控的风险。一方面,关于大模型是否会产生自我意识有诸多争议;另一方面,恶意使用者可能会使用其进行一些破坏性的活动。

开源启示录

我们认为,DeepSeek产业运行模式的成功, 对中国特色AI产业平台的建设及提升有如下启示:

(1)在全球网络产业平台中,中国企业并非一定要占据最底层的基础技术开发。此次深度求索(DeepSeek)二次开发平台的成功说明,掌握底层技术的国家,并不能完全控制网络产业平台的价值传播和利益流向。只要合理规划二次开发和传播模式,使之符合具体的技术场景与国家地区特点, 就能打造出具有中国特色的人工智能应用平台。通过该应用平台,能够促进资本合理流动,进一步推动基础技术的发展。

(2)中美AI差距在缩小。自ChatGPT发布以来,中美之间的人工智能差距似乎一直在拉大。特别是到OpenAI发布GPT-4和o1之后。然而,DeepSeek的V3和V3-0324的发布,让这样的发展差距似乎缩小到了几个月之内。这让我们重新看到了中国人工智能发展的新机会和新潜能。

(3)真正AI产业化的时代来临。这恰恰是中国最擅长的。我们也有广阔的产业和应用场景,可以跟人工智能更好地结合。DeepSeek的成本革命会加速这种产业应用进程。大部分大模型服务提供商已经将原来的收费模式变为免费,所以人工智能发展会进入一个低成本AI运行时代。此外, 大语言模型应用程序接口(API)的价格也在下降, 并最终可能接近免费。当然,这并不是没有成本。其成本仍然是由大模型服务提供商承担的,但这个成本的降低最终会让消费者获利,从而大大加速产业应用发展。

(4)小团队驱动大团队。DeepSeek代表了一种小团队的胜利,与OpenAI当年产生的效应类似。大公司拥有较多算力和超多资源,但是非常在乎股价,所以大公司做根本的创新极为困难。真正的创新往往是由小团队驱动的。DeepSeek以这种方式再次演绎了小团队驱动大公司的逻辑。

(5)国内产业内循环模式设计及国际国内产业整体循环模式设计,需要合理定位相关产业的内外循环模式接口政策体系。一方面,要在保证“技术国境线”安全的前提下,从平台底层掌控的角度, 合理设计相关的国家技术导引机制;另一方面,要防止当年冷战时期美苏技术平台对抗条件下所进行的不合理技术比拼模式再现,避免不计成本及方向定位不准确。建好中国的“技术国境线”,有关部门要在信息技术、网络技术和智能技术的底层平台国家投资及掌控基础上,进行有中国特色的国际平台产业生态的合理模式设计及有效方向导引。

(6)相关产业政策研究部门要合理分析产业运行数据,通过政策引导资本支持科技企业创新。要鼓励国内资本参与以国家利益为最终目标的国际竞争。但资本是有获利需求的,且往往是中短期需求。近年来,有关部门陆续颁布了一些政策文件,对创业投资基金出台了差异化的支持政策,利用创业投资基金加大对行业科技领军企业、科技成果转化和产业链上下游中小企业的投资力度,鼓励投早、投小、投长期、投硬科技。除在国资模式下对技术平台的长期定向投资之外,建议相关管理部门要合理引导民间资本成为长期资本、耐心资本,让更多的民间资本参与中国特色智能产业平台的底层建设。

(7)应用加速后需要关心社会风险。之前, 我们还没有走到世界最前沿的时候,不需要太多考虑这个问题,因为其他先行者会去探索各种可能性。当我们真正走到世界创新最前沿的时候,我们需要把各种综合性问题都考虑好,这样才能够保障人工智能的健康发展,才能保障人工智能最终产生正向的社会效益。

大模型时代的教育变革

在大模型时代,教育也需要发生根本性的变革。

之前的教育体系是为工业时代准备的,其训练的基础是人们对知识的记忆和一些知识技能的掌握。然而,在今天,大模型作为强大的知识辅助工具,会对这种过于强调记忆功能的培养模式产生巨大挑战。未来教育的重点应该更多地落到创新和实践上去。之前的多数学习者只能学到人类知识中非常局限的一小块,也很难做到真正的创新, 因为其掌握的知识量比较小,所以有限的创新多数都是在前人基础上做出一点点微小的调整。此前, 只有少数天才才能走到创新的最前沿。创新多数是针对少数天才或精英而言的。绝大多数普通的学习者,终其一生,进行的多数工作往往是重复性的劳动。而今天,在大模型支持的背景之下,创新需求变成应有之义。这样的创新需求在海量知识的基础之上发生,因为大模型本身已经包含着海量知识。

未来教育转型的一个重点,应该面向更加扎实的通识教育,需要在求知者求知欲最强的阶段(例如中学时期),就把科技的最前沿以某种科普的方式向学习者传递,在学习者心中种下这些知识的种子, 而不应该像现在一样还在重复地训练某些可能已经过时的计算技能或记忆技能。

大模型已经作为一个辅助性的通才站立在这个时代。对于人类个体而言,大模型所生成的内容, 大多数已经远远超出了普通学习者的能力。所以, 这对教育提出的一个基本要求是,我们现在需要快速地提高个体知识的储备量。在量的基础上,再增加其对知识理解的深度,这样才能够匹配上大模型强大的知识理解和生成能力。因为大模型所生成的内容是需要被诱发的,这其实高度依赖提问者的知识能力。如果提问者对这方面毫无所知,那他(她) 就不可能去诱发大模型的高质量内容生成。因此, 学习者需要海量地扩大其知识基础,同时只有在海量知识的基础之上,学习者才能产生蕴含了涌现效应的“顿悟时刻”(Aha Moment)。

“明牌时代”的知识开源

历史上看,知识通常是掌握在知识精英手中的, 个体通过长时间的学习才能够接近这些高端知识。而且,个体往往以一种“爬阶梯”的方式来进行学习。然而,在今天的“明牌时代”,只要向大模型发问, 个体就可以获得最为前沿的知识,这其实是一种跃迁式的知识获得。以前的知识获得需要一点点地以阶梯式推进。换言之,如果个体缺少前面的知识积累与理解,其在后面就很难理解新的知识。但是, 如今在大模型的辅助之下,只要掌握合适的提问方法,个体的学习就可以加速。这里还有一些学习的技巧。有的时候,以“一目十行”或者“半知半解” 的方式进行,可能会加速这种学习。从这个角度来讲, 学习者就可能会加速地、跃迁式地获得全量的高端知识。这就使得我们的知识进入一个“明牌时代”。

大模型起到了一种知识赋权或知识平权的作用。进而言之,知识由“暗知识”变成了“明知识”。就连我们人类社会中的一些默示知识(如潜规则), 由于其已经暗含在大模型预训练的文本中,这些暗知识同样都可以通过大模型来获得。这就使得个体掌握和理解这些知识的意义在下降,其重心需要从理解和掌握转变为实践。在之前的时代,个体掌握了知识,就可以进行知识生产。而在未来,知识生产的工作逐步会交给大模型,所以个体所要承担的最重要的功能就需要从原先的知识生产变为知识实践。

我们今天已经进入了一个终身学习的时代。之前我们的学习往往会集中在青少年时期。学习往往是通过基础教育和高等教育完成的。而今天的教育必须是一个终身学习的过程,因为知识在不断地迭代。一旦正式学习结束之后,个体不再进行知识的更新,那么个体的知识结构就会陈旧,很快会被这个时代抛弃。因此,如何形成一种长效的学习机制, 就变得至关重要。大学是学习的最高殿堂,应该变得更加开放,允许那些毕了业的人,或者没有机会进入大学的人,可以通过各种方式来大学—通过一个学习共同体进行线上或者线下的学习。对于学习者而言,大学应该是没有围墙的。

DeepSeek的开源给了我们很多启示。我们特别关注的启示之一是,连这样优秀的前沿大模型都以开源的方式呈现,那么大学似乎就更应该以“开源”的魄力面对公众和未来。MI·趋势