黄仁勋的直钩钓不了中小企业

来源：36kr 6 小时前

设想这样一个场景：一家估值百亿的制造巨头，试图用当下最火的智能体框架OpenClaw（业内戏称为“龙虾”）来审查一份涉及核心商业机密的供应链合同。

技术团队面临着一个无解的死锁——如果把数据全都上传到云端的满血大模型，公司的安全合规部门会立刻拔掉网线，毕竟邮件被清空、商业机密沦为模型训练语料的事故早已不是新闻。

但如果让“龙虾”在本地的Mac mini上跑开源小模型，虽然每秒85 Tokens的输出速度看起来很唬人，可一旦面对复杂的交叉比对和逻辑推理，它的智商就会瞬间跌落，难堪重任。

这就是当下Agent落地时最真实的写照。

当工信部开始频频对企业使用OpenClaw发出预警时，“龙虾”的这场成人礼显得异常艰难。横亘在其中的关键门槛，早已不再是单纯的“智商”比拼，而是“安全”的绝对控制权。

为何安全议题在2026年突然变得如此生死悠关？

因为剥开大模型光鲜的外衣，你会发现“龙虾”实在太烧钱了。C端玩家根本无力承担多步推理和反复调用工具所带来的恐怖Token消耗。

这种指数级爆发的算力消耗，只有B端坚韧的钱包才能兜底。

然而，B端付费的底线极其明确：数据是企业的命脉。没有极致的安全围栏，企业绝不敢把核心工作流交托出去。

安全，成了获取B端门票的唯一通行证，是引爆Token经济学的前提。

于是，我们看到了一场军备竞赛式的产业角逐。英伟达、阿里（钉钉）、面壁智能等厂商纷纷下场，试图抢夺这道“安全围栏”的定义权。

而谁定义了安全的边界，谁就能在未来稳坐牌桌。

01

要理解巨头们的算盘，必须先看清“龙虾”在现实中的尴尬处境。

OpenClaw之所以在GitHub上如火箭般蹿升，Star数甚至将React和Linux斩落马下，本质上是开发者群体对“云端AI霸权”的一场盛大叛逃。大家受够了被OpenAI或Anthropic的闭源API抽税，受够了隐私被云厂商随时窥探，他们渴望一种无需许可、数据不出本地的自由Agent形态。

但现实的耳光总是极其响亮。本地部署的“龙虾”蠢得令人发指。普通消费级硬件撑死只能跑7B、13B参数的模型。面对复杂的财务模型或长文本代码生成，本地“龙虾”就像是让一个小学生用极快的语速背诵微积分公式，背得再快也掩盖不了理解力的缺失。

另一方面，全盘云端化又面临着前所未有的安全围剿。误删核心邮件、黑客通过Prompt注入窃取权限，诸如此类的安全事故让企业管理层对云端Agent犹豫不决。

在这个高不成低不就的死胡同里，“龙虾”陷入了商业模式的死锁。

而就在此时，穿着标志性皮衣的黄仁勋，在GTC 2026的镁光灯下，抛出了他的救命稻草——NemoClaw与DGX Station。

老黄的叙事极其诱人：你们不是想要本地化吗？你们不是既想要万亿参数的智商，又想要数据绝对不出屋的安全吗？来，买我的DGX Station。数据物理隔离，绝对安全；内存高达748GB，本地跑透万亿大模型。

不得不说，老黄不但技术精湛，营销也是一把好手。

但稍微懂点行的业内人士都能看出，这是一个极其精密的“直钩钓鱼”陷阱。老黄绝口不提的是，那所谓的“本地跑万亿参数”，实际上是运行在NVFP4量化版（4-bit精度）上的阉割版。

这种阉割并非简单的精度损失，而是通过对权重进行非线性映射，将原本16位的浮点数强行压缩进4位的存储空间。虽然 Blackwell 架构的 Tensor Core 对此做了硬件级加速，但在处理长链条逻辑推理时，量化带来的累积误差会导致 Agent 在多步决策中产生严重的“幻觉漂移”，使模型出现“降智”现象。

更致命的是那六位数美元的起步价。老黄解决的是高净值客户的“隐私焦虑”，却给整个行业制造了巨大的“集成焦虑”。买了一台价值连城的铁壳子回去，企业还得自己养一帮工程师做模型调优和工作流适配，这足以把90%的中小企业挡在门外。

之所以无法开箱即用，是因为 NemoClaw 并非一个成品应用，而是一套深度绑定 CUDA X-AI 的底层优化栈。企业需要针对自身的私有数据库，手动配置 OpenShell 的内核级沙箱权限，并对 Nemotron 3 Super 模型进行复杂的 RAG（检索增强生成）对齐。

这种从底层驱动到上层逻辑的全链路适配，其工程量不亚于重新开发一套 ERP 系统。

到了这里，英伟达的阳谋昭然若揭：它正在利用企业的安全焦虑，完成一次史无前例的“叙事掠夺”。它把开源社区追求自由去中心化的“龙虾”，硬生生收编成了自家高端显卡的促销利器。

它告诉你软件是免费的（NemoClaw开源），但跑得最稳、最安全的环境，全被死死锁定在CUDA生态和昂贵的DGX硬件上。无论企业最终选择本地买DGX，还是实在买不起转而去云端租用A100，英伟达两头通吃，稳赚不赔。

02

面对这片万亿级别的蓝海，不同阵营开出了截然不同的药方。

但如果从技术角度分析，我们会发现，巨头们给出的“安全方案”，其实都没有真正解决“聪明、安全、便宜”的行业不可能三角，只是把风险转移到了不同的维度。

英伟达的解法，是一种彻头彻尾的“监狱式安全”。

通过DGX Station进行物理断网，外加OpenShell内核级沙箱把Agent卡死在极窄的边界里。数据确实安全了，但这是一种“硬件封建制”。只有买得起十万美元级起步的超算设备的“贵族”，才配拥有百分百数据主权。

然而，这种“物理隔离”在生产力层面却是一场灾难。为了在本地塞进万亿参数，老黄动用了极端的 NVFP4 蒸馏技术，这导致 Agent 的“思维深度”被严重阉割。在面对复杂的财务对赌协议时，它会因为无法处理高维度的语义关联而给出模棱两可的废话。你以为买回了一台全能的数字大脑，实际上却是在用一台价值百万的“超级计算器”跑着一个智力打折的残血模型。

面壁智能（EdgeClaw）代表了中国大模型公司试图突围的中间路线，可称为“安检式安全”。

面壁没有去硬刚英伟达的硬件霸权，而是极具巧思地在执行链路中加入了一层“隐私路由中间件”。这就像是在企业数据的高速公路上设了一个智能收费站：S1级别普通信息直接上云，S2级别敏感字段自动脱敏后再传，S3级别极密数据强行留在本地，由端侧的小模型（如MiniCPM）闭门处理。为了配合这套系统，他们还搞出了极为复杂的“双轨记忆”——云端存脱敏版，本地存完整版。

这套方案看似高级且充满了务实的工程化智慧，实则仍然潜藏隐忧，这种将安全防线“前移”的动态判断最怕的就是“误判率”。

这就像分体式水冷机箱发生漏液事故，S1/S2/S3分级判断机制就如同这精密的水冷循环系统，平时运转平稳，但当面对从未见过的陌生数据格式或边界模糊的混合型信息时——本该本地处理的S3级核心数据，就有可能被错误地路由到S2甚至S1通道，脱敏程序来不及拦截就直接上传云端。

同时，“双轨记忆”在长期运行中的一致性维护，也有可能会发生云端与本地的记忆序列发生错位，智能体在遇到真正复杂的跨维度推理任务，端侧那点可怜的算力只能做个预审，实质性的重活依然要回传云端。

面壁相当于将痛点转移给了运维复杂度和系统脆弱性。

至于钉钉的悟空Agent走的是另一条路线，即“安全云端化”，将一切工作流CLI化（命令行化）。企业不需要购买昂贵的本地算力，数据可托管在钉钉云端，以阿里云沉淀了十几年的企业级合规体系背书。

这种路线是钉钉把安全管起来，由它来应对风险，对于千万中小企业而言，阿里总比它们的技术要强得多，分摊下来的安全成本开支也要低得多。

03

那么，这场安全围栏之战究竟谁能笑到最后？

答案或许比想象中更割裂，它可能会呈现出一条“双轨制”未来。

“工作流云端化”策略有其广大受众，那就是中小企业。

中国拥有5300万家中小企业，贡献了国家60%以上的GDP。对这片广袤而下沉的市场而言，它们所谓的核心工作流，根本不是什么高大上的新药分子模拟或高频量化交易，而是请假审批、报销贴票、考勤排班以及无穷无尽的日报汇总。

对于这些早已习惯在钉钉里摸爬滚打的企业，它们自身是缺乏部署能力和网络安全防护能力的，这本来也不是它们的能力所在，按照社会分工原理，专业事情交给更专业人士来做，也能实现资源最优配置。

钉钉极其精准地察觉了这个市场需求，没有像老黄那样要求企业砸下巨资进行“换代革命”，而是与客户们实现了生态共生关系，一旦引爆，Token的消耗量将呈现真正的指数级井喷。

而老黄的“硬件深井”也有其拥趸，那就是精英企业。

当AI的触角真正进入核心生产力阶层——去操控精密制造业的产线调度，去主导金融机构毫秒级的交易决策，去分析顶尖医院的基因序列时，这些毛利率极高、对试错零容忍的精英企业，哪怕花费百万美元购买DGX Station，也只会觉得这是一笔划算的“保险”。

如果英伟达凭借其算力霸权，成功游说欧美监管机构，将“硬件级物理隔离”直接写进行业合规手册，甚至成为新一代等保标准的基操，那么，它就将DGX Station变成了一门垄断生意。

在欧美这种“门阀垄断”的经济体里，已经是惯用手法，不然，硅谷科技圈为什么那么热衷于闭源与标准制定，这本质上就是排除潜在竞争者进入，老黄不过是投其所好，精准拿捏了部分人的心思。

但是，高昂的成本本身就意味着那只能是少数人的玩物，一旦筑起成本高昂的合规成本，那就更是绝了中小企业的发展之路，最终的成本还是得消费者买单。

以中国的国情乃至广大发展中国家，可能更适合的还是“分级路由”以及“云端托管”，这既是“蚂蚁雄兵”，也是广阔天地更有可为。

01

02

03

相关新闻