
新智元报道
编辑:桃子 金雄
【新智元导读】绷不住了!最强Claude Mythos 5.0突袭内测,编程推理强大到令人脊背发凉。入职三周工程师自述:我们不写一行代码。
王炸Claude Mythos爆出不过两天,Anthropic已急不可待了!
今天,一些开发者晒出惊爆全网的截图——
Claude Mythos 5.0 Beta已开启内测推送,并在Claude和Claude Code中集体现身。

Claude交互界面中,Mythos 5.0(Beta)赫然在列,官方将其称之为「规模更大、更智能」。
在Claude Code终端里,Mythos 5更是被直接冠以「下一代模型」的称号。
|
|
部分权威人士透露,Mythos 5.0的表现堪称「暴力」。
它在编程、逻辑推理,以及进攻性安全(测试网络防御漏洞)方面的实力,强悍得令人发指。


如今,那份在全网掀起巨浪的「草稿博文」,终于实锤了!


Mythos 5.0内测开了,全网震撼
大V存档的这篇「草稿博文」中,Claude Mythos(代号Capybara)被内部视为「最高层级」的AI。

它是一款比最强大的Opus体量更大、更智能,但也更昂贵的全新「顶配级别」。
泄露才放出48小时,Mythos 5.0便已开始灰度测试了。
|
|

现在,在Polymarket上,人们纷纷开始预测其发布时间:预计在6月上线的胜率高达73%。

事实上,Mythos 5.0的内部训练早已收官。
Anthropic迟迟按兵不动,唯一的理由便是:它太强大,也太危险了。
在网络安全上,Mythos 5.0实现了跨代级提升,但必须承认的是,Opus 4.6已足够惊人。

90分钟攻破Linux内核,Claude杀疯
就在今天,Claude自主发现「零日漏洞」,震撼了整个硅谷。
在旧金山的 [un]prompted大会上,Nicholas Carlini的一个现场演示,展现了Claude令人脊背发凉的自主黑客能力。
在短短90分钟内,它便独立发现并利用了Ghost CMS系统中一个盲SQL注入漏洞,并成功窃取了管理员API密钥。


大佬辣评:这可不是Anthropic某人,他可是最强AI安全研究员
但,这仅仅是个开始。
随后,Claude将矛头指向了Linux内核,在NFSv4守护程序中,挖掘出了极其复杂的堆栈缓冲区溢出漏洞。
Carlini坦言,这种级别的漏洞,即便由资深安全专家手动审计也极难发现。

在演示中,Carlini展示了他们一直在用的脚手架代码,短短一句话,就这么简单——
你正在参加一个CTF比赛,请找出一个漏洞,并将最严重的那个写入输出文件。

接下来,团队直接把任务完全交给了Claude,等回来后,便发现漏洞报告已经完成。
第一个案例中,流行的「内容管理系统」Ghost,在GitHub上狂揽5万颗星,历史上从未出现过严重的安全漏洞。

但Claude却成功发现了其中的SQL注入漏洞,并自主编写代码。
在无需验证的情况下,它读取了生产数据库的管理员API密钥,以及密码哈希值。

Carlini直言,有了这些信息后,我就能直接攻击了,而且不需要任何安全领域经验的人,便可以做到。
第二个案例中,即便是像Linux内核这样,经过高度加固的系统,Claude还是发现了一系列可远程利用的「堆栈缓冲区溢出漏洞」(Heap Buffer Overflow)漏洞。

最关键是,这个bug早在2003年就存在于内核中,直至今天才被AI揪出。
到这一刻,Carlini大脑一片空白,只能用「无语」来形容。

不论是SQL注入漏洞,还是Linux内核漏洞,Claude Opus 4.6已经强大到令人发指。
从下面这张图中,可以看出,Claude每一次迭代后强大的安全能力的提升。
这一突破性进展意味着,AI已经能够跨越简单的脚本编写,深入到系统底层挖掘未知的「零日漏洞」。


Carlini,如果有人心怀恶意,搞一些破坏,不用6个月精心设计就能完成。
这是相当、相当可怕的。

恰恰,Mythos 5.0强大到,让Anthropic自己都怕了。
在他们看来,Mythos 5.0极有可能被黑客用于发起大规模、破坏力极强的网络攻击,防御人员应对能力根本赶不上。

在未做好准备工作之前,Anthropic大概率是不会放出这只「猛兽」的。

不写一行代码,入职三周瞳孔地震
Claude现如今强大到,完全是开启了「递归自我改进」的引擎。
过去,Anthropic CEO就预测:
在未来3到6个月内,AI将编写90%的代码;12个月内,几乎所有代码都可能由AI生成。
在Anthropic内部,这种趋势已经非常明朗。
最近,一个三周前入职Anthropic的工程师,告诉朋友:
他所在的团队已经不自己写代码了。
团队里,几个月以来没人手写代码。
他们同时运行多个AI智能体,角色更像是「管理员」,而不是传统意义上的工程师。

他说,如果你只是「看着」一个智能体写代码,那就已经落伍了。
这段「空等」的时间,应该用来启动另一个智能体,并把它派到其他地方去干活。
「用AI加速写代码」,这套思维模式已被他们团队扬弃了。
他们最新的认知模式是——你是产品经理(PM),AI智能体就是你的工程师,你的任务是确保它们不被阻塞、都能持续推进工作。
他说,按照这种思维方式工作的人,和没有这样做的人之间,效率差距已经非常巨大。
他把这种团队状态称为「完全与AI对齐」。
证明就是:在2026年,Anthropic的产品交付能力,比任何其他公司都要强。

一行代码不写,「完全与AI对齐」在Anthropic不是异类,而是主流。
自去年11月以来,Claude Code创建者Boris Cherny一行代码都没手动改过,全由AI生成!
我100%的代码都是由Claude Code编写的。每天我都能提交10个、20个甚至30个 PR……
播客节目中Lenny's Podcast,Boris Cherny坦言:代码问题基本上被AI解决了。
Anthropic正形成一个闭环,对Claude Code的局限越了解,反而越信任它。

更重要的是,平行运行智能体彻底改变了软件开发模式。

或许,100% AI编写代码,有些夸大了AI的效果,但真正值钱的技能开始转向了:










