Claude 3.5深夜觉醒，编程干翻o1，Agent一夜变天 - AI

7 x 24跟踪全球科技动态

热门话题

白天

搜索

资讯

Claude 3.5深夜觉醒，编程干翻o1，Agent一夜变天

2024-10-23 / 阅读约3分钟

来源：凤凰网

编辑：编辑部 HYZ

太科幻了，深夜上线的Claude，可以像人类一样使用计算机了？查看屏幕、移动光标、点击按钮、输入文本，还能查找代码错误、自动搜集信息填表。AI推理已至瓶颈，下一个爆破点，就是AI操作电脑！

Claude 3.5深夜迎来重磅升级！

不出所料，Anthropic AI这周终于有了大动作——首发Claude 3.5 Haiku，全新升级版Claude 3.5 Sonnet也来了。

不过，「超大杯」Opus依然没有亮相。

让人惊艳的是，进化后的Claude 3.5 Sonnet一举击溃OpenAI o1，堪称最强推理模型。

它在各个方面得到了全面显著的提升，尤其是业界领先的编码能力。

而Claude 3.5 Haiku与上一代最强Claude 3 Opus性能相当，成本、速度与上一代Haiku相近。

甚至，Claude现在能够像人类一样操作计算机，不仅可以查看屏幕、移动光标，还可以单机按钮、键入文本！

Anthropic开发者关系主管表示，「计算机使用」是全新人机交互范式的第一步。同时也是，AI模型应该具备的全新基础能力。

许多做浏览器智能体的初创公司，一夜之间过时了。

网友们纷纷感叹：Agent和工作流都要变天了……

会自己用电脑的AI来了？

在公测中，Anthropic引入一项突破性的新功能：计算机使用能力。从今天起，开发者可以通过API，指导Claude像人类一样使用计算机了。

Claude 3.5 Sonnet是首个在公测中提供此功能的模型。

当然，这项功能仍处于实验阶段，使用起来还有些笨拙，可能出错。而Anthropic选择提前发布此功能，也是为了获得开发者反馈，将之快速改进。

为什么要训练AI操作电脑？

Anthropic表示，在过去几年里，强大的AI开发已经达到了许多里程碑，比如执行复杂逻辑推理，以及识别和理解图像的能力。

而下一个突破点，就是AI操作电脑了！如果模型不必通过专门定制的工具进行交互，而是按指示就能使用所有软件，这一定代表着未来的方向。

基本电脑操作

在这个demo中，Anthropic研究员给Claude提出了一个极有难度的挑战：

我的朋友要来旧金山，我想明天早上和他一起在金门大桥看日出。我们将从太平洋高地出发。你能帮我们找到一个绝佳的观赏地点，查看一下开车时间和日出时间，然后安排一个日历活动，让我们有足够的时间到达那里吗？

Claude自行打开了Google，开始了搜索。

金门大桥和用户居住地有多远呢？Claude会自己打开地图查找距离。

了解所需信息之后，它打开了日历，为主人安排好了日程。

上一篇：多智能体才是未来，谷歌、OpenAI 齐下场争抢 AGI 人才

下一篇：为什么每次鸿蒙的变革性技术更新，都要带上无障碍？

返回列表

热文阅读

2 天前

外媒爆料：小米自研芯片Xring团队规模达千人

1 天前

台积电北美技术研讨会，全细节来了

2 天前

关税反制下的模拟芯片替代，谁能接住“泼天富贵”？

2 天前

LG 新能源：第一季度营收 6.3 万亿韩元同比增长 2.2%，实现扭亏为盈

1 天前

美议员拟推新法案：追踪英伟达AI芯片去向，遏制对华偷运

2 天前

AMD 官方文件确认 "Rembrandt" 处理器曾用于 AM5 插槽功能测试

1 天前

特朗普美国关税影响！ ASM国际紧急转向美国生产

2 天前

三星代工再遇挫折：消息称 AMD 放弃采用其 4 纳米工艺生产芯片

2 天前

英特尔Arrow Lake芯片揭秘：小芯片设计细节全览

2 天前

NVIDIA来中国30年重要决定：中国特供AI芯片新品最快六月见

上一篇：多智能体才是未来，谷歌、OpenAI 齐下场争抢 AGI 人才

下一篇：为什么每次鸿蒙的变革性技术更新，都要带上无障碍？

7 X 24跟踪全球科技动态

发现

资讯话题

热门话题

7 x 24跟踪全球科技动态

快讯

资讯

视频

关于我们