不用Mac Mini,他在25美元的安卓机上跑起了OpenClaw:开灯、拍照,全都能干
来源:36kr 2 小时前

25 美元(约合人民币 173 元),你会拿来做什么?

买一顿外卖、充一次话费,或者随手下单一个蓝牙耳机?但在美国一位喜欢折腾 AI 的开发者(本文称他为 Ethan)看来,这 25 美元,足够搭出一个“物理世界可操作的智能体”。

他做了一件听起来有点离谱的事:在一台沃尔玛售价 25-30 美元的预付费安卓手机上,跑起了最近很火的 OpenClaw,让它通过 Discord 接收指令,然后直接控制手机硬件——开手电筒、拍照识别、读取传感器,甚至尝试打电话。

更有意思的是,他还不满足于一台,而是打算搞一整排手机,做成一个Agent“手机集群”。

从聊天机器人到“能动手”的 Agent

Ethan 的方案其实并不复杂,核心结构是:

● 在安卓手机上安装 Termux(一个安卓上的类 Linux 终端环境)

● 在 Termux 中运行 OpenClaw Agent

● 通过 Termux API 调用安卓系统能力

● 通过 Discord 与 Agent 对话

换句话说,这台 25 美元的手机,变成了一个随时在线的“硬件执行节点”。例如,他可以在 Discord 里发出指令:“Hey Claw,帮我把手电筒打开再关掉。”几秒钟后,手机手电筒亮起,又熄灭。

这背后的流程并不神秘:OpenClaw 接收 Discord 消息,调用 Termux API,再由 API 调用安卓系统接口完成硬件操作——原本只有 App 或系统进程才能做的事情,现在交给了一个语言模型驱动的 Agent。

在 Ethan 看来,真正有趣的并不是“能开手电筒”,而是“模型开始拥有物理执行能力”。

拍照+GPT 5.2:一台入门机的视觉能力

为了验证这不是“玩具级 Demo”,他又做了一个更具象的测试。

他对 Agent 说:“用后置摄像头拍一张照片,然后告诉我你看到了什么。”接着,他把手机对准桌上的一块 Raspberry Pi。手机拍照成功,画面通过 Discord 回传。随后图片被送入当前配置的模型,也就是通过GPT 5.2进行视觉分析。

对此,模型返回的描述是:“一块单板计算机,Raspberry Pi,以及连接的 USB 线缆。”

这个任务实现了:低端安卓机负责采集图像,云端大模型负责视觉理解,Discord 负责交互,Agent 负责流程编排——一个完整的“感知—理解—反馈”闭环,就这样在 25 美元的硬件上跑通了。

不仅能感受手机姿态,还可以打电话

不仅如此,Ethan 还测试了传感器能力。他问:“现在手机的姿态是什么?”

Agent 调用加速度计数据,分析重力方向,最终回复:手机大致处于竖直直立状态——那一刻,手机确实是被他竖着拿在手里的。

这说明,Agent 不再只是“文本理解系统”,而是能够读取真实物理状态的系统节点。例如 IMU、摄像头、闪光灯,这些原本服务于 App 的硬件,现在都成了 AI 的工具箱。

或许有人要问了,既然能调摄像头、能读传感器,那能不能打电话?

理论上是可以的。Ethan 让 Agent 去联系人列表里查找“Mike”并拨号,手机确实调起了拨号界面,并尝试发起通话——不过,毕竟这是一台没有实际绑定号码的预付费手机,通话自然失败。

说到这里,Ethan 还补充了一点:“如果想让 OpenClaw 监听麦克风音频或发送语音,手机需要 Root 权限。但我这台没 Root,所以做不到,因为安卓对通话、音频这类权限做了非常严格的沙箱隔离。”

未来畅想:搭建一个“手机集群”

事实上,当下有不少开发者都选择用 Mac Mini 或小型服务器跑 Agent 集群,优势在于硬件性能强、部署稳定、环境可控。相较之下,Ethan 选择用低价手机跑 OpenClaw 的决定不免令人意外。

经过了以上演示,Ethan 表示这台 25 美元的廉价手机虽然配置有限,但作为 OpenClaw 的入门级运行设备,已经足够优秀:“对于很多想尝试 OpenClaw 但不想花费太多钱购置硬件的开发者来说,这类廉价预付费手机是一个绝佳的选择,它能让你快速上手,体验 AI 智能体操控硬件的乐趣。”

不过他也客观承认,若预算充足,还是更推荐用树莓派运行 OpenClaw:

“树莓派搭载的是原生 Linux 系统,不需要像安卓手机这样,为了绕过系统限制去折腾 OpenClaw 的配置,使用起来更便捷,也能避免很多兼容性问题。”

至于未来规划,Ethan 透露下一步他想搭建一个“手机集群”:“现在很多人会购置多台 Mac mini 搭建 OpenClaw 集群,我也想尝试用几台这种廉价安卓手机,组成一个手机集群,每台手机都跑上 OpenClaw 智能体,然后通过 Discord 同时与所有智能体交互,看看能实现哪些更有趣的功能。”

社区质疑:手机集群,真有用吗?

Ethan的视频发出后,评论区的声音颇为分裂。

有人直言:“很酷,但我想不到集群控制手机有什么实际用途。”也有人开始脑洞大开:

● 可以做成一个极低成本的安防系统:当检测到画面移动时,自动录制 15 秒视频并通过短信或邮件发送给主人——理论上,这套逻辑确实可行。手机自带摄像头、网络、传感器,只要 Agent 能够串联触发条件与发送逻辑,它就可以变成一个分布式监控节点。

● 也有评论开玩笑提到,可以给所有手机插上 SIM 卡,它们就成了一个“社交媒体点赞农场”。

在众多评论中,还有一个更现实的声音。

过去很多人想做类似实验,却被模型成本卡住。调用顶级模型 API 需要订阅费用;而本地可运行的开源模型,往往动辄 40GB 内存起步。对于只有 10~20GB 可用内存的普通开发者来说,几乎不可能流畅运行。

而如今,通过云端 API + 低端硬件采集的组合,反而成了一种折中方案:重计算交给云端,大模型只负责理解,手机只负责感知和执行——这让更多“穷折腾”的开发者也有机会参与进来。

那么,你对于 Ethan 的这项实验又有何看法呢,欢迎在评论区留言。

参考链接:https://www.reddit.com/r/AgentsOfAI/comments/1qybhk2/this_guy_installed_openclaw_on_a_25_phone_and/

简体中文 English