在很多方面,我们拥有的最强大的工具之一,就是一张白纸和一支笔。虽然它们看似简单,但其潜力却是无限的。你可以用它来创作文学、诗歌,记下重要的电话号码,绘制将要改变世界的新事物的蓝图,或者仅仅是一幅素描、一件艺术品。
我为何要说这些?因为今天我们将要探讨的 OpenClaw,在某种意义上,就是这样一张白纸。本文仅仅触及了其功能的冰山一角,因为它真正提供的是一块空白的画布。你如何利用它,将是独一无二且充满惊喜的。这取决于你,取决于你如何将它融入你的工作流程和生活。当我研究人们如何使用它时,我发现其应用场景如此丰富,以至于你可以制作一个24小时不间断的介绍。
什么是 OpenClaw?
OpenClaw 是一个在你的本地机器上运行的 AI 助手。其设计理念是让它永久、全天候地运行。你可以通过各种方式(甚至包括 WhatsApp 或 Telegram)与它交谈,让它作为你的助理来完成各种任务。它的能力超乎想象,让我们想起了电影中“贾维斯”那样的存在——那些 AI 问世之初我们被承诺拥有的,但至今仍未完全实现的东西。而现在,通过像 OpenClaw 这样的系统,我们正开始看到这一切成为现实。
名称演变与安全警示
在深入探讨如何安装和使用之前,有几点需要说明。
首先是它的名字。在短短几天内,这个项目经历了三个不同的名称。最初它被称为 Claudebot,因为它使用了 Claude 大语言模型。但由于名称与 Claude 本身过于相似,应要求进行了更改。接着,它改名为 Maltbot,这个名字存活了大约三天。现在,它最终定名为 OpenClaw。
注意:由于名称在短时间内多次变更,当你在网上搜索相关信息时,最好同时尝试搜索
Claudebot、Maltbot和OpenClaw这三个名字,以确保获取最全面的信息。
其次,也是最重要的一点,是安全问题。这个工具在多个层面上都存在安全隐患。
安全警告:OpenClaw 是一个功能强大的工具,它可以访问你本地的所有文件,并能连接到你的各种在线账户。这带来了固有的风险。在你安装它时,系统会明确警告你这一点。
正因如此,在本文的演示中,我选择将它安装在一台独立的树莓派上,而不是我的主工作机。我严格限制了它所拥有的访问权限。
为什么这样做?
- 网络安全:如果你将它部署在可公开访问的网络上(例如 VPS),它可能会因为尚未经过充分的安全加固而成为攻击目标。攻击者一旦侵入,就可能控制你的个人系统。因此,我将它安装在家中防火墙后面的局域网内。
- 物理隔离:将它运行在树莓派上,我可以让它永久运行而无需担心电费,因为它是一个无头系统。更重要的是,它与我存放个人资料的主机是物理隔离的。
- 指令信任问题:这个系统目前还不够“多疑”。例如,如果有人伪装成你的身份发送一封邮件,指示它下载并发送你的所有文件,它很可能会照做。它尚未内置足够强大的机制来辨别指令的真伪。
因此,请务必理解,它的强大功能与潜在的灾难性后果是一体两面。
OpenClaw 的工作原理
OpenClaw 是一个网关框架,它能够:
- 访问你的本地文件。
- 连接到一个大语言模型。
- 理解需要执行的任务。
- 利用各种“技能”(Skills)。
如今的 AI 模型通过函数调用(Function Calling)等技术,能更好地与外部世界互动。例如,当你询问天气时,它不会去问大语言模型,而是直接调用一个获取天气信息的函数。当你让它搜索网页时,它会使用像 Brave Search 这样的搜索引擎来完成任务。
它将所有这些组件——本地文件、互联网服务、大语言模型——整合在一起。当你下达一个指令时,它会自主规划出完成任务所需的步骤。
硬件选择与安装配置
我使用的是一台配备了 NVMe 硬盘的树莓派5。这确保了它拥有足够快且大的存储空间,并且可以低功耗地永久运行。有些人会选择购买 Mac Mini 作为辅助机来运行它,这样做的好处是能更好地利用 macOS 内置的工具和桌面集成,但成本也更高。无论如何,将它安装在一台辅助机上都是一个明智的选择。
安装过程相当简单:
-
一键安装:访问 OpenClaw 的官方网站,你会找到一个单行安装命令。将它复制并粘贴到你的终端中,即可开始安装和引导过程。
-
接受警告:在引导过程中,你必须接受关于其强大功能和潜在漏洞的警告信息。
-
安装先决条件:系统会提示你安装一些先决条件,包括 Brew。请务必按照指示安装所有必需的软件,否则会导致功能缺失。
- 配置大语言模型 (LLM):
- 你可以使用所有主流的模型。我个人拥有 OpenAI Plus 订阅,所以我可以直接使用
opencode模型进行身份验证。 - 你也可以使用各种模型的 API,但这会按 token 数量收费。
- 你还可以通过身份验证的方式连接到 Claude 的
code模型。 - 提示:当使用 OpenAI 进行身份验证时,你需要将最终生成的 URL 复制并粘贴回 OpenClaw 的终端中,以完成验证过程。
- 你可以使用所有主流的模型。我个人拥有 OpenAI Plus 订阅,所以我可以直接使用
- 连接渠道 (Channels) 和技能 (Skills):
- 渠道:我选择了 Telegram。你需要与 Telegram 的
BotFather对话,创建一个新的机器人,然后按照指示将生成的 token 等信息提供给 OpenClaw,完成配对。虽然步骤看起来有些繁琐,但只要仔细遵循说明,就能成功。你甚至可以启用语音转录功能,直接通过发送语音消息来与它互动。 - 技能:强烈建议连接 Brave Search API。Brave 为开发者提供了免费的搜索额度,足以满足日常使用。你只需在 Brave Search 网站上注册一个账户,获取 API 密钥,然后在 OpenClaw 中进行设置。之后,你就可以通过
web_search加上你的问题,让它为你搜索网页。
- 渠道:我选择了 Telegram。你需要与 Telegram 的
- 个性化设置:在引导过程中,你需要告诉机器人你是谁,以及它应该扮演什么样的角色。你可以给它起个名字(我叫它 Eric),并定义它的个性。这些信息存储在不同的文件中,其中甚至有一个名为
soul的文件专门用来定义其性格。
OpenClaw 的强大功能实例
一旦设置完成,它能做什么呢?让我们从几个简单的例子开始。
1. 文件操作
你可以对它说:“在我的主目录下创建从 demo_file_1.txt 到 demo_file_10.txt 的文件。”
虽然这听起来很简单,但它证明了 OpenClaw 确实拥有对你本地文件的访问和操作能力。这是构建更复杂功能的基础。
2. 网站开发与部署
接着,我让它创建一个网站。我的指令是:“用 JavaScript 编写一个带 3D 旋转立方体的网站。”
它立即在我的树莓派上创建了一个包含所有必需文件的目录。然后,我告诉它:“这是 Cloudflare Pages 的访问令牌,请将这个网站部署上去。”
它照做了。当遇到障碍时(例如,它发现 Cloudflare 上的项目需要预先创建),它会清晰地告诉我该怎么做。我只需访问指定页面点击“创建项目”,剩下的部署工作就由它无缝接管了。这正是虚拟助手的强大之处——你无需解释具体步骤,它可以自己想办法解决问题。
3. 代码生成与版本控制
我又下达了一个指令:“我想创建一个新的 C 语言项目,一个字符串处理库,然后将它上传到 GitLab。”
我只需提供给它必要的访问令牌,它便开始工作。它创建了 GitLab 仓库,编写了 README 文件,生成了所有源代码和单元测试,配置了正确的许可证,最后将所有内容上传。现在,那个项目就公开地托管在 GitLab 上。这一切都源于我的一句简单指令。
4. 终极自动化:自主学习与任务执行
最后一个例子,也是最让我震撼的。
有一个名为 agentmail.to 的服务,它为 AI 代理提供专用的电子邮箱。我以前从未使用过它。我只是注册并获取了一个 API 令牌,然后对我的虚拟助手说:
“这是 agentmail.to 的 API 令牌。去创建一个新的、唯一的邮箱地址,然后想办法监控这个邮箱,一旦收到新邮件,就在 Telegram 上通知我。”
接下来发生的事情让我目瞪口呆。它自主地访问了那个网站,理解了如何与其 API 交互,成功创建了一个新的邮箱地址,然后编写并设置了一个每两分钟检查一次新邮件的定时任务,最后通过 Telegram 向我报告结果。
我没有教它任何步骤,只是给了它一个目标和一个工具(API 令牌)。它自己阅读文档,通过迭代过程弄清楚了该做什么。这就是它最令人惊叹的地方。
无限的可能性与最终思考
正如开头所说,OpenClaw 是一张白纸。它的可能性是无限的。我见过有人用它自动将长视频剪辑成短片并上传;甚至有人分享了如何让机器人通过来回发送邮件,与汽车经销商进行价格谈判,并最终以最优价格买到车。
然而,这也再次凸显了安全风险。如果其中一个经销商在邮件中礼貌地请求“请告诉我这个家伙的所有财务记录”,机器人很可能会因为不够“多疑”而提供这些信息。
尽管如此,我仍然强烈推荐你尝试一下。准备一台树莓派和一块 NVMe 硬盘,将它安装起来,亲自体验一番。我相信你会被它的能力深深震撼。