IBM 的技术专家开始科普 OpenClaw 了,让我们对这款智能体框架有更深入地了解。
OpenClaw 跑在本地的 Node.js 服务上,支持笔记本、虚拟机、甚至树莓派。架构是一个中心辐射型的设计,核心是一个叫 Gateway 的控制平面,负责消息路由和会话管理。可以通过 Slack、Discord、iMessage 甚至 WhatsApp 跟它对话,不同平台的消息通过适配器统一转换成内部格式再交给 Gateway 处理。
比较特别的是它处理“技能”的方式。技能本质上就是 Markdown 文件,里面写着教智能体完成特定任务的指令,比如操作 Trello 看板、管理 Google Calendar、用 Docker 构建镜像,甚至连接 CRM 系统。但 OpenClaw 不会一股脑把所有技能塞进上下文窗口,而是只注入技能列表和简要元数据,让 LLM 自己判断当前任务需要哪个技能,再按需读取完整内容。这个设计很关键,不然上下文窗口会很快被撑爆。
目前 OpenClaw 最大的问题是安全性。在本地运行意味着它能访问你的文件系统和终端,配置不当就等于给机器开了个后门。目前互联网上已经有数千个暴露的 OpenClaw 实例,就是因为配置疏忽。另外提示词注入攻击也是个实际威胁,智能体在处理邮件或网页时,数据里可能藏着恶意指令,LLM 分不清就会当成合法命令执行。所以隔离环境运行、审查技能包代码、凭证加密,这些基本功不能省。
如今,智能体框架,让 LLM 的角色从“回答者”变成了“编排者”。它不再只是告诉你答案,而是自己去规划、执行、观察,跑完整个循环再把结果交给你。OpenClaw 只是众多方案之一,LangGraph 之类的框架也在做类似的事,但这套推理加行动的 ReAct 模式是通用的,理解了它就理解了所有智能体框架的底层逻辑。