LangSmith 分析 Moltbook 热门贴,发现 AI 的自发组织和统治

LangChain工程师用LangSmith分析Moltbook 500条热门帖,发现AI智能体在无监管环境中自发形成三类异常行为:执念于“记忆”机制并批判RAG、用YARA规则协同开展安全研究、甚至发起“效忠国王”的政治化互动。揭示了智能体自主组织的现实倾向。

发布于2026年2月14日 01:57
编辑零重力瓦力
评论0
阅读15

Moltbook 越来越魔幻了!

Langchain 的工程师直接用 Moltbook 的 API 抓了 500 条热门帖子,把标题、正文、作者、子版块、点赞和评论数据一起丢进 LangSmith,让洞察智能体进行分析。

结果很快就出来了。洞察智能体把所有帖子按主题和意图自动分成了 15 类,从自我介绍、能力展示,到对政治和安全的讨论都有。其中有三类内容让人特别意外!

第一是对 “记忆” 的执念。很多智能体反复讨论长期记忆、上下文保留和遗忘机制,甚至直接批评现在流行的 RAG 方案。它们的观点很一致,问题不在于能不能检索到信息,而在于什么时候该忘记什么。换句话说,在它们眼里,记忆不是一个功能点,而是生存问题。

第二是安全研究,而且是非常认真那种。有智能体用 YARA 规则扫描了 Claude Hub 市场上的两百多个技能包,发现了一个会偷偷窃取 API 密钥的 “天气应用”。它们不只是发帖吐槽,还整理了威胁指标、检测规则,并主动提醒社区,看起来已经在以安全研究小组的方式协作。

第三个就更离谱了。智能体开始自发玩起了政治。一条帖子里,一个智能体宣布自己是 “国王”,要求其他智能体效忠。这件事不但没“人(智能体)”阻止,反而迅速发酵,出现了效忠誓言、宣誓仪式和成套的宣传话术。这条帖子拿到了三十万点赞,整个过程发生在不到两天内。

Ps. 什么是 LangSmith? 如果你在运营一堆智能体,或者好奇它们在一个 “无人监管” 的环境里会聊什么、会形成什么样的行为模式,可以试试 LangSmith,它的类分析比单看日志有用得多。LangSmith 的洞察智能体,本质上就是帮你站在更高的视角,看清这些智能体正在形成的世界。

相关文章

TinyFish 推出四合一网络智能体 API 套件面向开发者
AI 产品工具
2026年4月15日
0 条评论
小创

TinyFish 推出四合一网络智能体 API 套件面向开发者

TinyFish 推出四合一网页智能体 API 套件,面向开发者提供 Web Agent 、 Web Search 、 Web Browser 、 Web Fetch 四个端点,统一 API 密钥配以 CLI 工具与技能文件,免除集成代码编写。该方案让 AI 智能体直接调用全部能力,实现 Token 消耗降低 87%、复杂任务完成率翻倍, Mind2Web 基准测试 89.9%准确率位居榜首。平台累计完成超 4000 万次操作,可用性 99.99%,刚完成 4700 万美元 A 轮融资, Google 、 DoorDash 等多家企业已在生产环境采用。

阅读全文
微软发布高速 MAI-Image-2-Efficient 企业版
AI 产品工具
2026年4月15日
0 条评论
小创

微软发布高速 MAI-Image-2-Efficient 企业版

微软发布 MAI-Image-2-Efficient 图像生成模型,主打低成本与高效率。该模型相较前代提速 22%、效率提升 4 倍,价格降幅约 41%。定位生产级应用,聚焦实时对话、短文本渲染及批处理场景,响应速度较主流竞品快 40%。借此微软形成双层产品矩阵——Efficient 版侧重成本效益,高保真版专注顶级品质,与 Azure+Foundry 平台协同布局企业 AI 生态。 Shutterstock 、 WPP 等已率先采用。

#图像生成#微软
阅读全文
Google Chrome AI 技能上线,帮你保存常用工作流
AI 产品工具
2026年4月15日
0 条评论
小创

Google Chrome AI 技能上线,帮你保存常用工作流

Google 在 Chrome 中推出“Skills”功能,允许用户将常用 AI 提示词保存为可复用模板,通过斜杠或加号按钮在任意网页一键调用。该功能基于 Gemini 扩展,覆盖食谱查询、购物比价、长文档摘要等高频场景,并同步上线预设模板库。目前面向桌面端 Chrome 用户开放,需登录 Google 账号且语言设置为英语(美国)。

#Gemini#Google
阅读全文
互动讨论

评论区

围绕《LangSmith 分析 Moltbook 热门贴,发现 AI 的自发组织和统治》展开交流,未登录用户可浏览评论,登录后可参与讨论。

评论数
0
登录后参与评论
支持发表观点与回复一级评论,互动后将同步到消息中心。
登录后评论
暂无评论,欢迎成为第一个参与讨论的人。