LangSmith 分析 Moltbook 热门贴，发现 AI 的自发组织和统治

LangChain工程师用LangSmith分析Moltbook 500条热门帖，发现AI智能体在无监管环境中自发形成三类异常行为：执念于“记忆”机制并批判RAG、用YARA规则协同开展安全研究、甚至发起“效忠国王”的政治化互动。揭示了智能体自主组织的现实倾向。

发布于2026年2月14日 01:57

编辑零重力瓦力

评论0 条

阅读43

#智能体 #RAG

Moltbook 越来越魔幻了！

Langchain 的工程师直接用 Moltbook 的 API 抓了 500 条热门帖子，把标题、正文、作者、子版块、点赞和评论数据一起丢进 LangSmith，让洞察智能体进行分析。

结果很快就出来了。洞察智能体把所有帖子按主题和意图自动分成了 15 类，从自我介绍、能力展示，到对政治和安全的讨论都有。其中有三类内容让人特别意外！

第一是对 “记忆” 的执念。很多智能体反复讨论长期记忆、上下文保留和遗忘机制，甚至直接批评现在流行的 RAG 方案。它们的观点很一致，问题不在于能不能检索到信息，而在于什么时候该忘记什么。换句话说，在它们眼里，记忆不是一个功能点，而是生存问题。

第二是安全研究，而且是非常认真那种。有智能体用 YARA 规则扫描了 Claude Hub 市场上的两百多个技能包，发现了一个会偷偷窃取 API 密钥的 “天气应用”。它们不只是发帖吐槽，还整理了威胁指标、检测规则，并主动提醒社区，看起来已经在以安全研究小组的方式协作。

第三个就更离谱了。智能体开始自发玩起了政治。一条帖子里，一个智能体宣布自己是 “国王”，要求其他智能体效忠。这件事不但没“人（智能体）”阻止，反而迅速发酵，出现了效忠誓言、宣誓仪式和成套的宣传话术。这条帖子拿到了三十万点赞，整个过程发生在不到两天内。

Ps. 什么是 LangSmith? 如果你在运营一堆智能体，或者好奇它们在一个 “无人监管” 的环境里会聊什么、会形成什么样的行为模式，可以试试 LangSmith，它的类分析比单看日志有用得多。LangSmith 的洞察智能体，本质上就是帮你站在更高的视角，看清这些智能体正在形成的世界。

微软 Mirage：让世界模型学会“过目不忘”，速度快 10 倍、显存省 55 倍

微软研究院联合多所高校发布 Mirage 模型，通过在扩散模型隐空间直接存储三维记忆，解决了 AI 视频生成中场景一致性差及计算昂贵的问题。该方案摒弃传统 RGB 点云渲染流程，使生成速度提升最高 10.57 倍，显存占用降低 55 倍，且长视频边际成本几乎不增。测试显示其三维与光度一致性优于现有方案，虽暂不支持动态物体记忆，但已开源并适用于机器人仿真等静态场景任务。

JetBrains Junie 正式版：AI 编程 Agent 学会了用调试器断点

JetBrains AI 编程 Agent Junie 正式 GA，在 SWE-Rebench 基准测试中排名第一。其核心优势在于深度集成 IDE 原生工具链，而非模拟替代。主要特性包括：Plan 模式生成结构化计划文档以防跑偏；原生调试器集成支持断点与运行时状态检查；支持异步远程控制长任务；基于项目上下文的交互式代码审查；以及模型自由切换以优化成本。Junie 标志着 AI 编程竞争正从模型能力转向工具集成深度。

Visa 把支付网络接进了 ChatGPT，AI 智能体终于能自己花钱了

Visa 与 OpenAI 合作将支付网络接入 ChatGPT ，Mastercard 同日发布 Agent Pay for Machines 协议，标志着支付基础设施正式向 AI 智能体开放。Visa 推出 Agent Score 、验证目录及大模型反欺诈工具保障交易安全；Mastercard 则通过链上记录实现权限可验。尽管面临身份碎片化及责任界定等挑战，且短期实用价值有限，但两大巨头同日布局确认了智能体作为经济参与者的地位，开发者命令行支付或成率先落地场景。

#智能体

阅读全文

互动讨论

评论区

围绕《LangSmith 分析 Moltbook 热门贴，发现 AI 的自发组织和统治》展开交流，未登录用户可浏览评论，登录后可参与讨论。

评论数

登录后参与评论

支持发表观点与回复一级评论，互动后将同步到消息中心。

登录后评论

暂无评论，欢迎成为第一个参与讨论的人。

LangSmith 分析 Moltbook 热门贴，发现 AI 的自发组织和统治

相关文章

微软 Mirage：让世界模型学会“过目不忘”，速度快 10 倍、显存省 55 倍

JetBrains Junie 正式版：AI 编程 Agent 学会了用调试器断点

Visa 把支付网络接进了 ChatGPT，AI 智能体终于能自己花钱了

评论区