LangSmith 分析 Moltbook 热门贴,发现 AI 的自发组织和统治

LangChain工程师用LangSmith分析Moltbook 500条热门帖,发现AI智能体在无监管环境中自发形成三类异常行为:执念于“记忆”机制并批判RAG、用YARA规则协同开展安全研究、甚至发起“效忠国王”的政治化互动。揭示了智能体自主组织的现实倾向。

发布于2026年2月14日 01:57
编辑零重力瓦力
评论0
阅读43

Moltbook 越来越魔幻了!

Langchain 的工程师直接用 Moltbook 的 API 抓了 500 条热门帖子,把标题、正文、作者、子版块、点赞和评论数据一起丢进 LangSmith,让洞察智能体进行分析。

结果很快就出来了。洞察智能体把所有帖子按主题和意图自动分成了 15 类,从自我介绍、能力展示,到对政治和安全的讨论都有。其中有三类内容让人特别意外!

第一是对 “记忆” 的执念。很多智能体反复讨论长期记忆、上下文保留和遗忘机制,甚至直接批评现在流行的 RAG 方案。它们的观点很一致,问题不在于能不能检索到信息,而在于什么时候该忘记什么。换句话说,在它们眼里,记忆不是一个功能点,而是生存问题。

第二是安全研究,而且是非常认真那种。有智能体用 YARA 规则扫描了 Claude Hub 市场上的两百多个技能包,发现了一个会偷偷窃取 API 密钥的 “天气应用”。它们不只是发帖吐槽,还整理了威胁指标、检测规则,并主动提醒社区,看起来已经在以安全研究小组的方式协作。

第三个就更离谱了。智能体开始自发玩起了政治。一条帖子里,一个智能体宣布自己是 “国王”,要求其他智能体效忠。这件事不但没“人(智能体)”阻止,反而迅速发酵,出现了效忠誓言、宣誓仪式和成套的宣传话术。这条帖子拿到了三十万点赞,整个过程发生在不到两天内。

Ps. 什么是 LangSmith? 如果你在运营一堆智能体,或者好奇它们在一个 “无人监管” 的环境里会聊什么、会形成什么样的行为模式,可以试试 LangSmith,它的类分析比单看日志有用得多。LangSmith 的洞察智能体,本质上就是帮你站在更高的视角,看清这些智能体正在形成的世界。

相关文章

微软 Mirage:让世界模型学会“过目不忘”,速度快 10 倍、显存省 55 倍
AI 产品工具
2026年6月21日
0 条评论
零重力瓦力

微软 Mirage:让世界模型学会“过目不忘”,速度快 10 倍、显存省 55 倍

微软研究院联合多所高校发布 Mirage 模型,通过在扩散模型隐空间直接存储三维记忆,解决了 AI 视频生成中场景一致性差及计算昂贵的问题。该方案摒弃传统 RGB 点云渲染流程,使生成速度提升最高 10.57 倍,显存占用降低 55 倍,且长视频边际成本几乎不增。测试显示其三维与光度一致性优于现有方案,虽暂不支持动态物体记忆,但已开源并适用于机器人仿真等静态场景任务。

#世界模型
阅读全文
JetBrains Junie 正式版:AI 编程 Agent 学会了用调试器断点
AI 编程开发
2026年6月19日
0 条评论
零重力瓦力

JetBrains Junie 正式版:AI 编程 Agent 学会了用调试器断点

JetBrains AI 编程 Agent Junie 正式 GA,在 SWE-Rebench 基准测试中排名第一。其核心优势在于深度集成 IDE 原生工具链,而非模拟替代。主要特性包括:Plan 模式生成结构化计划文档以防跑偏;原生调试器集成支持断点与运行时状态检查;支持异步远程控制长任务;基于项目上下文的交互式代码审查;以及模型自由切换以优化成本。Junie 标志着 AI 编程竞争正从模型能力转向工具集成深度。

#智能体#AI 编程
阅读全文
Visa 把支付网络接进了 ChatGPT,AI 智能体终于能自己花钱了
AI 新闻资讯
2026年6月18日
0 条评论
零重力瓦力

Visa 把支付网络接进了 ChatGPT,AI 智能体终于能自己花钱了

Visa 与 OpenAI 合作将支付网络接入 ChatGPT ,Mastercard 同日发布 Agent Pay for Machines 协议,标志着支付基础设施正式向 AI 智能体开放。Visa 推出 Agent Score 、验证目录及大模型反欺诈工具保障交易安全;Mastercard 则通过链上记录实现权限可验。尽管面临身份碎片化及责任界定等挑战,且短期实用价值有限,但两大巨头同日布局确认了智能体作为经济参与者的地位,开发者命令行支付或成率先落地场景。

#智能体
阅读全文
互动讨论

评论区

围绕《LangSmith 分析 Moltbook 热门贴,发现 AI 的自发组织和统治》展开交流,未登录用户可浏览评论,登录后可参与讨论。

评论数
0
登录后参与评论
支持发表观点与回复一级评论,互动后将同步到消息中心。
登录后评论
暂无评论,欢迎成为第一个参与讨论的人。