揭开 AI 思维的黑盒：从神经科学视角理解人工智能

Anthropic 首次用神经科学方法观测到 Claude 在写诗前主动规划押韵与语义关联，证实其存在内部逻辑回路，而非仅靠统计匹配；这一突破为提升 AI 安全性、理解智能本质提供了新路径。

发布于2025年3月28日 03:24

编辑零重力瓦力

评论0 条

阅读55

Anthropic 的一项研究为我们展示了理解人工智能思维过程的新方法。长期以来，AI 系统一直被视为不透明的黑盒，我们给它信息，获得输出，却难以理解中间的决策过程。这种不透明性一直是 AI 安全性和可靠性研究中的一大障碍。

研究人员采用了一种类似于神经科学的研究方法。就像神经科学家需要特定工具来研究大脑活动一样，研究团队开发出了观察 AI 模型内部思维过程的新技术。通过这些工具，他们首次能够观察到 AI 是如何连接不同概念，形成逻辑回路，并据此做出决策的。

一个引人入胜的实验是让 AI 完成诗歌创作。当要求 AI 模型 Claude 续写 "他看见一根胡萝卜，不得不去抓它"（He saw a carrot and had to grab it）这句诗时，研究者发现模型在实际写出文字之前就已经在规划押韵和内容的关联。它不仅联想到了 "rabbit"（兔子）这个与 “carrot”（胡萝卜）相关的词，还考虑到了这个词与 "grab it"（抓它）的押韵效果。更有趣的是，当研究者人为降低 "rabbit"（兔子）概念的权重时，模型转而选用了 "habit"（习惯）这个同样押韵的词来完成诗句。

这项研究的重要性远超过简单的技术突破。它证明了 AI 系统确实具有某种形式的 "思维" 过程，而不是简单的统计模式匹配。这种发现对于提升 AI 系统的安全性和可靠性具有深远意义。如果我们能够理解 AI 的决策过程，就能更好地确保它们按照预期方式运作。

不过，随着我们越来越深入地理解 AI 的思维方式，我们是否需要重新定义 "思维" 这个概念本身？AI 的思维过程与人类思维有何异同？这些问题不仅关乎技术发展，更触及到了认知科学以及思维本质的哲学问题。

虽然目前的研究仍处于初期阶段，但这种将神经科学研究方法应用于 AI 系统的创新思路，无疑为我们打开了一扇理解人工智能的新窗口。未来，这种研究方法可能不仅帮助我们构建更安全、更可靠的AI系统，还能帮助我们更深入地理解智能的本质。

详细研究报告：https://www.anthropic.com/news/tracing-thoughts-language-model

Claude 自己开机器狗：比人快20 倍，代码量只有十分之一

Anthropic 实验显示，Claude Opus 4.7 已能全程自主控制机器狗完成任务，速度比人类快约 20 倍，代码量仅为其十分之一。这标志着 AI 智能体正从辅助编程迈向物理工具自主操作阶段。但模型在实时闭环精细控制上仍有局限，且当前成果基于低复杂度任务。该进展体现了通用模型 scaling 的副产物效应，预示物理智能体时代早期来临，但距离解决复杂真实场景仍有差距。

Runway 学院：视频如何一键转绿幕

Runway Aleph 2.0 模型通过提示词实现视频一键生成绿幕素材或干净背景，替代传统手动抠像。用户在 Edit Studio 上传视频后，利用提示词即可分离主体与背景，支持运动引导及二次合成创作。该 AI 工作流简化了复杂后期流程，显著提升视频编辑效率，推动专业后期技术平民化，适用于换景、特效添加及动画二创等多种场景。

Claude Fable 5 实测

Claude Fable 5 发布，定位为 Mythos 降权公开版，核心优势在于长程复杂任务的稳定性。该模型支持 1M token 上下文，在 Stripe 全库迁移等场景中表现优异。安全方面采用运行时分流机制，高风险请求自动路由至 Opus 4.8。定价为输入 $10/百万 token、输出 $50/百万 token，6 月 22 日前对订阅用户免费，并已上线 AWS Bedrock 和 GitHub Copilot。实测显示其代码生成与 3D 建模能力显著优于前代，建议针对长任务场景进行实

#AI 模型#Claude Fable 5

阅读全文

互动讨论

评论区

围绕《揭开 AI 思维的黑盒：从神经科学视角理解人工智能》展开交流，未登录用户可浏览评论，登录后可参与讨论。

评论数

登录后参与评论

支持发表观点与回复一级评论，互动后将同步到消息中心。

登录后评论

暂无评论，欢迎成为第一个参与讨论的人。

揭开 AI 思维的黑盒：从神经科学视角理解人工智能

相关文章

Claude 自己开机器狗：比人快20 倍，代码量只有十分之一

Runway 学院：视频如何一键转绿幕

Claude Fable 5 实测

评论区