从去年 11 月 Anthropic 宣布开源了 MCP(模型上下文协议)至今 1 年不到。MCP 已经成为各种智能系统开发必不可少的工具。
Anthropic 负责云端合作关系的 Alex 对 MCP 开发团队的工程师进行了一次近距离访谈。从 MCP 开发者的视角,介绍了 MCP 究竟是什么,对于智能体系统开发的作用,以及和传统 API 之间的区别。
MCP(模型上下文协议)是一种标准,主要用来让像 Claude 这样的 LLM,不只是 “看见”你输入的内容,还能接入更多外部数据和工具。比如,平时我们跟聊天机器人对话,它只能记住聊天记录,做一些基础的问答或者写写东西,但有时候你希望它能查查网页、帮你定票、甚至操作家里的智能设备,这些光靠聊天历史肯定不够用。
MCP 的出现就是解决这个问题。它有点像一个通用的 “中转站” 或者 “连接器”,可以把各种各样的数据源、工具、服务都接进来,这样,模型就像插上了一副翅膀,能帮你做更多事。比如现在已经有很多公司做了 MCP 服务器,像 GitHub、家居自动化、网页浏览、甚至抓取互联网文档的服务,都能被统一接进 Claude 这样的 LLM 助手。开发者用 MCP 可以省掉很多重复造轮子的工夫,只用一次配置,所有外部工具都能复用。
MCP 的核心其实很简单,主要就是把各类工具和服务标准化,把如何给模型调用描述清楚。这里头用到的很多还是自然语言,比如你想让机器人生成图片、查某个项目的进展、管理邮件等等,都可以通过 MCP 里定义的接口让模型来操作。MCP 是开源的,各种公司、开发者都能参与,因此生态发展得非常快。
说到和传统 API 的区别,两者很不一样。API 是专门给程序员用的,要写代码、查文档、填参数,用起来比较死板。你要什么功能,就得找对应的接口,参数和返回值都要明确,每次调用都得按规矩来。而 MCP 更像是把外部工具 “介绍” 给聊天机器人,告诉它,这个工具能做什么,怎么用,甚至举点例子。模型自己就能根据你的问题,决定何时、怎么调用这些功能,几乎不用你操心。比如你想查 GitHub 的 PR,API 需要你会写代码、搞清楚接口细节。MCP 只要你说 “查一下我的 PR”,Claude 就能用 MCP 工具自己搞定,甚至还能帮你总结汇报结果。
另外,API 每次请求都是独立的,改点东西就得所有人跟着更新,扩展和维护都比较麻烦。MCP 则灵活很多,只要把工具描述清楚,模型能理解怎么用,你就可以随时加入新的功能。改描述、合并工具,升级都更加顺畅。
现在 MCP 生态发展特别快,各种公司、开发者都在做自己的 MCP 工具。对于开发者来说,省了很多反复造轮子的工作,配置一次,所有支持 MCP 的产品平台都能无缝使用。
评论(0)