#RAG
AI 不够聪明?也许只是没有给对上下文!
AI 输出质量差往往不是因为模型不行,而是缺乏有效的上下文。近期备受关注的 “上下文工程” 正是解决这一瓶颈。通过数据打通、知识层构建、精准检索和运行时治理,让 AI 获取与任务真正相关的信息。在检索环节,相比基础 RAG,智能体式 RAG 能迭代获取数据,GraphRAG 靠实体关系导航提升精度,上下文压缩则过滤噪音最大化信号。当模型能力边际放缓,上下文工程的质量将成为拉开 AI 应用差距的关键。
Gemini File Search 支持图片了:多模态 RAG 从此不只是文本检索
5 月 5 日,Google Gemini API 的 File Search 新增多模态检索、元数据过滤及页码引用功能。核心在于引入原生多模态嵌入模型,支持直接对图片、图表进行语义搜索,无需依赖 OCR。该托管服务大幅降低自建 RAG 系统的开发门槛,适合需处理大量视觉资料的企业或开发者。不过需注意其暂不支持音视频格式,且一旦选定嵌入模型无法无缝升级。
OWASP 公布的 LLM 十大安全风险榜单
OWASP最新LLM十大安全风险榜单指出:提示词注入、敏感信息泄露、供应链污染、数据/模型投毒、输出滥用、权限失控等是当前最突出威胁。这些风险并非理论问题,已在真实AI应用中频繁出现。应对需回归系统安全思维,通过AI网关、数据验证、权限隔离与持续测试构建防御体系。
5 分钟彻底厘清大语言模型中的权重、上下文和记忆的区别
权重是模型训练固定的底层能力;上下文是单次对话中实时可见的临时信息;记忆则是外部构建、需主动检索调用的长期知识。三者分别对应“会什么”“此刻想什么”“能记住什么”,厘清差异对优化AI系统设计与使用效果至关重要。
LangSmith 分析 Moltbook 热门贴,发现 AI 的自发组织和统治
LangChain工程师用LangSmith分析Moltbook 500条热门帖,发现AI智能体在无监管环境中自发形成三类异常行为:执念于“记忆”机制并批判RAG、用YARA规则协同开展安全研究、甚至发起“效忠国王”的政治化互动。揭示了智能体自主组织的现实倾向。
16 种检索增强生成(RAG)类型
本文系统梳理16种RAG变体,从标准、智能体式到图谱、多模态、联邦、流式等,覆盖关键特性、适用场景与主流工具,为不同业务需求下的检索增强生成方案选型提供清晰参考。
AI 解决方案:开源 vs 闭源,如何选择?
AI解决方案涵盖模型、数据、编排与应用四层,每层均有开源与闭源选项:开源灵活可控但需自研运维,闭源开箱即用却受限于厂商。实际选型不必非此即彼,可按需混搭——如开源模型+闭源编排,兼顾性能、安全与效率。
Captain:突破 RAG 局限的新一代知识检索引擎
Captain 是一款由 YC 投资的新一代知识检索引擎,基准测试准确率达 95%,显著超越传统 RAG 的 78%;采用创新的无限上下文窗口架构,支持多模态数据与海量非结构化知识的高精度、低延迟检索,无需复杂调优即可无缝接入企业数据源。
Google 在 Gemini API 中引入文件搜索工具
Google 在 Gemini API 中上线全托管文件搜索工具,支持 PDF、DOCX、TXT、JSON 及多种代码文件,自动完成分块、嵌入、语义检索与引用生成;首次索引按每百万 token 0.15 美元计费,存储与查询免费,大幅降低 RAG 应用开发门槛。