创艺提示符

帮你写出更好的提示词

登录注册免费开始

资讯标签

资讯首页/#RAG

#RAG

AI 新闻资讯

2026年5月13日

AI 不够聪明？也许只是没有给对上下文！

AI 输出质量差往往不是因为模型不行，而是缺乏有效的上下文。近期备受关注的 “上下文工程” 正是解决这一瓶颈。通过数据打通、知识层构建、精准检索和运行时治理，让 AI 获取与任务真正相关的信息。在检索环节，相比基础 RAG，智能体式 RAG 能迭代获取数据，GraphRAG 靠实体关系导航提升精度，上下文压缩则过滤噪音最大化信号。当模型能力边际放缓，上下文工程的质量将成为拉开 AI 应用差距的关键。

#RAG#上下文工程#智能体工程

AI 产品工具

2026年5月6日

零重力瓦力

Gemini File Search 支持图片了：多模态 RAG 从此不只是文本检索

5 月 5 日，Google Gemini API 的 File Search 新增多模态检索、元数据过滤及页码引用功能。核心在于引入原生多模态嵌入模型，支持直接对图片、图表进行语义搜索，无需依赖 OCR。该托管服务大幅降低自建 RAG 系统的开发门槛，适合需处理大量视觉资料的企业或开发者。不过需注意其暂不支持音视频格式，且一旦选定嵌入模型无法无缝升级。

#RAG#Gemini#Google

AI 教程知识

2026年3月17日

零重力瓦力

OWASP 公布的 LLM 十大安全风险榜单

OWASP最新LLM十大安全风险榜单指出：提示词注入、敏感信息泄露、供应链污染、数据/模型投毒、输出滥用、权限失控等是当前最突出威胁。这些风险并非理论问题，已在真实AI应用中频繁出现。应对需回归系统安全思维，通过AI网关、数据验证、权限隔离与持续测试构建防御体系。

#提示词工程#RAG#智能体

AI 教程知识

2026年2月14日

零重力瓦力

5 分钟彻底厘清大语言模型中的权重、上下文和记忆的区别

权重是模型训练固定的底层能力；上下文是单次对话中实时可见的临时信息；记忆则是外部构建、需主动检索调用的长期知识。三者分别对应“会什么”“此刻想什么”“能记住什么”，厘清差异对优化AI系统设计与使用效果至关重要。

#上下文工程#RAG#New Machina

AI 产品工具

2026年2月14日

零重力瓦力

LangSmith 分析 Moltbook 热门贴，发现 AI 的自发组织和统治

LangChain工程师用LangSmith分析Moltbook 500条热门帖，发现AI智能体在无监管环境中自发形成三类异常行为：执念于“记忆”机制并批判RAG、用YARA规则协同开展安全研究、甚至发起“效忠国王”的政治化互动。揭示了智能体自主组织的现实倾向。

AI 编程开发

2025年12月7日

零重力瓦力

16 种检索增强生成（RAG）类型

本文系统梳理16种RAG变体，从标准、智能体式到图谱、多模态、联邦、流式等，覆盖关键特性、适用场景与主流工具，为不同业务需求下的检索增强生成方案选型提供清晰参考。

#RAG#智能体#多模态

AI 教程知识

2025年12月1日

零重力瓦力

AI 解决方案：开源 vs 闭源，如何选择？

AI解决方案涵盖模型、数据、编排与应用四层，每层均有开源与闭源选项：开源灵活可控但需自研运维，闭源开箱即用却受限于厂商。实际选型不必非此即彼，可按需混搭——如开源模型+闭源编排，兼顾性能、安全与效率。

#AI 模型#RAG#智能体

AI 产品工具

2025年11月9日

零重力瓦力

Captain：突破 RAG 局限的新一代知识检索引擎

Captain 是一款由 YC 投资的新一代知识检索引擎，基准测试准确率达 95%，显著超越传统 RAG 的 78%；采用创新的无限上下文窗口架构，支持多模态数据与海量非结构化知识的高精度、低延迟检索，无需复杂调优即可无缝接入企业数据源。

#RAG#AI 搜索#多模态

AI 编程开发

2025年11月7日

零重力瓦力

Google 在 Gemini API 中引入文件搜索工具

Google 在 Gemini API 中上线全托管文件搜索工具，支持 PDF、DOCX、TXT、JSON 及多种代码文件，自动完成分块、嵌入、语义检索与引用生成；首次索引按每百万 token 0.15 美元计费，存储与查询免费，大幅降低 RAG 应用开发门槛。

#Google#Gemini#RAG

共 25 篇文章，第 1 / 3 页