#New Machina
反思:智能体工作流中的关键优化机制
反思机制让智能体在生成答案后进行自我评估,识别逻辑漏洞与不确定性,实现“二次思考”以提升准确性。它特别适用于数学求解、代码验证等高精度任务,模拟人类复盘思维,但需权衡计算成本,并非所有场景必需。
模型本地部署神器:Ollama
Ollama 是一款开源大模型本地部署工具,支持 Mistral、Llama、Gemma 等主流模型在普通笔记本上高效运行。通过量化优化与 LoRA 微调,兼顾性能、隐私与易用性,让开发者和普通用户无需依赖云服务即可离线使用大模型。
深入解析 LangGraph 智能体开发工作流:从概念到实践
LangGraph 通过图结构实现 ReAct 智能体工作流,让 LLM 能动态调用 NOAA 浮标 API 获取实时海洋天气数据。示例中,模型自主推理浮标 ID 并调用工具,展现“推理+行动”能力,代码简洁、扩展性强,为金融、医疗等需实时数据的场景提供可落地的智能体开发路径。
RAG 与 ReAct:两种提升大语言模型能力的关键方法
RAG通过向量检索外部知识提升回答准确性,适合专业领域问答;ReAct让模型边推理边调用工具,擅长多步骤复杂任务。二者分别拓展知识广度与推理深度,可独立使用或协同集成,是构建实用AI应用的关键路径。
Open Router: 无缝集成多个大语言模型的一站式解决方案
Open Router 是一个统一 API 网关,支持通过单个密钥调用数百种大模型(如 Claude Sonnet 3.7、GPT-4.5、DeepSeek R1),免去多平台注册与密钥管理;切换模型只需改参数,30 秒内生效,按 token 计费,国内支持支付宝。
ReAct:让语言模型学会思考与行动
ReAct框架让大模型不再只被动回答问题,而是能自主推理、调用API获取实时信息、观察结果并迭代优化——比如查询圣克莱门特海岸浪况时,主动调用气象浮标接口,而非依赖过时训练数据。它标志着AI正从“问答器”迈向“问题解决者”。
什么是 CrewAI?
CrewAI 是一个基于 Python 的智能体框架,模仿人类项目团队协作模式,支持创建角色明确、分工专业的 AI 智能体(如编码专家、测试工程师),并实现跨角色协同。兼容多厂商大模型与外部工具,适合处理需多角色配合的复杂任务。
RAG 和 模型微调哪个好,怎么用?
RAG借助外部向量库实时检索信息,成本低、易更新,适合需动态数据的场景;模型微调则通过领域数据训练提升专业性与准确性,但耗资源且知识静态。二者并非互斥,常结合使用——RAG补时效,微调强专精。
10 分钟讲清什么是大模型的尺度定律(Scaling Law)
大模型尺度定律揭示参数、数据与算力需协同扩展,盲目堆参数反会降低效率——Chinchilla研究已证实小模型配更多数据效果更优。当前高质量数据成新瓶颈,合成数据与MoE架构正成为突破关键。