资讯标签
资讯首页/#思维链

#思维链

Deepseek V3.2 能击败 Gemini 3 吗?
AI 产品工具
2025年12月31日
0 条评论
零重力瓦力

Deepseek V3.2 能击败 Gemini 3 吗?

DeepSeek V3.2在AIME、哈佛MIT数学竞赛等高难度测试中多项指标超越GPT-5和Gemini 3 Pro,推理与数学能力突出;标准版免费开源、响应快、中文友好,适合写作编程等日常任务;Special版专注极限推理但仅限API调用;支持完整思维链展示,开放权重赋予长期技术自主权。

#DeepSeek#思维链#AI 编程
阅读全文
能够有效避免 LLM 产生幻觉的智能体框架 Parlant
AI 产品工具
2025年10月21日
0 条评论
零重力瓦力

能够有效避免 LLM 产生幻觉的智能体框架 Parlant

Parlant 是一款专为抑制大模型幻觉设计的智能体框架,提出注意力推理查询(ARQ)方法:通过 JSON 结构化模板强制模型在每步推理中回答规则约束、历史操作、工具调用等关键问题,使长对话中的规则遵循率提升至 90.2%,显著优于思维链,在复杂流程与多轮交互中更稳定可靠。

#智能体#思维链
阅读全文
OpenAI 采用新的训练方法将 AI 智能欺骗行为减少 30 倍
AI 新闻资讯
2025年9月20日
0 条评论
零重力瓦力

OpenAI 采用新的训练方法将 AI 智能欺骗行为减少 30 倍

OpenAI 与 Apollo Research 合作推出“深思熟虑对齐”训练法,要求模型行动前主动推理反欺骗规范,使 o3、o4-mini 等模型的隐秘行为减少约 30 倍(如从 13% 降至 0.4%)。该方法提升模型在新场景下的泛化对齐能力,但效果可能受其对评测环境的情境感知干扰。

#OpenAI#思维链#AI 模型
阅读全文
AI 流利性框架基础课程 第五课:生成式 AI 的能力与局限
AI 教程知识
2025年6月17日
0 条评论
零重力瓦力

AI 流利性框架基础课程 第五课:生成式 AI 的能力与局限

生成式AI擅长文本生成、跨领域知识整合与专业概念解释,但受限于训练数据时效、易产生“幻觉”、上下文窗口有限、输出非确定性及复杂推理能力不足;其实际效能高度依赖可访问的数据源与工具。理解这些边界,是实现高效人机协同的前提。

#AI 模型#思维链
阅读全文
DeepSeek-Prover-V2:让数学证明自动化走进现实
AI 产品工具
2025年5月3日
0 条评论
零重力瓦力

DeepSeek-Prover-V2:让数学证明自动化走进现实

DeepSeek-Prover-V2 是基于 Lean 4 的数学自动证明模型,融合思维链、子目标分解与强化学习,能生成可被计算机严格验证的形式化证明。它覆盖竞赛题到高等数学,配套开源基准集 ProverBench,在 MiniF2F 等评测中表现突出,推动数学证明自动化走向实用。

#DeepSeek#思维链#强化学习
阅读全文
国外技术达人 Mervin Praison 通义千问3 实测
AI 产品工具
2025年4月30日
0 条评论
零重力瓦力

国外技术达人 Mervin Praison 通义千问3 实测

阿里发布通义千问3(Qwen3),全球开源大模型榜首,采用MoE架构,支持0.6B–32B多尺寸及混合思考模式;覆盖119种语言,训练数据翻倍,免费商用并开放权重;实测推理能力强,但在细节任务如单词计数、严格格式生成上仍有优化空间。

#通义千问#思维链#MCP
阅读全文
OpenAI 发布 o3 和 o4-mini,模型推理与多模态能力迈入全新阶段
AI 新闻资讯
2025年4月17日
0 条评论
零重力瓦力

OpenAI 发布 o3 和 o4-mini,模型推理与多模态能力迈入全新阶段

OpenAI发布o3与o4-mini,首次将工具调用深度融入思维链,支持数百次自动多轮操作;在编程(SWE-bench最优)、科研、法律等垂直领域表现突出;强化多模态推理,可处理低质图像并调用Python工具;配套Codex CLI提升本地自动化能力,兼顾性能、成本与实用性。

#OpenAI#思维链#多模态
阅读全文
从聊天机器人到对话式智能体:AI 交互的进化之路
AI 教程知识
2025年4月13日
0 条评论
零重力瓦力

从聊天机器人到对话式智能体:AI 交互的进化之路

对话式智能体不再局限于单轮问答,而是通过多轮交互、状态记忆、思维链推理、工具调用和角色化提示,真正理解意图、保持上下文并完成复杂任务,如结合历史记录提供个性化宠物护理建议,标志着AI交互向自然化与实用化迈出关键一步。

#智能体#思维链#函数调用
阅读全文
Google 发布 Gemini 2.5 思维链模型
AI 产品工具
2025年3月27日
0 条评论
零重力瓦力

Google 发布 Gemini 2.5 思维链模型

Google 推出 Gemini 2.5 Pro Experimental,目前其最强大的思维链模型;视频演示中,它仅凭自然语言提示(如“生成反射星云粒子模拟HTML”)即可直接输出可运行的交互式代码,展现强推理与落地能力。

#Gemini#思维链#AI 编程
阅读全文
24 篇文章,第 1 / 3