#思维链
Claude 3.7 Sonnet:让 AI 迈向更深层次的思考
Claude 3.7 Sonnet 推出“扩展思维模式”,支持手动设定思维预算,实现更深入的串行与并行推理;首次开放可见思维过程,提升可解释性与信任度;具备自主操作计算机、通关《宝可梦红版》等智能体能力,并强化CBRN等高危领域安全防护。
“聪明得可怕” 的 Grok 3 和马斯克的第一性原理
马斯克称Grok 3将“聪明得可怕”,关键在于引入第一性原理推理——不依赖统计模式,而是从物理、数学等基本规律出发进行逻辑推演。这有望提升因果理解、创新能力和决策效率,让AI真正具备自主认知与发现能力,尤其在科研、工程等需深度推理的领域展现突破潜力。
如何通过 Colab 免费使用 Gemini 2.0 推理模型
无需本地部署,在 Colab 中即可免费调用 Gemini 2.0 Thinking 模型,一站式完成文字创作与代码生成:如自动生成影视票房分析文章,并输出可直接运行的绘图代码。当前不支持联网搜索,中文图表显示存在兼容性问题。
Jina.ai 结合 DeepSeek 打造的智能搜索工具 Deep Search
Jina.ai 联合 DeepSeek 推出 Deep Search,基于思维链技术提供更精准、简洁的搜索结果。普通用户可免费网页搜索,开发者可通过低成本 API($0.02/百万 Token)快速集成 AI 搜索能力。
萨姆·奥特曼重置 OpenAI 产品路线图:化繁为简
奥特曼宣布OpenAI产品路线图重大调整:GPT-4.5(Orion)将是最后一个不支持“思维链”的模型;后续GPT与o系列融合,由AI自主决定是否深度思考;GPT-5整合o3等技术,不再单独发布o3;取消复杂模型选择器,免费用户可无限制使用标准版GPT-5。
如何让普通的大模型像 DeepSeek 一样思考
技术达人Mervin Praison提出轻量级AI Agent协同方案,仅用一页代码即可为普通大模型注入DeepSeek式的思维链(CoT)能力。通过四个智能体自动构建高质量问答对、生成推理步骤、评估质量并上传至Hugging Face,支持快速微调提升推理能力。
Google 发布带有思维链的推理模型 Gemini 2.0 Flash Thinking
Google 免费开放 Gemini 2.0 Flash Thinking 实验模型,支持显式六步结构化推理(解构、协同、头脑风暴等),专为深度类型融合设计。实测中,它用9.6秒完成仙侠×赛博朋克的世界观、人物、剧情与视觉四维融合,并生成高质量范例文本,思考过程可全程查看。
DeepSeek-R1 现已通过 NVIDIA NIM 微服务上线
DeepSeek-R1——6710亿参数开源MoE大模型,支持思维链、共识推理等测试时扩展能力,在逻辑、数学、编程任务中表现突出。现通过NVIDIA NIM微服务上线,单台HGX H200可达3872 tokens/s,支持企业级安全部署与智能体定制开发。
最通俗易懂的 DeepSeek 核心技术介绍
DeepSeek 用“自言自语”式思维链提升推理准确性,以类婴儿试错的纯强化学习优化策略,并将6710亿参数大模型能力蒸馏至7B小模型——在数学、编程等任务上媲美甚至超越OpenAI o1,让高性能AI真正落地普通设备。