资讯分类
资讯首页/AI 教程知识

AI 教程知识

AI 教程、知识讲解、工作流与实用方法。

从 V0 到 R1,deepseek 如何追平 GPT-4
AI 教程知识
2025年2月10日
0 条评论
零重力瓦力

从 V0 到 R1,deepseek 如何追平 GPT-4

DeepSeek 两年内从2023年V0迭代至2025年R1,在数学、逻辑与编程能力上追平GPT-4;通过MoE、MLA等架构创新,参数达6710亿,并以跨架构蒸馏技术实现高性能轻量部署,标志AI研发正转向“能力驱动”。

#DeepSeek#强化学习#AI 模型
阅读全文
混合专家模型:AI 界的专家会诊制如何让大模型更高效?
AI 教程知识
2025年2月9日
0 条评论
零重力瓦力

混合专家模型:AI 界的专家会诊制如何让大模型更高效?

混合专家(MoE)架构让大模型像“专家会诊”:通过门控机制动态调用不同子网络处理输入,训练中自然形成专长。Mixtral用8个专家超越GPT-3.5,DeepSeek R1总参6710亿但仅激活370亿,显著降本增效。

#DeepSeek#Mistral#AI 模型
阅读全文
什么是大语言模型 LLM 蒸馏?
AI 教程知识
2025年2月8日
0 条评论
零重力瓦力

什么是大语言模型 LLM 蒸馏?

LLM蒸馏是将大模型(教师)通过概率分布输出的知识迁移至小模型(学生)的技术,由Hinton团队2015年提出。它能在大幅压缩参数量与资源占用的同时,保留97%左右的性能,如DistilBERT体积降40%、速度升60%。DeepSeek R1已推出1.5B–70B多档蒸馏版,支持低配设备本地部署。

#DeepSeek#AI 模型
阅读全文
DeepSeek R1 是如何炼成的
AI 教程知识
2025年2月7日
0 条评论
零重力瓦力

DeepSeek R1 是如何炼成的

DeepSeek R1 经历V1至R1 Zero四阶段迭代,融合强化学习与监督微调,采用MoE架构提升效率;仅用2048块H800 GPU即逼近OpenAI顶级模型性能,显著降低训练与推理成本,推动高效透明AI推理落地。

#DeepSeek#强化学习#AI 模型
阅读全文
一键复用创作风格:Frames 让 AI 绘画也能有自己的 “专属滤镜”
AI 教程知识
2025年2月6日
0 条评论
零重力瓦力

一键复用创作风格:Frames 让 AI 绘画也能有自己的 “专属滤镜”

Runway 新推出的 Frames 模型支持“一键复用创作风格”,用户可预设或自定义样式模板,聚焦色调、光线、纹理等通用风格要素,或为特定场景详述效果,避免重复输入提示词,显著提升 AI 绘画效率与风格一致性。

#Runway#图像生成
阅读全文
最通俗易懂的 DeepSeek 核心技术介绍
AI 教程知识
2025年1月29日
0 条评论
零重力瓦力

最通俗易懂的 DeepSeek 核心技术介绍

DeepSeek 用“自言自语”式思维链提升推理准确性,以类婴儿试错的纯强化学习优化策略,并将6710亿参数大模型能力蒸馏至7B小模型——在数学、编程等任务上媲美甚至超越OpenAI o1,让高性能AI真正落地普通设备。

#DeepSeek#思维链#强化学习
阅读全文
如何通过 DeepSeek 构建各种超级 AI 工具
AI 教程知识
2025年1月28日
0 条评论
零重力瓦力

如何通过 DeepSeek 构建各种超级 AI 工具

技术达人Julian Goldie演示如何用DeepSeek搭配Make.com、Ollama、Bolt.diy等免费工具,构建自动化SEO工作流:从Google表格取关键词,经DeepSeek生成优化内容,自动发布至WordPress,全程零API费用,适合想快速落地AI应用的开发者和运营人员。

#DeepSeek#智能体#AI 编程
阅读全文
如何用 Ollama + DeepSeek 打造本地运行的网页研究助手
AI 教程知识
2025年1月27日
0 条评论
零重力瓦力

如何用 Ollama + DeepSeek 打造本地运行的网页研究助手

Lance Martin 开源了一个本地运行的网页研究助手,基于 Ollama 与 DeepSeek,无需 API。它自动提取关键词、调用 Tavily 搜索、总结内容,并迭代补全知识缺口,最终生成带引用的 Markdown 报告,支持任意 Ollama 模型。

#DeepSeek#Deep Research#智能体
阅读全文
两小时快速实现 DeepSeek 克隆 Perplexity
AI 教程知识
2025年1月26日
0 条评论
零重力瓦力

两小时快速实现 DeepSeek 克隆 Perplexity

AI 工程师 Riley Brown 用两小时基于 DeepSeek Reasoner 零代码构建出 Perplexity 克隆版 YapSearch,支持联网搜索、多源分析、可视化推理与答案溯源,并已集成至其内容创作工具链,实现语音转录、资料整合与草稿生成,项目开源。

#DeepSeek#AI 搜索#AI 编程
阅读全文
280 篇文章,第 20 / 32