AI 秘技 如何让 Gemini 访问外部信息
Gemini 等大模型知识有截止日期(如 Flash Latest 仅更新至 2025 年 1 月),无法回答此后的新问题。Google 工程师在 AI Studio 中提供一键启用 Google 搜索的功能,让模型实时调用外部信息,显著提升实用性——工具调用正成为解锁 LLM 真实能力的关键。
Midjourney 的 Standard 和 Raw 模式
Midjourney 的 Raw 模式(v5.1+)关闭自动美化,更忠实响应提示词,生成写实、自然、风格统一的图像,适合专业级细节控制;Standard 模式则默认添加艺术滤镜,快速产出高审美风格化图片。可通过 `--raw` 临时启用或在设置中全局切换。
AI教程 Freepik 镜头角度节点
Freepik将在Spaces上线“镜头角度”AI节点,用户只需将其接入任意图片节点,即可在不修改原图内容的前提下,自由调整俯视、仰视、平视等影视化视角,提升AI生成图像的构图控制力与叙事表现力。
AI教程 Freepik Spaces 如何将随手拍照片变成专业产品展示视频
Freepik Spaces上线新模板,手机随手拍的产品照片,可一键生成多角度、多格式的专业展示图与视频,无需专业设备或剪辑技能,电商与营销人员快速产出高质量内容。
AI干货 如何通过 Freepik Spaces 快速制作广告视频
Freepik Spaces 用 AI 将广告视频制作简化为“上传一张图”:自动补全剪辑、配音、动效与节奏,无需专业技能,营销人员几分钟就能生成可发布的短视频。
Google 智能体白皮书
Google发布智能体白皮书,指出AI正从被动响应问答、翻译等离散任务,转向具备自主规划与执行能力的智能体范式。这类智能体是融合语言模型推理力与工具调用能力的完整应用,可不依赖人工干预,完成多步骤复杂任务。
AI 神器 30秒换装 狗子秒变机器人
Pixverse Remix上线单图驱动对象替换功能,上传一张图片即可在30秒内将视频中的狗等主体无缝替换成机器人等新形象,无需复杂操作,普通用户也能快速上手。
Google Veo 3.1 首尾帧动态展现罗马城的建造
Google Veo 3.1 用首尾帧生成技术,将罗马城跨越千年的建造历程浓缩为1分钟动态视频——从荒芜之地到永恒之城,直观展现城市空间与建筑形态的渐进演变,为历史可视化提供新可能。
如何通过 ElevenLabs 去除背景噪音
ElevenLabs 推出 Voice Isolator v1 语音隔离模型,可精准分离人声与背景噪音,效果堪比图像“AI 抠图”。适用于播客剪辑、会议录音降噪、视频配音等场景,大幅提升音频清晰度与后期效率。