资讯分类

资讯首页/AI 产品工具

AI 产品工具

实用 AI 产品、工具介绍。

Google AI Studio 上线了屏幕实时分享功能

Google AI Studio 新增屏幕实时分享功能，支持串流 Chrome 标签页，让 Gemini 实时“看见”页面内容并语音交互，适用于编程辅助等场景；英文语音识别流畅，中文识别偶有误判为日文的情况。

#Google AI Studio#Gemini#多模态

Google 推出 Gemini 2.0 Flash 原生图像生成功能

Google 正式向所有支持地区开发者开放 Gemini 2.0 Flash 原生图像生成功能，可在 Google AI Studio 和 Gemini API 中调用。它支持文本生成图像、对话式实时编辑、常识推理保障内容合理性，并显著提升图像中文字渲染的准确性，适用于故事配图、广告设计等场景。

#Gemini#图像生成#Google AI Studio

一款基于 Gemma 3 的开源 OCR 软件

基于 Gemma 3 12B 多模态模型的轻量级开源 OCR 工具，支持图像文本识别、翻译与答题等任务，显著降低多模态应用开发门槛。项目已开源，代码托管于 GitHub。

BlenderMCP: 将 Claude 与 Blender 无缝集成

BlenderMCP 是一款基于 MCP 协议的 Blender 插件，实现 Claude 与 Blender 的双向通信。用户可通过自然语言指令创建模型、调整材质、管理场景、运行 Python 脚本，并直接调用 Poly Haven 资源库，显著降低 AI 辅助 3D 创作门槛。

如何让 Gemma 3 成为旅行小帮手

Gemma 3（1B参数）在伦敦至苏黎世旅行中实测表现亮眼：拍照解析航班与地铁图规划路线、推荐并介绍本地餐厅、精准分账、140+语言即时翻译食品成分表，支持离线运行；还能结合海拔、时间等多因素为骑行规划最优路线。

Gemini Deep Research 实测

实测Gemini Deep Research生成《量子退火为何采用磁通量子比特》报告：自动规划8步研究方案，7分钟检索96个网站，产出含图表、逻辑清晰的完整分析，并支持导出多格式；目前每日限免5次。

#Gemini#Deep Research

Ted AI 播客主持人 Bilawal Sidhu 的 Manus AI 测评

Ted AI 主持人 Bilawal Sidhu 实测 Manus AI：33分钟内自主完成无人机合规选址、个性化音乐节行程规划、多维酒店推荐等复杂任务，初步实现“替代人类操作电脑”；受限于上下文长度与网站访问，但已展现智能体实用潜力。

挑战 AI 巨头的新力量：Manus AI 功能分析和测评

Manus AI 是一款尚未全面开放的云端AI助手，擅长多任务协同与异步执行，在简历筛选、房产研究、财务分析等复杂场景中表现突出；其报告产出量达OpenAI Deep Research两倍，GAIA基准测试位居业界前列，标志国产AI Agent在垂直领域实现关键突破。

#智能体#Deep Research#浏览器自动化

革新3D建模：MeshPad 开启草图驱动的网格编辑新时代

MeshPad 用草图驱动3D网格编辑，仅需手绘即刻添加或删除三角面片。基于Transformer与顶点Token对齐预测器，单步编辑仅数秒，网格质量提升22%，90%用户认可。它把专业级建模简化为自然的2D草图交互，大幅降低3D创作门槛。

#3D 生成

阅读全文

共 516 篇文章，第 29 / 58 页