资讯分类
资讯首页/AI 产品工具

AI 产品工具

实用 AI 产品、工具介绍。

能够通过普通照片中街景自动定位实际位置的 AI 应用:Geospy
AI 产品工具
2025年1月5日
0 条评论
零重力瓦力

能够通过普通照片中街景自动定位实际位置的 AI 应用:Geospy

Geospy 是一款AI街景定位工具,上传普通照片即可自动识别拍摄地点,返回实时街景与地理信息。目前覆盖旧金山、纽约、孟菲斯、柏林、新加坡五城,适合旅行探索、地理考证与内容核查等场景。

#计算机视觉
阅读全文
开源音频生成(Text to Audio)模型:TANGOFLUX
AI 产品工具
2025年1月4日
0 条评论
零重力瓦力

开源音频生成(Text to Audio)模型:TANGOFLUX

TANGOFLUX 是一款开源可本地部署的文本生成音频模型,5.15亿参数,单块A40 GPU仅需3.7秒即可生成30秒/44.1kHz高质量音效。其创新CRPO方法能自动构建偏好数据,有效缓解TTA领域缺乏明确评价标准的难题,显著提升生成效果。

#音频生成#AI 模型
阅读全文
ZOO:解锁 AI 驱动的 CAD 设计新未来
AI 产品工具
2025年1月3日
0 条评论
零重力瓦力

ZOO:解锁 AI 驱动的 CAD 设计新未来

ZOO 推出“文生 CAD”技术,支持用自然语言直接生成参数化 CAD 模型,首次将 AIGC 能力深度引入工程设计流程。无需建模经验,工程师和设计师可通过语义指令快速构建可编辑、可复用的工业级模型,现已开放体验。

#3D 生成
阅读全文
Suno 推出音色转换功能
AI 产品工具
2025年1月3日
0 条评论
零重力瓦力

Suno 推出音色转换功能

Suno 新增音色转换功能,可在不改变主旋律的前提下,将音乐从一种音色风格迁移至另一种,例如钢琴曲一键转为管弦乐版本,原理类似图像领域的AI风格迁移。

#音频生成
阅读全文
Rodin 1.5 通过同一物体不同角度的图片生成 3D 模型
AI 产品工具
2025年1月3日
0 条评论
零重力瓦力

Rodin 1.5 通过同一物体不同角度的图片生成 3D 模型

Rodin 1.5 可基于同一物体的多角度照片生成高精度3D模型,显著提升表面细节还原度与几何准确性,适合需要快速建模的设计师和内容创作者。

#3D 生成
阅读全文
2025 年 AI 智能体技术栈中的关键工具
AI 产品工具
2025年1月3日
0 条评论
零重力瓦力

2025 年 AI 智能体技术栈中的关键工具

2025年AI智能体技术栈日趋成熟:AutoGen与CrewAI支撑多智能体协作,BerriAI统一接入百余大模型;Firecrawl、Exa强化网页数据获取,Composio和Stripe拓展外部能力;Browserbase、Open Interpreter实现浏览器与终端操控;Mem0与Neon则分别优化长期记忆与RAG支持。

#智能体#RAG#浏览器自动化
阅读全文
LTX Studio 实现 人物表情精细化控制
AI 产品工具
2024年12月22日
0 条评论
零重力瓦力

LTX Studio 实现 人物表情精细化控制

LTX Studio 新增人物表情精细化控制功能,支持8种预设表情及头部、嘴型、眼态、眉部的滑块调节,显著提升AI视频中角色表情的准确性与自然度;暂不支持该功能的工具(如可灵、海螺AI)可通过Reshot AI+首尾帧技术实现类似效果。

#视频生成#视频编辑
阅读全文
第十二天:OpenAI 推出全新 o3 模型,AI 推理能力迈向新高度
AI 产品工具
2024年12月21日
0 条评论
零重力瓦力

第十二天:OpenAI 推出全新 o3 模型,AI 推理能力迈向新高度

OpenAI 在“12 Days”收官日发布推理模型o3及轻量版o3 mini:编程(CodeForces Elo 2727)、数学(AMC准确率96.7%)与AGI基准ARC(87.5%)全面超越o1;首创“审议式对齐”提升安全性;o3 mini将于2024年1月底率先上线。

#OpenAI#AI 编程#AI 模型
阅读全文
Text3D 一个用来制作高品质 3D 模型参考图像的 Gradio 应用
AI 产品工具
2024年12月20日
0 条评论
零重力瓦力

Text3D 一个用来制作高品质 3D 模型参考图像的 Gradio 应用

Text3D 是一款基于 Flux 模型的开源 Gradio 工具,无需本地部署,直接在 Hugging Face 上运行,可一键生成多角度、高细节的 3D 模型参考图,显著提升建模与纹理绘制效率,适合 3D 艺术师快速构思和验证设计。

#3D 生成#图像生成
阅读全文
415 篇文章,第 29 / 47