资讯分类
资讯首页/AI 产品工具

AI 产品工具

实用 AI 产品、工具介绍。

手势同步开源模型:TANGO
AI 产品工具
2024年10月14日
0 条评论
零重力瓦力

手势同步开源模型:TANGO

TANGO是东京大学与CyberAgent AI联合推出的开源手势同步模型,可将人物视频中的手势动作与任意音频精准对齐,补足了现有口型同步技术在肢体协同上的空白,适合虚拟人、动画制作及交互式AI应用。

#视频生成#数字人
阅读全文
一款将静态教科书中的图示转化为互动物理模拟的创做神器
AI 产品工具
2024年10月14日
0 条评论
零重力瓦力

一款将静态教科书中的图示转化为互动物理模拟的创做神器

这款工具用Segment Anything和多模态大模型,自动识别物理教科书中的静态图示,生成可嵌入页面的互动物理模拟,覆盖光学、电路、运动学等场景;结合教师反馈优化出实验增强、动画图示、双向互动与参数可视化四类策略,提升教学趣味性与个性化。

#计算机视觉#多模态
阅读全文
可灵口型同步功能试用
AI 产品工具
2024年10月12日
0 条评论
零重力瓦力

可灵口型同步功能试用

可灵上线口型同步功能,支持33种音色与0.8–2倍语速调节,单次生成5秒视频并保留人物原有动作;口型匹配自然度较好,但面部表情略显僵硬,暂未加入眨眼等微表情细节。

#可灵#视频生成
阅读全文
超级好用的免费音视频字幕生成工具:Whisper Web
AI 产品工具
2024年10月12日
0 条评论
零重力瓦力

超级好用的免费音视频字幕生成工具:Whisper Web

Whisper Web 是一款免费、本地运行的音视频字幕工具,基于 OpenAI Whisper Large v3 Turbo 模型,20秒即可为25分钟音频生成高精度字幕,全程离线、无需联网。支持 npm 快速启动,Firefox 用户需手动启用 Web Workers。

#OpenAI#音频生成
阅读全文
特斯拉人形机器人 Optimus 惊艳亮相 Cybercab 发布会
AI 产品工具
2024年10月11日
0 条评论
零重力瓦力

特斯拉人形机器人 Optimus 惊艳亮相 Cybercab 发布会

特斯拉在Cybercab发布会上展示人形机器人Optimus,融合自研电池、电机与AI推理系统,可胜任教学、照护、家务等多任务;量产版预计售价2–3万美元,马斯克称其将成大众可负担的日常伙伴,人机共存时代正加速落地。

#具身智能#机器人
阅读全文
海螺 AI 全面开放图生视频功能
AI 产品工具
2024年10月9日
0 条评论
零重力瓦力

海螺 AI 全面开放图生视频功能

海螺AI(Minimax)正式开放图生视频功能,支持上传≤20MB、≥300px、比例在2:5至5:2之间的图片;在无额外提示词条件下,生成视频中的人物表情自然度优于Runway Gen-3和可灵1.0,适合对角色表现力有要求的创作者快速试拍。

#海螺 AI#视频生成
阅读全文
如何发挥 OpenAI o1-preview 的最大潜力
AI 产品工具
2024年10月8日
0 条评论
零重力瓦力

如何发挥 OpenAI o1-preview 的最大潜力

o1-preview 擅长深度推理,而非文案生成。要释放其博士级分析能力,需采用“人搜集+模型推理”协作流:先由其他工具收集并精炼信息,再将结构化文档与明确目标输入 o1,使其在战略规划、产品研发等复杂任务中提供高价值洞见。

#OpenAI#上下文工程#思维链
阅读全文
Hotshot:上传5张照片实现固定人物视频
AI 产品工具
2024年10月7日
0 条评论
零重力瓦力

Hotshot:上传5张照片实现固定人物视频

Hotshot上线个性化视频生成功能:用户上传同一人物5张照片,即可通过文本提示生成该形象的多样化视频。操作门槛低于Meta Movie Gen,无需复杂设置,适合普通用户快速定制专属视频内容。

#视频生成
阅读全文
同时体验多款 AI 模型神器:Fal.ai
AI 产品工具
2024年10月6日
0 条评论
零重力瓦力

同时体验多款 AI 模型神器:Fal.ai

Fal.ai 支持一键调用 Flux、Runway、Luma、可灵、LivePortrait 等多款主流 AI 绘画与视频模型,$10 充值即可生成约 4500 张图或 330 秒视频,适合想低成本、高效率体验不同模型效果的轻量用户。

#Runway#Luma#可灵
阅读全文
502 篇文章,第 50 / 56