Meta 发布革命性 AR 眼镜原型 Orion
Meta发布AR眼镜原型Orion,70度超广视角、碳化硅镜片与微型LED投影集成于接近普通眼镜的轻量机身;搭载自研芯片及语音、眼动、手势与EMG腕带多模态交互,旨在构建无缝融合AI与现实的下一代计算平台。
AutoGPT:如何自动将论坛热帖变成爆款短视频
AutoGPT 实现 Reddit 热帖到 TikTok 短视频的全自动转化,涵盖抓取、主题提炼、关键词搜索、模板填充、脚本生成到视频合成共10个模块,支持复用与多主题扩展;同时可提升内容创作效率、分析复杂信息、支撑个性化销售推广。
阿里推出新的视频合成模型:MIMO
阿里发布视频合成模型MIMO,仅需单张角色图、动作描述和场景图,即可生成高可控动画视频。其创新性地将2D视频解耦为身份、动作与场景三部分,并转化为紧凑3D表征,支持跨角色动作迁移、真实遮挡交互与高效编辑,显著降低专业视频创作门槛。
开源 AI 自动化工作流构建神器:AutoGPT
AutoGPT 是一款开源低代码平台,支持构建、部署和管理持续运行的智能代理。它统一集成 OpenAI、Llama 等多模型及邮件、CRM 等外部服务,可自动化数据处理、任务调度、内容生成等复杂流程,适合无需深度编程又需灵活 AI 自动化的开发者与业务人员。
Still-Moving:将图像以自定义的方式转化成视频
Still-Moving 是一种无需视频数据即可定制文生视频模型的新方法,基于现有文生图模型,通过轻量级“空间适配器”保留图像风格细节,“运动适配器”注入动态特性,训练后移除后者,实现高保真、流畅的个性化视频生成。
字节跳动发布两款 AI 视频模型,效果堪比 Sora
9月24日,字节跳动发布PixelDance与Seaweed两款AI视频模型:前者擅长高动态动作、特效与电影级运镜,适用于动画与广告;后者聚焦多主体连贯互动,适合教育、宣传等信息传达场景。二者均支持多风格、多比例及一致性多镜头生成,现已开放内测。
Midjourney 正式推出 “个性化”(Personalize)功能
Midjourney 正式上线“个性化”功能:用户只需从500组图片中选择偏好风格,即可训练专属模型,自动补全提示词中未明说的审美细节(如色调、构图、题材倾向等),显著提升生成效果;开通即赠1小时免费快速生图权限。
能够消除镜面反射恢复图像纹理细节的 AI 模型:StableDelight
StableDelight 是一款专注去镜面反射的 AI 图像增强模型,能精准消除高光干扰,还原被遮盖的表面纹理与细节,适用于摄影后期、工业检测及文物数字化等对图像真实性要求较高的场景。
人物特写镜头的四款 AI 视频工具对比
用同一段电影级提示词(卷发女性特写、表情由沉思转释然、背景虚实渐变、冷调影色),对比Runway、可灵、Pixverse和海螺AI四款工具生成效果,重点考察画面质感、表情自然度与运镜表现力。