Gemini 2.0:从聊天机器人到智能体的进化
Gemini 2.0 实现从对话到行动的跨越:原生支持自主调用搜索、代码解释器、地图等工具,完成多步协同任务;多模态能力更懂文化语境,可生成地域化图像与情境化语音;Flash 版性能反超前代 Pro;专注增强人类能力,为开发者提供构建实用智能体的新基座。
硅谷新贵:Pika 创始人郭文景访谈
硅谷成长、哈佛求学、斯坦福AI博士的郭文景创立Pika,坚持“艺术家主导、AI辅助”理念,团队三分之一为创意背景。产品聚焦AI视频生成工具而非全自动平台,已获融资超1.4亿美元,用户数百万。她认为AI视频正加速商业化,并强调创业者应做真正热爱的事。
如何结合 Plaf 和 Pika 快速制作 3D 动画
Plaf 能根据文字提示生成带语音、表情与动作的3D人物动画;截取画面后,用 Pika 的“配料混合”功能搭配“卡通化”提示词,快速生成风格统一的动画片段;最后用 CapCut 剪辑成片——全流程十几分钟即可完成。
如何通过 Pika 配料混合快速制作 3D 动漫
AIGC达人Techhalla分享用Pika“配料混合”快速生成3D动漫视频的工作流:先用Flux生成T-Pose角色与森林场景的参考图,再导入Pika结合提示词合成连贯动画,最后用剪映等工具完成剪辑配音——全程几分钟,角色与场景高度一致。
什么是检索增强生成 RAG 框架
RAG(检索增强生成)通过实时调用外部知识库,弥补大语言模型知识固化、无法溯源和易产生幻觉的缺陷,让回答更准确、可验证且具备时效性。IBM 研究员 Marina Danolevski 在视频中通俗解析其原理与价值。
2025 AI 趋势预测:智能体、无限记忆,还有你没想到的未来
2025年AI将从工具升级为伙伴:智能体具备自主推理与行动能力;推理时间可动态调整以提升准确性;50万亿参数超大模型与20亿参数本地小模型并行发展;无限记忆实现深度个性化交互;AI嵌入专业工作流,无需技术门槛即可自然协作。
LTX Studio 实现 人物表情精细化控制
LTX Studio 新增人物表情精细化控制功能,支持8种预设表情及头部、嘴型、眼态、眉部的滑块调节,显著提升AI视频中角色表情的准确性与自然度;暂不支持该功能的工具(如可灵、海螺AI)可通过Reshot AI+首尾帧技术实现类似效果。
看看 Pika 配料混合 (Ingredients) 有哪些有趣的玩法
Pika Ingredients 支持角色与名画互动、画中“走出”、多角色动态切换、产品悬浮拍摄、实时换装及场景融合等玩法,让AI视频更具叙事张力与商业表现力,适合创意表达与品牌内容制作。
一口气看完 OpenAI 12 天发布会
OpenAI 12天密集发布o1 Pro、Sora视频生成、多模态ChatGPT、苹果生态深度整合、o3系列新模型等十余项更新,覆盖推理性能跃升、专业领域微调、跨模态交互、终端体验优化与开发者工具升级,推动AI向更智能、更自然、更普及的下一代智能体加速演进。