阿里巴巴通义千问 QwQ Max 推理能力超越 Claude 3.7
阿里通义千问QwQ Max预览版在CipherBench推理测试中超越Claude 3.7,与Grok 3、DeepSeek R1相当;AIME 2025数学题一次通过率达60%。采用Apache 2.0完全开源,支持多模态、工具调用,已免费上线Qwen Chat。
Pika 2.2 来了,终于支持首尾帧,可一次性生成 10 秒视频
Pika 2.2 正式上线,首次支持首尾帧控制——用户可指定起始与结束画面,精准引导视频运动和结构;单次生成时长提升至10秒,大幅增强叙事连贯性与创作自由度。
2025 年 12 款优秀的大语言模型
2025年12款主流大语言模型全景梳理:涵盖GPT-4o、Gemini、Claude、Llama、Mistral等,突出多模态、开源、轻量部署、强推理等差异化能力,兼顾技术特点与实际应用,反映当前LLM生态的多样性与演进方向。
实测阿里通义万相的视频音效生成
实测阿里通义万相视频音效生成功能:开启后AI自动分析画面,匹配环境音效或背景音乐。海浪、小鸟、卡通吉他手视频音效较贴切,瓦力视频因主体识别不准仅获随机配乐。目前长于氛围营造,对具体主体音效的精准识别仍有提升空间。
Luma 推出一键 AI 音效
Luma 上线一键 AI 音效功能,点击视频底部 Audio 按钮即可自动分析画面并生成匹配音效;支持通过 Prompt 精准调整风格与细节。目前正分批开放,部分用户暂未显示入口。
Anthropic 发布 Claude 3.7 Sonnet:更强的推理能力、更智能的代码助手
Anthropic 推出 Claude 3.7 Sonnet,首创“混合推理模式”,可动态平衡响应速度与思考深度,在 SWE-bench、TAU-bench 等测试中达 SOTA;同步发布命令行代码助手 Claude Code,支持文件编辑、命令执行与 GitHub 提交,显著提升开发效率。
Claude 3.7 Sonnet:让 AI 迈向更深层次的思考
Claude 3.7 Sonnet 推出“扩展思维模式”,支持手动设定思维预算,实现更深入的串行与并行推理;首次开放可见思维过程,提升可解释性与信任度;具备自主操作计算机、通关《宝可梦红版》等智能体能力,并强化CBRN等高危领域安全防护。
CAST:精准编排 3D 世界的空间魔术师
CAST仅凭单张照片即可高精度重建3D场景,不仅能解析物体轮廓与深度,还能智能推理被遮挡部分,并通过物理感知校正确保结构合理、不穿模。支持开放类别识别,无需预设物体类型,已在游戏建模、影视虚拟拍摄和机器人仿真环境等场景展现实用价值。
DeepTutor:AI 私教领航,开启学习新境界
DeepTutor 是一款基于智能体(Agentic AI)的AI学习助手,能主动搜索、深度推理并自我优化;20秒内从10–15个优质信源提炼答案,用费曼学习法将复杂知识通俗化,支持跨学科答疑与个性化学习计划。