#智能体
第十一天:ChatGPT 桌面应用重磅升级,让智能助手无处不在!
ChatGPT 桌面应用迎来重磅升级:支持快捷唤起(Option+Space)、屏幕上下文理解、终端命令生成、代码实时模拟、联网搜索与引用标注,以及趣味语音交互。深度融入 macOS 工作流,程序员可联动终端与 IDE,写作者获风格化文案与可信信源支持,Windows 版本即将上线。
奥特曼:2025年 AI 发展展望
奥特曼驳斥AI扩展已遇瓶颈的说法,强调“没有墙”,重申超级智能将如期到来。2025年AI发展重心转向智能体(AI Agent),具备自主规划、调用工具、长期执行复杂任务并产出实际价值的能力。OpenAI将在未来12个工作日密集展示新成果,或含Sora进展。
Elevenlabs 定制化语音助手部署指南
ElevenLabs推出Conversational AI平台,支持通过网页仪表盘快速部署定制化语音助手。本文以波兰餐厅Pierogi Palace为例,详解如何配置语音、系统提示与订单流程,实现语音点餐、价格计算、配送预估等端到端服务。
摩根士丹利如何利用人工智能塑造金融服务未来
摩根士丹利将GPT-4深度集成至财富管理流程,推出“AI @ Morgan Stanley Assistant”等内部工具,98%顾问每日使用,显著提升信息检索、报告摘要与客户响应效率;通过严格评估框架保障合规性与可靠性,并拓展至会议纪要、多语言处理等新场景。
Ted演讲:如何利用 AI 与失去的亲人取得联系
漫画家艾米·库兹韦尔用祖父遗留的文字训练AI聊天机器人,与逝去的祖父“对话”, uncover 未知家族史;她以原创插画结合这一实践,探讨AI与艺术如何延缓记忆消逝——当无人记得,才是真正的死亡。
Ted 演讲:如何让 AI 帮助我们像超人一样思考
前情报分析师Jackie Barbieri在TED演讲中指出,当前人机协作受限于信息过载、思维与工具响应不同步、机器难以理解复杂数据三大瓶颈;突破它们可释放倍增效应,让关键决策像查导航一样即时、可靠——这对决策者、研究者和一线行动人员尤为关键。
ChatGPT MacOS 桌面版应用提供了操作其他应用的能力
ChatGPT macOS桌面版上线跨应用操作功能,Plus与Team用户可在测试版中直接读取Xcode代码并提交至终端,省去复制粘贴步骤,提升开发效率。
深度学习专家吴恩达介绍 AI 主动式工作流的崛起
吴恩达提出“主动式工作流”,主张AI通过多轮迭代优化内容,而非一次性生成;强调其在教育、医疗等普惠场景的价值,呼吁全球社区协作推动落地,并预言“主动式AI时刻”将如ChatGPT问世般重塑工作与生活。
微软发布最新用户界面解析模型:OmniParser
微软推出OmniParser,可将UI截图精准解析为结构化元素,显著提升GPT-4V等视觉语言模型对界面组件、图标功能及可交互区域的理解能力;基于6.7万截图与7000图标描述对训练,在SeeClick等基准测试中超越GPT-4V基线,亦可作为插件增强Phi-3.5-V、Llama-3.2-V等模型的UI理解性能。