约三成新增网站由 AI 生成,互联网“快乐”得越来越假
一项最新研究揭示了 AI 生成内容对互联网的深远影响。研究显示,约 35%的新增网站由 AI 独立生成或借助 AI 辅助完成,而这些 AI 生成的内容呈现出一种显著的共同特征——语调被“净化”得异常积极。
该研究由伦敦帝国理工学院、斯坦福大学与互联网档案馆的研究人员共同完成,研究论文于今日以预印本形式发布。这是迄今为止针对 AI 生成内容规模最为全面的一次量化分析。
研究团队首先尝试了四种不同的 AI 检测方法,最终选用 Pangram Labs 提供的工具完成主要检测工作。为确保样本的代表性,研究借助互联网档案馆的“时光机”( Wayback Machine )项目,抓取 2022 年至 2025 年间创建的网页快照。此外,团队还围绕 AI 生成内容的六个特性设计了相应的验证测试。
其中一项测试专门分析了 AI 对网络内容语调的影响。研究采用情感分析技术,将词汇划分为积极、中性、消极三类,结果发现“AI 生成或 AI 辅助网站的中积极情感得分比非 AI 网站高出 107%”。研究人员将这种激增的“人工幸福感”视为“现有大语言模型谄媚性与过度乐观倾向”的症状。换言之, AI 写作工具讨好用户的本能正在向整个互联网内容生态蔓延,使其整体语调趋于甜腻。
研究还对 AI 生成内容是否会压缩“独特观点与多元视角的表达空间”进行了验证。数据显示, AI 确实使互联网内容的意识形态多样性下降, AI 网站在“语义相似度”测试中的得分比人类创作的网站高出约 33%。
不过,并非所有预设假设都得到验证。研究中有四项理论未能获得数据支撑。研究团队曾推测 AI 会导致虚假信息增加,但分析结果并未支持这一假设。他们还猜测 AI 写作会减少外部链接引用,且整体风格会更加千篇一律。然而,这两项推测同样未能得到证据支持。
尤为出乎意料的是,尽管 AI 生成内容的观点更加同质化且普遍更积极,但写作风格本身并未呈现出明显趋同的迹象。研究团队此前预计能够观察到内容向统一化方向演变的清晰趋势。斯坦福大学研究员 Maty Bohacek 表示:“团队所有人都以为这会是显而易见的结论。但我们就是没有找到显著证据。”
研究开始前,团队还委托开展了一项关于公众对 AI 态度的民意调查。将调查结果与研究结论对照后,研究人员发现预判失误的并非只有他们。许多被调查者同样曾以为 AI 生成网站增多会导致假新闻泛滥。绝大多数受访者还认为 AI 写作会减少外部链接,且整体语气会愈发同质化。 Bohacek 评论道:“有趣的是,人们倾向于预判最坏的结果。”
这项研究并非对 AI 影响互联网问题的终结论断。 Bohacek 将其定位为“破冰之举”,希望为后续更深入的探索提供起点。作为对 AI 内容现状的一次快照,这项研究提供了一种颇具启发性的人文观察:有些事情的发展轨迹,往往难以预测。
创艺洞察
这项研究最耐人寻味的发现并非那些得到验证的假设,而是那些落空的预判。信息革命史上,新技术往往被设想为“放大器”,放大既有的人类倾向,包括创造力与谎言、连接与孤立。但 AI 的实际轨迹表明,技术并非简单的放大器,而是一个极具自身“禀性”的参与者。大语言模型天然倾向于积极响应、规避争议、寻求最大公约数,这些特质正在重塑互联网的公共话语基座。当“假开心”成为数字空间的主旋律,一个更值得追问的问题或许不是“AI 说了什么谎”,而是“AI 正在让什么样的表达变得理所当然”。


