资讯标签

#MIT

2026年4月13日

如何构建 AI 扩展定律以实现高效 LLM 训练和预算最大化

MIT-IBM 团队发布大规模语言模型扩展定律系统性指南，通过分析 485 个模型和 190 万条性能指标，拟合超 1000 条扩展定律。研究发现预测相对误差最佳可控制在 4%，并证实小模型与大模型存在可迁移规律。建议优先训练多个小模型而非追求大模型，中期检查点数据最具预测价值。这项研究为资源受限的研究者提供了更公平参与大模型研究的可能，揭示了扩展定律在跨模型家族间的通用性。

#MIT#AI 模型

阅读全文

共 10 篇文章，第 2 / 2 页