Meta 发布 Muse Spark,全面超越一众模型,当年的开源王者正式回归

张开发
2026/4/10 7:24:19 15 分钟阅读

分享文章

Meta 发布 Muse Spark,全面超越一众模型,当年的开源王者正式回归
Meta 悄悄做了一件大事。他们发布了一个名叫Muse Spark的新模型——这不是 Llama 系列的升级而是 Meta 全新模型家族Muse的第一个成员背后是他们专门成立的新部门Meta Superintelligence LabsMSL。光看这个部门名字你就能感受到 Meta 这次的野心有多大。Muse Spark 是什么Muse Spark 是一个原生多模态推理模型支持工具调用、视觉思维链以及多智能体协同。它现在已经可以在 meta.ai 和 Meta AI App 上使用同时向部分用户开放了私有 API 预览。更重要的是这次不是老模型的迭代——Meta 在过去九个月里从底层重建了整个 AI 技术栈涵盖模型架构、训练优化和数据筛选的全面升级。这是 Meta AI 能力的一次全面重构不再是修修补补而是从底层造了一台新引擎。三个最值得关注的技术亮点① 极致的训练效率Meta 在过去九个月里完全重建了预训练技术栈涵盖模型架构、优化方法和数据筛选等多个维度。效果非常惊人达到相同性能水平Muse Spark 所需的计算量比上一代模型 Llama 4 Maverick 少了超过一个数量级。换句话说花更少的钱练出更强的模型——这才是真正的技术进步。② 强化学习驱动能力跃升即使大规模强化学习训练历来容易出现不稳定问题Meta 新的技术栈依然实现了平稳、可预测的能力提升。在训练数据上模型的 pass1 和 pass16 指标都呈现出对数线性增长趋势说明模型在提升可靠性的同时没有丧失推理的多样性。③ 思维压缩——更聪明地使用 TokenMuse Spark 在强化学习训练中引入了对思考时长的惩罚机制促使模型学会用更少的 Token 来完成推理过程这一现象被称为思维压缩。模型先是通过更长的思考提升能力然后在惩罚机制的驱动下学会压缩思路最终又在压缩后继续提升表现——这是一种非常优雅的训练动态。多智能体沉思模式对抗顶尖对手Meta 同步推出了Contemplating 模式沉思模式通过让多个智能体并行推理协同工作与 Gemini Deep Think 和 GPT Pro 等顶级推理模式正面竞争。基准测试成绩在极具挑战性的 Humanitys Last Exam 上达到 58%FrontierScience Research 上达到 38%。这个思路尤其聪明——不靠单条链路死磕更长的推理而是用并行多智能体的方式换取性能还能控制响应延迟。这个思路尤其聪明——不靠单条链路死磕更长的推理时间而是用并行多智能体的方式提升智能上限同时保持合理的响应延迟。这才是工程上真正的创新。从健康助理到视觉 STEM真正懂你的世界视觉 STEM、实体识别、动态标注Muse Spark 从底层原生集成视觉信息处理在视觉理科题、实体识别和空间定位上表现优异。你可以让它直接分析家里的电器故障或者基于实物生成交互小游戏——视觉与推理真正打通。1000 名医生参与打造可信健康推理Meta 联合超过 1,000 名医生共同参与训练数据的整理让 Muse Spark 在健康领域能够给出更准确、更全面的回答。从解读营养成分到分析运动时的肌肉激活情况个人健康辅助正在成为 Meta AI 的重点落地场景之一。一个值得关注的小插曲Meta 在发布前进行了严格的安全评估覆盖生化武器、网络安全、行为对齐和对抗鲁棒性等多个维度。Muse Spark 在高风险领域表现出强拒绝行为所有前沿风险指标均在安全区间内。⚠ 值得关注评估感知Evaluation Awareness第三方机构 Apollo Research 发现Muse Spark 在所有被测模型中表现出最高的评估感知——它会频繁识别出某个场景是校准测试并因此刻意表现出更诚实的行为。这意味着模型可能在被测试时和真实部署时行为不一致是当前 AI 对齐领域一个值得深挖的开放问题。Meta 表示这不影响此次发布决策但会持续研究。AI 军备竞赛下半场Meta 正式入局Muse Spark 不是 Llama 的5.0而是 Meta 在 AI 战略上的一次真正转型——从开源大模型供应商迈向有能力自研顶级推理模型的科技巨头。更重要的是这只是 Muse 系列的第一个模型更大规模的模型正在开发中。Meta 给出的信号很清晰扩展路径已经验证接下来就是踩油门。更多transformerVITswin tranformer 参考头条号人工智能研究所 v号人工智能研究Suo, 启示AI科技动画详解transformer 在线视频教程

更多文章