2025年12月24日,字节跳动Seed团队推出新一代形式化数学推理模型Seed Prover 1.5。该模型通过大规模Agentic RL训练,在IMO 2025前5题中16.5小时内生成完整Lean证明,得分35/42,达金牌线;在Putnam 2025中9小时内解决11道题。在历史评测集中,其对Putnam、Fate-H和Fate-X的解题率分别为88%、80%和33%,刷新SOTA纪录。技术报告与代码已公开,后续将开放API。
2025年12月24日,字节跳动Seed团队推出新一代形式化数学推理模型Seed Prover 1.5。该模型通过大规模Agentic RL训练,在IMO 2025前5题中16.5小时内生成完整Lean证明,得分35/42,达金牌线;在Putnam 2025中9小时内解决11道题。在历史评测集中,其对Putnam、Fate-H和Fate-X的解题率分别为88%、80%和33%,刷新SOTA纪录。技术报告与代码已公开,后续将开放API。