Aloha!🌺 认识 Ornith-1.0,这是一个开源大型语言模型家族,专为代理式编码而设计。
Ornith-1.0 涵盖了完整的参数规模,包括 9B Dense、31B Dense、35B MoE 和 397B MoE。它在编码基准测试中达到了与同等规模开源模型相比的最先进性能,包括:✅Terminal-Bench 2.1(77.5)✅SWE-Bench(82.4 on verified, 62.2 on pro, 78.9 on Multilingual)✅NL2Repo(48.2)✅SWE Atlas(41.2 on QnA, 42.6 RF, 39.1 TW)✅ClawEval(77.1)
Ornith-1.0 在 gemma4 和 qwen3.5 基础上进行后训练,采用了一种新颖的自我改进训练策略,其中使用强化学习不仅生成解决方案 rollout,还生成驱动这些 rollout 的任务特定脚手。通过联合优化脚手和由此产生的解决方案,该模型在代理式编码中生成更高质量的解决方案。😎
所有模型均在 MIT 许可下发布,支持完全的商业和研究用途。
📖Tech Blog: 网页链接
