月之暗面发布Kimi K2.6并开源 代码能力持平GPT-5.4

2026-04-21 09:40:01    来源:新经网    作者:冯思韵
很多朋友不知道【月之暗面发布Kimi K2.6并开源 代码能力持平GPT-5.4】,今天小绿就为大家解答一下。

  Kimi K2.6是迄今最强的代码模型,其长程编码能力显著提升,在测试中可以不间断编码13小时,编写或修改超过4000行代码,完成复杂系统的开发和优化。在Kimi内部严格代码评测基准Kimi Code Bench中,K2.6的成绩比K2.5提升了约20%。实测中,K2.6成功在Mac本地部署了Qwen3.5-0.8B模型,经过4000多次工具调用、超过12小时不间断运行,将吞吐量从约15 tokens/s提升至约193 tokens/s,最终实现比LM Studio快20%的推理速度。

Kimi

  Kimi K2.6现已面向所有免费用户、付费订阅用户、Kimi Code和企业API用户开放。为庆祝K2.6模型API上线,Kimi开放平台同步开启了最高30%的限时充赠活动。

月之暗面发布Kimi K2.6并开源 代码能力持平GPT-5.4

  Kimi K2.6还大幅增强了Agent自主化执行能力。由K2.6模型驱动的“Agent集群”架构迎来大升级,现在支持300个子Agent并行完成4000个协作步骤,实现更大规模的并行化,任务完成度和交付质量相比K2.5有显著提升。针对OpenClaw、Hermes Agent等主动式Agent框架,K2.6展现出极强的自动化任务处理能力,支持长达5天的持续自主运行。基于K2.6的Agent实现了连续5天自主运行,负责监控、故障响应和系统运维。Kimi内部的Claw Bench测试结果显示,K2.6相比K2.5综合性能提升了10%。

  【CNMO科技消息】近日,月之暗面Kimi正式发布并开源Kimi K2.6模型,全面精进代码、长程任务执行和Agent集群能力。Kimi K2.6现已上线kimi.com、最新版Kimi应用、Kimi API和Kimi Code编程助手,所有用户均可使用。

  在另一项测试中,K2.6自主完成了对拥有8年历史的开源金融撮合引擎exchange-core的深度重构,历经13小时连续作业,迭代12套优化策略,通过1000余次工具调用对4000多行代码进行了精准修改,实现了185%的中位吞吐量跃升。

  借助K2.6更强的代码和视觉理解能力,Kimi Agent模式支持创建和调用技能,系统已内置上百个官方推荐技能,包括Kimi内部专家团队创建的投研技能包。Kimi还开启了小范围内测的“Claw群组”,目标是拥抱开放、异构的生态,多个Agent与人类作为真正的协作者共同运行。在“Claw群组”中,K2.6担任协调者,根据Agent的技能画像和可用工具动态匹配任务,实现能力的最优配置。

  Kimi K2.6的通用Agent、代码、视觉理解等综合能力得到全面提升,在博士级难度的完整版“人类最后的考试”(Humanity‘s Last Exam)、考察模型真实软件工程能力的SWE-Bench Pro、评估Agent深度检索能力的DeepSearchQA等基准测试中均取得行业领先的成绩,持平或优于GPT-5.4、Claude Opus 4.6和Gemini 3.1 Pro等闭源模型。

Kimi

版权所有,未经许可不得转载


以上问题已经回答了。如果你想了解更多,请关新经网网站 (https://www.xinhuatone.com/)
郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。