比肩DeepSeek!美团发布首个开源大模型 总参数560B

2025-09-01 17:40:02    来源:新经网    作者:冯思韵
很多朋友不知道【比肩DeepSeek!美团发布首个开源大模型 总参数560B】,今天小绿就为大家解答一下。

版权所有,未经许可不得转载

  美团官方称,根据多项基准测试综合评估,作为一款非思考型基础模型,LongCat-Flash-Chat在仅激活少量参数的前提下,性能比肩当下领先的主流模型,尤其在智能体任务中具备突出优势。并且,因为面向推理效率的设计和创新,LongCat-Flash-Chat具有明显更快的推理速度,更适合于耗时较长的复杂智能体应用。

  在通用领域知识、智能体(Agentic)工具使用、编程、指令遵循等方面,该模型的测试成绩在与DeepSeek V3.1、GPT-4.1、Kimi K2、Qwen3 MoE-2507等模型的对比中表现出色。

  今年以来,美团发布了AI Coding Agent工具NoCode、AI经营决策助手袋鼠参谋、酒店经营的垂类AI Agent美团既白等多款AI应用。美团曾表示,AI战略会建立在三个层面:AI at work、AI in products以及Building LLM,此次模型开源是其Building LLM进展的首度曝光。

  据CNMO了解,LongCat-Flash采用创新性混合专家模型(Mixture-of-Experts, MoE)架构,总参数为560B,激活参数18.6B至31.3B,平均为27B,实现了计算效率与性能的双重优化。

  【CNMO科技消息】9月1日,美团在官方社交媒体正式发布LongCat-Flash-Chat,并同步开源。


以上问题已经回答了。如果你想了解更多,请关新经网网站 (https://www.xinhuatone.com/)
郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。