
{{!completeInfo?'请完善个人信息':''}}
3月11日,Manus宣布与阿里通义千问团队达成战略合作,基于通义千问系列开源模型,在国产模型和算力平台上实现Manus的全部功能。这一合作体现了阿里在开源领域的开放心态和对创新项目的快速响应能力。
01
在一系列权威基准测试中,千问 QwQ-32B 模型表现出色,几乎完全超越了 OpenAI-o1-mini,比肩最强开源推理模型 DeepSeek-R1:在测试数学能力的 AIME24 评测集上,以及评估代码能力的 LiveCodeBench 中,千问 QwQ-32B 表现与 DeepSeek-R1 相当,远胜于 o1-mini 及相同尺寸的 R1 蒸馏模型;在由 Meta 首席科学家杨立昆领衔的「最难 LLMs 评测榜」LiveBench、谷歌等提出的指令遵循能力 IFEval 评测集、由加州大学伯克利分校等提出的评估准确调用函数或工具方面的 BFCL 测试中,千问 QwQ-32B 的得分均超越了 DeepSeek-R1。
02
原文链接:点击前往 >
文章作者:极客公园
版权申明:文章来源于极客公园。该文观点仅代表作者本人,扬帆出海平台仅提供信息存储空间服务,不代表扬帆出海官方立场。因本文所引起的纠纷和损失扬帆出海均不承担侵权行为的连带责任,如若转载请联系原文作者。 更多资讯关注扬帆出海官网:https://www.yfchuhai.com/
{{likeNum}}
好文章,需要你的鼓励