{{!completeInfo?'请完善个人信息':''}}
Kimi k1.5是一个多模态强化学习模型,其长思考(Long CoT)模式下性能追平OpenAI的o1满血版,短思考(Short CoT)模式下大幅领先GPT-4o和Claude 3.5。这是首次有公司达到OpenAI之外的最高水平。模型通过长到短(long2short)技术优化,显著提升了短思考模式下的性能。
简单出奇迹,首创long2short思维链
1. 长上下文扩展
2. 改进的策略优化
3. 简化框架
短CoT模型的上下文压缩
强化学习基础设施
架构并不限于vLLM,还可以方便地集成其他框架
实验结果
Text Benchmark:MMLU, IF-Eval, CLUEWSC, C-EVAL
Reasoning Benchmark:HumanEval-Mul, LiveCodeBench, Codeforces, AIME 2024, MATH500
思考模型,进入冲刺
原文链接:点击前往 >
文章作者:新智元
版权申明:文章来源于新智元。该文观点仅代表作者本人,扬帆出海平台仅提供信息存储空间服务,不代表扬帆出海官方立场。因本文所引起的纠纷和损失扬帆出海均不承担侵权行为的连带责任,如若转载请联系原文作者。 更多资讯关注扬帆出海官网:https://www.yfchuhai.com/
{{likeNum}}
好文章,需要你的鼓励