扬帆创投微信小程序
更聚焦的出海投融资平台
精准高效领先的融资对接服务
微信扫一扫进入小程序

2025年开局,大模型领域出现诸多变化。零一万物退出超级大模型训练场景转型商业化,Kimi背后公司陷入股权纷争,国内AI“六小虎”面临新拐点。此前OpenAI转型盈利致核心人员离职,Anthropic获亚马逊和谷歌注资。大模型是少数人竞技场,会大浪淘沙,让从业者找准市场位置,提升资源和技术产出价值,过往在AI+云计算有积累的公司获先发优势,“AI云”应运而生。

摘要

 

2024年,阿里云在AI云战略下对大模型、AI应用开发、AI基础设施集中迭代升级。通义开源模型成世界第一模型群,阿里云坚持开源路线,推出多款开源大模型,降低使用门槛,构建繁荣生态。其全尺寸、多模态模型家族丰富落地场景,大参数模型提升能力天花板,小参数模型补足智能终端场景,实现端云协同。

 
2024年阿里云实现多项技术突破,如Qwen系列模型的多次更新升级,通义万相发布视频生成模型等。通义大模型已接入30万企业客户,涵盖各行业。在AI基础设施方面,阿里云推出OpenLake解决方案、多模数据管理平台DMS等,满足企业综合性需求。PAI训推一体调度引擎上线,实现灵活高效的异构资源管理。

 
大模型领域从拼训练转向推理和应用落地,企业对算力、多模态数据处理等要求提升。阿里云提前布局,百炼平台提供丰富模型接口与易用工具,降低使用成本,提升便捷度。其AI应用链路全栈可观测,数据安全防护体系完善,从客户侧获得需求反哺平台。

 
AI云是面向企业AI落地需求全栈升级的云,是云计算在AI时代的延伸,正席卷全球AI领域引领变革。阿里云作为推动AI云趋势变革的重要力量,十几年来秉承初心持续提升技术实力和创新能力,其产品技术创新从2009年飞天云计算操作系统问世起步,如今迎来AI的“飞天”时刻,王坚院士认为人工智能和云计算结合将带来云计算的第三次浪潮。

 

全球大模型的发展犹如大江奔流,局部掀起一朵浪花很快就被潮涌覆盖。

 

2025年开局已经传递出一种焦虑:零一万物退出超级大模型训练场景,转型考虑商业化可能性。Kimi背后公司陷入股权纷争。国内AI“六小虎”从百模大战中突围后,不得不再次面临新的拐点。更早前,OpenAI转型盈利方向,出现核心人员集中离职;而本身就是OpenAI离职高管创办的Anthropic连续获得亚马逊和谷歌大手笔注资……

 

大模型终究是少数人的竞技场。这一过程会大浪淘沙,让从业者逐渐找准各自的市场位置,提升资源消耗和技术的产出价值。那些在公共云时代依靠自研积累起技术宝藏的公司,那些有全栈创新思维的公司,将在新时期赢得先发先机。这一预判也得到IDC研究机构的认可:过往在AI+云计算领域有双向积累的公司正在获得先发优势。AI时代对云有了新要求,“AI云”应运而生。

 

AI云不是新事物,而是一种技术沉淀与战略思维,也预示AI未来趋势。2024年,阿里云在全球云计算3A格局中取得了多项重要技术突破。过去一年正是它在AI云战略视角下对大模型、AI应用开发、AI基础设施领域集中迭代升级的时期。从当年写下第一行飞天代码就一直坚持自研创新的这家公司,将迎来AI的“飞天时刻。

 

燎原之势后的大模型

图片

 

2024年第三季度末,通义开源模型超过美国Meta公司的Llama,成为世界第一模型群,当时其原生模型和衍生模型总数超过7.4万个。由于衍生模型是在原生数据模型基础上为匹配特定场景所做的调整,衍生模型规模从一定程度上能反映大模型对于开发者的受欢迎程度和应用价值,这也是对阿里云坚持开源的最好回应。

 

在大模型风靡全球的这两年,行业中存在两条泾渭分明的路线,一条是闭源路线,一条是开源路线,阿里云是国内大模型开源路线的绝对信徒,在2023年8月在国内率先加入开源行列后,便沿着全尺寸、全模态方向陆续推出了多款开源大模型。

 

与此同时,2023年云栖大会上释放的一个明确信号就是“打造AI时代最开放的云”。阿里云坚信不开放没有生态,没有生态就没有未来。

 

事实上,通过降低大模型使用门槛,吸引更多开发者和企业用户一起参与和促进技术产品的迭代升级、推动创新效率提升、发现并解决新技术的问题,最终实现技术落地,构建大模型的繁荣生态,更好满足市场灵活化和定制化的需求。这一预判也在当前企业使用多个模型组合应用的趋势上得到印证。

 

与此同时,也只有站在更先进更稳定的技术能力之上,才有开放的底气。通义开源模型不断进取迭代,仅2024年一年就实现了三次重要更新。

 

2024年2月,Qwen1.5开源了包括6种不同规模的Base和Chat模型,并在多项基准测试中展示了卓越的语言理解、推理能力及多语言处理性能,尤其在长序列支持和人类偏好对齐方面取得了显著进步。随后,4月份又开源了首个千亿级大模型Qwen1.5-110B。

 

6月,Qwen2发布,包含5个尺寸的预训练和指令微调模型。全球著名开源平台Hugging Face的CEO Clem曾在社交平台上将通义QWen2-72B视为“王者”,中国在开源模型中具备统领地位。这是他去年6月份使用300块H100芯片对全球100多个主流开源大模型进行评估后得出的排名。

 

9月,在2024年云栖大会上,阿里云发布了更为强大的Qwen2.5系列,该系列覆盖了从0.5B到72B的不同参数规模的语言模型,可适应不同复杂度的任务及应用场景需求;并推出了针对编程的Qwen2.5-Coder和针对数学的Qwen2.5-Math 模型。其中旗舰模型Qwen2.5-72B性能超越Lama 405B。

 

图片

 

同样在云栖大会上,通义万相也迎来升级,发布了全新的视频生成模型,可生成影视级高清视频。继文生文和文生图后,文生视频、图生视频的需求增多,在影视制作、动画设计、广告设计领域的应用扩大了AI生产力的范围。在最新的升级中,通义万相2.1视频生成模型解决了在复杂物理场景中肢体运动扭曲的难题,即便是游泳、花样滑冰、跳水等运动视频里也能保持肢体协调。

 

阿里云通过全尺寸、多模态的模型家族提供的灵活性,进一步丰富了模型落地场景。一方面,千亿级参数的模型能尽可能提升模型能力的天花板,另一方面小参数的模型,诸如Qwen-1.8B可以补足智能终端落地的诸多场景,为以大训小,端云协同提供更多可能。

 

在刚刚结束的2025 CES(国际消费电子展)上可以看到,包括AI伴侣、AI耳机、AI眼镜、AI手杖、AI投篮机等AI硬件新物种百花齐放,各类应用场景的机器人产品也是一大亮点,车企及产业链公司在智驾前沿技术上也大秀肌肉。

 

AI给终端设备带来全新想象空间,也面临诸多挑战。边缘智能场景下,从端侧发起的AI模型调用需求越来越多,但端侧设备在算力、功耗、成本上不具备优势,就迫使业界将模型小型化、蒸馏模型,并催生边缘智能体、云+端协同的演进。

 

过去一年,通义大模型基于端云架构已服务汽车、手机、PC、电视、教育硬件、穿戴硬件等千行百态智能终端,实现AI能力进化。在这背后,是通义提供大模型端云架构,通过异构算力适配、多源模型供给、端云平台协同、全链路安全保障,全面支撑千行百态智能终端各类AI应用。

 

近日,雷鸟创新正式发布雷鸟V3 AI拍摄眼镜。这款新品上搭载了其与阿里云通义共同打造的业内首个专门面向智能眼镜的AI大模型。这是国内首个大模型与AR眼镜硬件厂商开展的深度定制合作。基于通义系列大模型底座,双方设计了整体多模态交互架构,定制化开发“云+端”模型,帮助产品实现高响应、低延迟、高质量的多模态AI交互体验。

 

这些硬件智能场景常常需要将推理请求转发到终端设备之外进行,对推理能力本身和云端协同通信提出更高要求。2024年11月,阿里云通义团队发布全新AI推理模型QwQ-32B-Preview, 并同步开源,在百炼、Hugging Face等平台可用。据评测数据显示,预览版本的QwQ已展现出研究生水平的科学推理能力,它在数学和编程方面表现尤为出色,在国外社交媒体上赢得业内赞誉。这是阿里云首个开源的AI推理模型。

 

回顾大模型领域两年来的发展,通义千问不是最早的,却在能力上后来居上。从2023年第二季度对外揭晓,随即接入钉钉触达用户,到第三季度正式上线,并在随后快速完成多模态产品布局。

 

据公开数据显示,目前通义大模型已接入30万企业客户,包括中国一汽、三得利(中国)、携程、喜马拉雅、微博、联想等知名企业。在互联网客户之外,工业生产领域对通义大模型的需求增加是一个亮点。其中,传统企业对于通义灵码的依赖性在增强。

 

自上线一年来,通义灵码已累计为程序员生成超10亿行代码,也使得阿里云成为目前唯一进入AI代码助理魔力象限中 “挑战者”象限的中国科技企业。1月,通义灵码正式发布AI程序员,成为全球首个同时支持VS Code、JetBrains IDEs开发工具的AI程序员。

 

回看通义大模型一路迭代,技术创新和规模效应主导了这一过程,坚持开源开放、全尺寸多模态、AI工程化的方向让通义千问在全球大模型中脱颖而出。

 

向AI原生时代迁跃

图片

 

如文章开头所述,零一万物将与阿里一起成立“产业大模型联合实验室”,并将涉及相关人员划拨。此前的资金链紧张、被大厂收购等一系列传闻已被该公司创始人站出来澄清。

 

这不仅反映出大模型初创公司的整体处境与审时度势,也说明生成式AI市场需求的务实特点,一味卷大模型、消耗大量资源最终还是要回归到用户需求和成本收益综合考量上。一线云厂商也纷纷在开发应用平台层面开展了军备竞赛。

 

2024年5月,阿里云百炼2.0发布,从模型开发、应用开发到算力底座全面升级。“当下企业应用大模型存在三种范式:一是对大模型开箱即用,二是对大模型进行微调和持续训练,三是基于模型开发应用,其中最典型的需求是RAG,以企业数据对大模型进行知识增强。围绕这些需求,百炼打造了模型中心和应用中心,提供最丰富的模型和最易用的工具箱。”阿里云智能集团首席技术官周靖人介绍。例如,针对当下企业最关注的RAG链路,百炼提供灵活开放的企业级检索增强服务,5到10行代码即可搭建RAG应用,让大模型拥有“最强外挂”。

 

图片

 

在亚马逊AWS最大的年度峰会上,有关AI应用开发托管平台Amazon Bedrock的动态已连续两届成为大会上最受关注的焦点,风头和戏份甚至盖过了基础模型和自研推理芯片等发布。这说明,全球厂商已深刻意识到,随着生成式AI逐渐改变越来越多企业业务,推理将成为每个应用的核心部分,客户开发者迫切需要平台释放更多便捷的功能,平台能力受到市场检验。

 

比如模型幻觉是全球厂商目前着力解决的问题一环。所谓模型幻觉是模型生成的内容与现实世界事实或用户输入不一致、甚至误导性倾向的现象,大多产生在原始数据、模型训练、推理流程中。模型幻觉是整个行业面临的一个根本挑战,特别是在金融、政务、医疗等强监管行业中,会限制客户对生成式AI的信任。对此,流程上的监测、自动化检查等措施被引入平台。

 

阿里云此前已实现AI应用链路全栈可观测,业内领先的多层级Trace体系具备完善的监控告警机制。全新AI原生全栈可观测平台首次实现了云上AI大模型从训练到推理再到应用的全链路实时观测、告警与诊断。阿里云可观测产品家族同步实现全新升级,最常用的日志服务SLS 相较于自建体系运维监控综合成本可降低30%。

 

去年,阿里云升级了全新的大模型全生命周期的安全防护体系。在数据的采集、模型设计、训练、评测、部署和使用阶段都提供了丰富的安全产品,既包括在模型生成阶段的内容安全产品,也有数据安全中心、数字水印等数据安全产品。

 

为了实现对数据安全的保护,阿里云基于百炼平台,设计实施了一系列数据安全防护方案,包括专有网络访问通道、Prompt 加密、数据存储、应用层传输加密,以及存储加密等方式方法,确保企业数据安全。

 

这些技术在客户侧的应用正积极推进,反过来也在不断从客户侧获得宝贵的需求反馈,反哺平台。作为一个为AI开发者提供丰富的模型接口与易用工具的平台,百炼自发布一年多以来已历经数次重要迭代。当厂商意识到未来卷的不再是基础模型而是应用层面时,可发现百炼真正是在提前布局,解决用户在AI发展中的需求。

 

开发平台的演进方向是在提升用户便捷度的前提下降低用户使用成本。像百炼新近增加的Context Cache功能,针对在使用文本生成模型时,不同的推理请求之间可能会有重合的输入内容这类场景,通过缓存重复性输入大量数据,对于公共上下文仅收取一次费用,经测算最高可节省90%的成本;同时在Context Cache对这些请求的公共前缀内容进行缓存后,可在推理时减少重复运算量,显著提升模型响应速度。

 

Amazon Bedrock新增的提示词缓存技术与此理念类似,也是针对批量处理推理问题时减少重复的场景,比如一家律师事务所创建的生成式AI聊天应用程序,用于回答律师有关文本的问题。类似的还有Anthropic API上推出的Prompt Cache功能。可见,大厂间都在着眼于在细微的用户体验上做不断改善。

 

AI基础设施竞赛升级

图片

 

在基础模型快速迭代和应用开发逐渐深入背后,一个转变正在悄然发生。

 

生成式AI时代不再仅仅是大模型训练能力的内卷,一方面资源消耗压力会让一些角色逐渐掉队,另一方面比“拼卡”更重要的是工程化落地的能力,需求已经从模型训练转向模型推理和AI应用落地。这需要有自己的一套技术架构和范式,更需要紧贴客户需求,在包括基础模型、应用开发和AI基础设施在内的完整体系和生态上均有过硬实力与市场洞察。

 

图片

图片系AI生成

 

当前,企业对大规模算力需求增加。“在新增算力市场上,超过50%的新需求由AI驱动产生,AI算力需求已经占据主流地位。这一趋势还会持续扩大。过去一年,阿里云投资新建了大量的AI算力,但还是远远不能满足客户的旺盛需求。”阿里巴巴集团CEO、阿里云智能集团董事长兼CEO吴泳铭在云栖大会上说。

 

无疑,AI对基础设施提出了更严苛的新要求,这也是眼下最卷的一条赛道,像算力、成本、时延、安全等,时代在推着云厂商不松懈地往前跑。大厂从自研推理芯片到数据平台、网络架构都在针对AI进行优化升级,改变是全栈式的,不光在与同行赛跑,还要和用户需求赛跑。

 

同时,企业越来越注重AI应用落地,对多模态数据(包括结构化、半结构化和非结构化数据)处理能力要求进一步提升。但具体来看,客户需求并不完全相同:有的企业业务复杂、数据量大,需要从微调训练等早期阶段开始定制化开发,与AI技术深度融合;也有企业则更倾向于轻量化推理,实现业务流和数据流的结合,简化数据库管理、提升数据治理水平。

 

面对企业当前的综合性需求,阿里云推出了OpenLake解决方案,可以实现整合大数据处理、AI分析以及多模态数据管理一体化,显著降低数据管理和分析的复杂性,并加速从数据中提取价值的过程。

 

具体来说,OpenLake基于OSS的统一存储,使用Metadata Service (Data LakeFormation)统一纳管结构化、半结构化和非结构化的多模态数据,提供对湖仓表和数据文件的安全访问以及IO加速。向上,提供对大数据搜索和人工智能平台的多引擎对接,包含流、批、增量、搜索多样化计算支持,实现引擎平权的联合计算,满足秒级到小时级数据处理能力。最后,基于Dataworks Notebook的一站式SQL与Python开发,让数据与模型训练的工作流无缝连接。

 

而数据库系统也在进一步顺应AI时代的数据管理需求,让多模处理和实时分析能力像搭建积木一样易用、好用。为此阿里云发布了由Data+AI驱动的多模数据管理平台DMS,创新设计了统一、开放、跨云的元数据服务OneMeta及DMS+X的多模联动模式OneOps。

 

其中,OneMeta首次打通不同数据系统,可支持全域40+种不同数据源,支持他云、自建数据源无缝对接,提供数据血缘和数据质量的一站式Data+AI数据治理。OneOps则可实现DMS+X的多模联动模式,将X( 即云原生数据库PolarDB、云原生数据仓库AnalyticDB、云原生多模数据库Lindorm等多样化的数据存储、分析、计算、AI引擎)集结到统一平台进行一站式数据和模型任务编排。数据显示,DMS可为客户降低高达90%的数据管理成本,使业务决策效率提升10倍。

 

为进一步实现灵活高效的异构资源管理,阿里云上线了PAI训推一体调度引擎,即一体化的智算管理与调度系统PAI Serverless引擎。它是一个集本地训练、云端训练和端侧验证部署于一体的一站式工作流,最高可扩展10万卡,有效算力利用率超90%。不难看出,开放与一站式一直是阿里云AI基础设施搭建过程中的理念坚持。

 

业界已经强烈感受到,大模型的到来以及生成式AI的场景落地使人工智能的发展明显提速,其发展节奏对比主要以机器学习为主的AI 1.0时期,要快得多。前期技术储备不足的公司已出现掉队或调整倾向,一直坚持技术创新的公司方能适应、引领这个节奏。

 

中国工程院院士、阿里云创始人王坚认为,人工智能和云计算的结合会带来云计算的第三次浪潮,它不会在一年、两年完成,它可能会在十年、几十年里让足够多的创新在云计算时代诞生。如今新的浪潮已来。

 

基础大模型、AI应用开发、AI基础设施共同构成了AI云,而AI云正是面向企业AI落地需求全栈升级的云,更是云计算在AI时代的延伸。这样的新趋势正在席卷全球AI领域,引领一场新的变革。

 

2009年飞天云计算操作系统问世,掀开了中国云计算的第一页,阿里云产品技术创新以此为起点,十几年间秉承初心,持续提升技术实力和创新能力,已经成为推动AI云趋势变革的重要力量。

原文链接:点击前往 >

文章作者:钛媒体

版权申明:文章来源于钛媒体。该文观点仅代表作者本人,扬帆出海平台仅提供信息存储空间服务,不代表扬帆出海官方立场。因本文所引起的纠纷和损失扬帆出海均不承担侵权行为的连带责任,如若转载请联系原文作者。 更多资讯关注扬帆出海官网:https://www.yfchuhai.com/

{{likeNum}}

好文章,需要你的鼓励

请前往扬帆出海小程序完成个人认证
认证通过后即可申请入驻
扫码添加小助手
微信扫描二维码,添加小助手
微信号:yfch24
扫码添加小助手
微信扫描二维码,添加小助手
微信号:yfch24
APP
小程序
微信公众号
微信小程序
扬帆出海APP
扬帆出海APP
微信
公众号
微信公众号
关注扬帆出海
专注服务互联网出海!
出海人
社群
微信公众号
扫码进群
与10万+出海人同行!