年包70万挖人、出海精准撒钱，中国公司与Sora短兵相接

腾讯、字节、快手、阿里、百度等国内互联网大厂已齐聚AI视频市场，同时，许多大模型创企和中小技术厂商也在积极加入这一赛道。

摘要

腾讯混元大模型正式上线视频生成能力，并宣布开源，这是当前最大的视频开源模型。此外，图森未来发布“Ruyi”图生视频大模型，并开源Ruyi-Mini-7B版本。

国内AI视频生成工具在追赶OpenAI Sora的同时，也在探索自己的技术优势和商业化路径。Sora的开放使用推动了视频生成技术向Diffusion与Transformer路线的收敛。

国内AI视频生成工具开始探索商业化变现，包括会员付费体系、API服务等。快手可灵AI等平台通过B2B销售自动化工具在多平台进行投放，探索增长策略。

尽管技术进步迅速，但视频生成模型的商业化落地仍然充满挑战。百度李彦宏对此类模型的商业化前景持谨慎态度，认为投入周期太长，可能长时间内难以获得业务收益。

“类Sora”开启年末团战

时至年末，喧嚣已久的国内AI视频生成市场不仅没有将息之势，还卷起了新的高潮：

12月4日，腾讯混元大模型正式上线视频生成能力，继文生文、文生图、3D生成功能之后，又补全了一块功能版图。同日腾讯宣布将开源该视频生成模型，这也是当前最大的视频开源模型。

至此，国内互联网大厂腾讯、字节、快手、阿里、百度已在AI视频市场齐聚。

不仅如此，不少大模型创企和中小技术厂商，也仍在奋力挤上AI视频这条已显密集的大模型应用赛道。

11月底，曾有消息称大模型创企月之暗面正在内测AI视频生成功能“Kimi创作空间”，并计划在正式上线后为用户提供每天免费生成100秒个性化视频的“福利”功能。

而在12月17日，智能驾驶企业图森未来也官宣发布“Ruyi”图生视频大模型，并将Ruyi-Mini-7B版本开源，允许用户从huggingface上下载使用。

“追赶Sora的窗口期，也就是在OpenAI由于受到成本等因素影响，尚未推动Sora大规模落地应用的这几个月。”AIGC视频市场创业者柳橙向「凤凰网科技」分享了他对市场的判断。多位从业人士也向凤凰网科技讲道，大约一年的窗口期是业内的某种共识。

而曾惊艳四座的OpenAI Sora已在12月10日凌晨正式开放使用，这从某种程度上，解释了近期国内类Sora工具冲刺亮相的原因。

而Sora的亮相，也推动着视频生成的底层技术架构向Diffusion与Transformer路线收敛，让国产AI视频生成工具能够快速走完需求定义、产品研发的路径。

如果将时间线拉至更长范围，更容易感知到2024年国内AI视频生成市场所呈现的井喷态势：

上半年，1月下旬，百度相关团队发布了视频生成模型UniVG；3月底，字节跳动旗下“即梦AI”平台内测，并在5月开放网页版；4月27日，清华系Vidu发布了具有“长时长、高一致性、高动态性”性能标签的同名视频大模型 Vidu；6月6日，快手“可灵”视频生成大模型官网正式上线。

迈进下半年的7月4日，商汤科技发布人物视频生成大模型Vimi；7月6日，智谱AI上线视频生成模型“清影”；9月19日，阿里云发布通义万相视频生成模型；9月24日，字节跳动接连发布豆包视频生成-PixelDance、豆包视频生成-Seaweed，并面向企业市场开启邀测……

据凤凰网科技不完全统计，目前国内市场上已有20余款AI视频生成工具同台竞技。

AI应用的火热，也带动着从业生态的蓬勃。一名AI领域猎头告诉「凤凰网科技」，如今快手字节等大厂，为视频生成算法工程师开出的年薪总包上限可达70万。“如果有顶会顶刊，或者相关产品经验，还有一定的上浮空间可以谈，这在整个市场里看都是非常可观的”。

上半场：国产“文生视频”追击Sora的10个月

在国内某家大厂文生视频研发团队工作的李日一认为，从Sora亮相到发布的10个月里，“不断追赶与对标”堪称整个国内视频生成市场的主旋律。

而在12月10日凌晨观看完Sora正式发布后，他却“松下了一口气”：“通过自己试用以及看网上大家分享的生成结果，说实话（对Sora的表现）感觉还是有些失望的，也感到庆幸。”

他回忆道，2024年2月份的春节假期中，以一支“皮衣女走过东京街头”demo视频宣告存在的Sora曾让其感受到“惊艳的代差感”；但等到Sora真正公开发布，却没有带来同样的冲击：“这也是好事，说明我们起码不会再是一个措手不及的状态，当然Sora仍然有值得敬佩的地方，但在文生视频这方面，我们也树立了一些自己的优势。”

如李日一所言，在国内的舆论场中，对Sora生成效果仍有瑕疵、国内模型部分指标更胜一筹的讨论并不鲜见，但由此带来的轻松感持续得并不长久。

12月17日凌晨，谷歌旗下AI研究实验机构DeepMind官宣，推出对标OpenAI Sora的视频生成模型“Veo 2”，以及图像生成模型“Imagen 3”。