{{!completeInfo?'请完善个人信息':''}}
腾讯、字节、快手、阿里、百度等国内互联网大厂已齐聚AI视频市场,同时,许多大模型创企和中小技术厂商也在积极加入这一赛道。
摘要
腾讯混元大模型正式上线视频生成能力,并宣布开源,这是当前最大的视频开源模型。此外,图森未来发布“Ruyi”图生视频大模型,并开源Ruyi-Mini-7B版本。
国内AI视频生成工具在追赶OpenAI Sora的同时,也在探索自己的技术优势和商业化路径。Sora的开放使用推动了视频生成技术向Diffusion与Transformer路线的收敛。
国内AI视频生成工具开始探索商业化变现,包括会员付费体系、API服务等。快手可灵AI等平台通过B2B销售自动化工具在多平台进行投放,探索增长策略。
尽管技术进步迅速,但视频生成模型的商业化落地仍然充满挑战。百度李彦宏对此类模型的商业化前景持谨慎态度,认为投入周期太长,可能长时间内难以获得业务收益。
“类Sora”开启年末团战
时至年末,喧嚣已久的国内AI视频生成市场不仅没有将息之势,还卷起了新的高潮:
12月4日,腾讯混元大模型正式上线视频生成能力,继文生文、文生图、3D生成功能之后,又补全了一块功能版图。同日腾讯宣布将开源该视频生成模型,这也是当前最大的视频开源模型。
至此,国内互联网大厂腾讯、字节、快手、阿里、百度已在AI视频市场齐聚。
不仅如此,不少大模型创企和中小技术厂商,也仍在奋力挤上AI视频这条已显密集的大模型应用赛道。
11月底,曾有消息称大模型创企月之暗面正在内测AI视频生成功能“Kimi创作空间”,并计划在正式上线后为用户提供每天免费生成100秒个性化视频的“福利”功能。
而在12月17日,智能驾驶企业图森未来也官宣发布“Ruyi”图生视频大模型,并将Ruyi-Mini-7B版本开源,允许用户从huggingface上下载使用。
“追赶Sora的窗口期,也就是在OpenAI由于受到成本等因素影响,尚未推动Sora大规模落地应用的这几个月。”AIGC视频市场创业者柳橙向「凤凰网科技」分享了他对市场的判断。多位从业人士也向凤凰网科技讲道,大约一年的窗口期是业内的某种共识。
而曾惊艳四座的OpenAI Sora已在12月10日凌晨正式开放使用,这从某种程度上,解释了近期国内类Sora工具冲刺亮相的原因。
而Sora的亮相,也推动着视频生成的底层技术架构向Diffusion与Transformer路线收敛,让国产AI视频生成工具能够快速走完需求定义、产品研发的路径。
如果将时间线拉至更长范围,更容易感知到2024年国内AI视频生成市场所呈现的井喷态势:
上半年,1月下旬,百度相关团队发布了视频生成模型UniVG;3月底,字节跳动旗下“即梦AI”平台内测,并在5月开放网页版;4月27日,清华系Vidu发布了具有“长时长、高一致性、高动态性”性能标签的同名视频大模型 Vidu;6月6日,快手“可灵”视频生成大模型官网正式上线。
迈进下半年的7月4日,商汤科技发布人物视频生成大模型Vimi;7月6日,智谱AI上线视频生成模型“清影”;9月19日,阿里云发布通义万相视频生成模型;9月24日,字节跳动接连发布豆包视频生成-PixelDance、豆包视频生成-Seaweed,并面向企业市场开启邀测……
据凤凰网科技不完全统计,目前国内市场上已有20余款AI视频生成工具同台竞技。
AI应用的火热,也带动着从业生态的蓬勃。一名AI领域猎头告诉「凤凰网科技」,如今快手字节等大厂,为视频生成算法工程师开出的年薪总包上限可达70万。“如果有顶会顶刊,或者相关产品经验,还有一定的上浮空间可以谈,这在整个市场里看都是非常可观的”。
上半场:国产“文生视频”追击Sora的10个月
在国内某家大厂文生视频研发团队工作的李日一认为,从Sora亮相到发布的10个月里,“不断追赶与对标”堪称整个国内视频生成市场的主旋律。
而在12月10日凌晨观看完Sora正式发布后,他却“松下了一口气”:“通过自己试用以及看网上大家分享的生成结果,说实话(对Sora的表现)感觉还是有些失望的,也感到庆幸。”
他回忆道,2024年2月份的春节假期中,以一支“皮衣女走过东京街头”demo视频宣告存在的Sora曾让其感受到“惊艳的代差感”;但等到Sora真正公开发布,却没有带来同样的冲击:“这也是好事,说明我们起码不会再是一个措手不及的状态,当然Sora仍然有值得敬佩的地方,但在文生视频这方面,我们也树立了一些自己的优势。”
如李日一所言,在国内的舆论场中,对Sora生成效果仍有瑕疵、国内模型部分指标更胜一筹的讨论并不鲜见,但由此带来的轻松感持续得并不长久。
12月17日凌晨,谷歌旗下AI研究实验机构DeepMind官宣,推出对标OpenAI Sora的视频生成模型“Veo 2”,以及图像生成模型“Imagen 3”。
尽管Veo 2还在预约排队阶段,根据官方信息,其熟悉电影拍摄语言以及物理规律,并能生成分辨率高达4K(4096×2160像素)、时长可达2分钟以上的视频。
相形之下,OpenAI Sora最多能生成分辨率高达1080p、时长为20秒的视频。
又一家“宇宙级”大厂秀出文生视频肌肉,将国内的大模型多模态混战,再推至了新的阶段——谷歌预计,到2025年Veo 2将广泛集成至YouTube Shorts等平台。
李日一对「凤凰网科技」解释道,这构成了其紧张感的来源:“不同于OpenAI没有成熟产品,对于谷歌而言,YouTube的商业化管道是通畅的,这意味着Veo 2未来的‘期货变现’之路,甚至模型迭代速度,很可能是很快的,甚至是‘碾压级’的。”
如果说以2月份Sora亮相为开始,市场掀开了一场争夺入局资格的限时赛。那么在大小玩家列队集齐、技术路线已然明晰的当下,如何在商业化端攻城略地,则成了新的难题。
下半场:出海撒钱,抢夺流量,谁能先盈利?
如今不少国产视频生成模型,都已开启对商业化变现的探索。
在这场商业化的战役之中,有玩家试图用曾经在互联网产品上验证过成功的增长策略实现目的。
从7月底开始,快手可灵AI陆续向国内和海外的用户推出了会员付费体系,并在9月底开放了API服务。据快手CEO程一笑于2024年第三季度业绩说明会透露,9月份可灵的月活跃用户数已超过150万,可灵AI单月流水超过了千万人民币。
而据媒体报道,从6月份开始,可灵就开始借助B2B销售自动化工具哈希增长,在X、YouTube、Newsletter等多平台进行投放。据光子星球援引Similarweb估算,从6月24日至9月24日三个月期间,可灵海外投放费用约在33.2万美元,折合人民币约232.4万元。
另据DataEye统计,国内投放市场中,可灵App近30天投放渠道分布以优量汇、QQ音乐、酷狗音乐为主,QQ阅读、欢乐斗地主等紧随其后;而字节即梦App近30天投放渠道聚焦于B站与抖音平台,其中B站为主要渠道。
即梦App、可灵App分别自8月份、11月份上线以来,手机端下载量不断走高。其中即梦大陆市场苹果端最高单日下载量接近3万,可灵最高单日下载量接近1万。
相较深谙互联网增长术的大厂,也有中小玩家选择深耕ToB标杆案例。以生数科技为例,除了建设ToC会员体系、打造垂类应用产品按照订阅等形式收费外,公司还以API的形式向B端机构直接提供模型能力。
据称,目前生数科技已与多家游戏公司、个人终端厂商、互联网平台等B端机构开展合作,开放模型服务,提供AIGC个性化体验、定制化内容生产等方面的能力。
但短时间内,无论B端还是C端市场的探索,都远还没进行到终局。
今年10月份,百度李彦宏就曾在内部讲话中表达过自己对Sora类似应用的不看好,他认为Sora这种视频生成模型的投入周期太长,10年、20年都可能拿不到业务收益,因此“无论多火爆,百度都不去做”。
而视频生成从业者李日一,也表达了自己的思考:“从一开始,国内市场做视频生成就是奔着商业化去的,一边迭代技术一边找落地方向,但在我看来后者比前者更难。”
(因为)这不仅仅是技术比拼,还涉及到人员、资金等等全方位的要素,要试错成本,也需要一点运气。”
“总之,我们还有一场硬仗要打。”他最后讲道。
原文链接:点击前往 >
文章作者:凤凰网科技
版权申明:文章来源于凤凰网科技。该文观点仅代表作者本人,扬帆出海平台仅提供信息存储空间服务,不代表扬帆出海官方立场。因本文所引起的纠纷和损失扬帆出海均不承担侵权行为的连带责任,如若转载请联系原文作者。 更多资讯关注扬帆出海官网:https://www.yfchuhai.com/
{{likeNum}}
好文章,需要你的鼓励