扬帆出海APP
微信小程序
{{!completeInfo?'请完善个人信息':''}}
场景和数据,能讲出中国的大模型故事。
关注到大模型能成为蝴蝶的翅膀,全球化移动互联网企业 APUS创始人李涛比许多人早得多。
第一次是在2019年,李涛和字节跳动创始人张一鸣、红杉中国创始人沈南鹏在硅谷见到了OpenAI创始人Sam Altman。Altman通过视频demo向所有人展示了GPT-2操作游戏DOTA2的过程,“很震撼”。
只是那时,所有人都觉得Altman口中“做一个通用人工智能的引擎”的计划太过遥远和模糊,没有人下定决定投这样一家充满理想主义的企业。
第二次,是在多数从业者都能感到的奇点时刻——2022年11月,ChatGPT炸场。彼时,APUS已完成了从“出海”到“全球化”的战略更迭,正全力发展企业的第二曲线。
成立于2014年的APUS,是最早把“出海”的概念带进创投圈的公司之一。基于Launcher桌面系统、清理安全、加速等工具类产品,APUS的用户增长实现了“上线1个月超千万,6个月破亿”的成绩。目前,APUS全球用户量已超24亿,覆盖200多个国家和地区。
“出海”从来都伴随着未知与变数,APUS在高速发展中也受到时局等多重因素影响——被封杀、被打压,是出海企业难以规避的“漩涡”。“社会政治环境以及国际格局对企业的影响还是很大的,我们没有能力阻挡这种冲突所带来的影响,这超过了一个创业企业所能够承担的。”李涛坦言。
痛定思痛,自2019年起,APUS将发展战略从“出海”进化为”全球化“,既分散了单一市场风险,弱化了国际关系变化对企业的影响,也为其开拓美国、日本、欧洲以及国内等更大海域带来机遇。
战略的变化透露着思维模式的改变,李涛告诉36氪,APUS面对的是全球竞争者,嗅觉要格外敏锐,动作要足够敏捷,“作为技术驱动型企业,在与全球巨头竞合的过程中,我们一直对技术革新保持极高的关注,还要匹配随时升级迭代产品的能力。”
ChatGPT一经公开,APUS就基于大模型进行了一系列业务改革——1月,APUS所有内部系统已全部接入人工智能,用以提升办公效率;随后,APUS用人工智能对现有的产品进行改造升级——时间比国内年后席卷的热潮提前了近两个月。
APUS创始人李涛。图源:视觉中国
对于中国能否做出下一个ChatGPT,转换思维模式后的李涛也总结出了中国创业者的一套AI打法:小模型领跑,大模型蓄力——这关乎行业资源,也关乎社会价值观。以下是36氪和李涛的对话:
36氪:为什么国内关注到ChatGPT比海外晚了2个月?
李涛:一方面是企业发展战略的问题。因为国内大部分企业关注的都是国内市场,不在海外,所以敏感度不是很高。
另一方面是价值观的问题。2019年我在美国硅谷见到Sam Altman,那个时候他刚从YC孵化器的总裁位上退下来,决定专心做OpenAI。他当时和我们说自己要做一个“人工智能的通用引擎”,但是没有人理解。我觉得中国很多科技企业的想象力都被商业化给扼杀掉了,这个本质上是中国社会对“钱”的态度问题,很多投到企业上的钱都追求回报。
36氪:您觉得价值观如何影响科技走向?
李涛:科技创新常常由商业+价值观同时驱动,马斯克经营企业的时候,绝对有商业的成分在,但他选择做很多事的时候,也受他个人的价值观影响,比如造火箭上太空——在价值观驱动的同时,用商业化的方式来管理和提升效率。
而显然更普遍的科技创新是由商业驱动,在新技术的实用性还没被验证的时候,还没有体现出很强的商业价值的时候,企业以及所有社会层面都很难下决心去推动。
36氪:大模型的实用性目前有得到证明吗?
李涛:这是一个还有待证明的事。
36氪:您觉得发展大模型的必要性在哪?
李涛:虽然大模型的实用性没有被证明,但中国企业也不是完全没有想象力。我们目前已经看到了商业价值的端倪,只是还没办法评估。
大模型的核心价值其实就在于:当它的算力足够多、数据量足够大、算法足够丰富的时候,就能用来辅助训练各种各样的中模型和小模型。
小模型的能力来源有三个,一是基于特定场景的数据从0训练,二是基于中模型用疼场景数据训练,三是基于大模型。这么区分的原因是因为三者所需的算力成本不一样。比如人脸识别是一个小场景,所需的参数很少,用人脸数据直接从0训练的成本不高,就不需要大模型辅助。
虽然基于大模型训练要的算力成本高,但相对而言准确定也更高,能够应用于更多场景。举个简单的例子,北京交通拥堵的问题80%的原因不在于车多,而在于交通系统的配合程度低。红绿灯的位置、不同路口亮灯的时长、灯与灯之间的配合,在大模型出现之前,这些海量的交通数据是难以处理的,相应的问题也很难得到解决。但有了大模型,这些交通规划的问题就能被解决。
36氪:价值观的问题需要时间去改变,当下国内企业能否发挥能动性,推动大模型的发展?
李涛:刚才我们聊的是理想主义的培养,但从商业化的现实角度来讲,我觉得国内人工智能落地有4步走:内部提效工具、现有产品进化,AI+场景重塑、构建新产业引擎。
第一步是内部提效工具。从今年1月份开始,APUS所有的内部系统全都接入了人工智能来提升效率。我们投喂了自己历史上的业务数据。现在所有业务的自动化投产都是实时的,每一秒钟花了多少钱、赚了多少钱、增长了多少用户,都是典型的小模型应用场景。
第二步现有产品进化,也就是用人工智能来改造我们现有的一些产品。在结合人工智能、和用户频繁产生交互的工程中,就能找到新的场景和服务,这就是第三步AI+场景重塑。第四步也有一些普惠的意思,公开成熟模型的API,助力产业发展。
36氪:对中国创业者来说有么有比较好的切入点?
李涛:英伟达A100的芯片也好、大的算力也好,客观来讲是要花十年的时间追赶的部分。但这也不是绝对的。举个例子,Meta做过一个测试,130B参数的模型输出的结果有时比超过1750亿参数的GPT-3要好,原因是小模型的算法更强。
所以模型的优化本质上是基于算法的优化。模型的4要素是数据、场景、算法、算力。中国有数据有场景,就能把模型的算法打磨出来。算力是短时间只能难以追上的,那就先把前3个要素拿在手里。
36氪:现阶段算力的问题怎么解决?
李涛:我觉得中国应该先建立起中模型和小模型,在各个场景上先使用起来。换句话说,在先进科技面前我们不要掉队,这非常重要。
要意识到,落到具体场景是需要中模型和小模型来支撑的。现阶段中国不能完全没有自己的模型,换句话说中国人做场景服务,不能直接用别人的大模型,一是成本高,二是牵涉数据安全。
但海外公司的算力,是可以帮助中国公司来训练小模型的。比如说基于GPT,中国的企业可以先对一些场景进行可行性的验证,在AI能够跑通的场景,我们再用自己的数据去训练,那试错成本就会降低。
还有一点,我觉得是需要联合社会政府力量一起来做的。在风口中很多公司决定做模型,我们需要从正反两面看待这个现象。一方面,这个热潮对行业价值观和社会认知的培养是好事;另一方面,太多人入局也会造成算力资源的分散。
中国现在的问题是基础设施和企业剥离,企业的设施基本上是针对业务商业化来做的,而国家也有大量的超算中心,但是两边的资源没有打通。所以喊口号是没用的,要做好资源整合才能做行业发展的后盾。
所以,只要积极结合社会发展的特点,人工智能行业在中国就不存在跑不通的现象。
原文链接:点击前往 >
文章作者:周鑫雨
版权申明:文章来源于36氪。该文观点仅代表作者本人,扬帆出海平台仅提供信息存储空间服务,不代表扬帆出海官方立场。因本文所引起的纠纷和损失扬帆出海均不承担侵权行为的连带责任,如若转载请联系原文作者。 更多资讯关注扬帆出海官网:https://www.yfchuhai.com/
{{likeNum}}
好文章,需要你的鼓励