扬帆创投微信小程序
更聚焦的出海投融资平台
精准高效领先的融资对接服务
微信扫一扫进入小程序

国产大模型 DeepSeek 在过去两个月席卷全球,因其效果媲美领先的 OpenAI - o1 模型,且推理成本被极致压缩,获 OpenAI 首席执行官 Sam Altman 等多位行业大咖赞美,访问使用量急速上升。

摘要

 

一是使用 DeepSeek 官方服务,但因访问流量大,公司算力配置不足,常出现服务器繁忙提示,影响使用体验;二是使用云供应商服务,如百度云、AWS、阿里巴巴等云厂商提供 DeepSeek V3/R1 服务,还将 DeepSeek 植入自身产品矩阵;三是本地部署 DeepSeek,该方式在隐私、性能、便捷性、控制权及使用周期成本等方面有优势,所以受各地企业、政府和私人青睐。

 
由于 AI 硬件供应商纷纷推出支持 DeepSeek 的产品,尤其是本土芯片公司,开发者面临如何选择硬件的问题。市场上的机器种类繁多,有的仅支持参数量较少的 “蒸馏” 模型单机设备,或需多机协同部署 “满血版”DeepSeek R1,而支持满血版单机部署的设备更珍贵,因单机部署成本低、数据安全、部署快,但需高显存和算力芯片来处理大量数据。

 
昆仑芯是国内少有能支持单机部署满血版 DeepSeek R1 的芯片。昆仑芯(北京)科技有限公司前身为百度智能芯片及架构部,2025 年 2 月 20 日宣布昆仑芯 P800 成首款支持单机部署 DeepSeekV3/R1671B 满血版大模型的国产 AI 芯片。P800 是本土率先支持单机部署满血版 DeepSeek R1 的国产芯,还率先支持 8bit 推理,提供精度无损推理服务,效率高,配置上有 8 卡与 16 卡两种选择,性能、功耗和部署灵活性行业领先。

 
在昆仑芯领先芯片支持下,百度智能云 2 月初成功点亮昆仑芯三代万卡集群,该集群突破硬件扩展性瓶颈,采用创新散热方案,对模型进行分布式训练优化。百度智能云 2021 年推出的百舸异构计算平台已升级到 4.0,为昆仑芯万卡集群提供容错和稳定性机制,确保有效训练率达 98%,还建设超大规模 HPN 高性能网络优化拓扑结构,降低通信瓶颈提高带宽有效性。在公有云服务方面,百度智能云千帆大模型平台提供高性价比 API 调用服务;针对本地部署需求,推出搭载昆仑芯 P800 的百舸、千帆一体机产品,支持单机环境一键部署 DeepSeek R1/V3 全系列模型,其中百舸 DeepSeek 一体机配置领先,能满足高性能训练与推理需求,具有高吞吐、数据处理快、支持多人并发使用、推理延迟低、运维成本低等优势,价格国内最低。

 

过去两个月,国产大模型DeepSeek席卷全球。

 

之所以能够在全球引起如此广泛的讨论,首先因为它拥有了媲美全球领先的OpenAI-o1模型的效果;其次,该模型将推理成本压缩到极致。就连OpenAI 首席执行官Sam Altman在谈到DeepSeek的时候也直言:“DeepSeek R1 是一款令人印象深刻的模型,尤其是考虑到它们的价格。”其他如英伟达CEO黄仁勋、图灵奖得主Yann LeCun和AI科学家吴恩达也对DeepSeek不吝赞美。

 

在自身实力的加持和这些行业领先专家的背书下,DeepSeek的访问量暴涨。现如今,DeepSeek访问使用量急速上升,已经成为目前最快突破3000万日活跃用户量的应用程序。又因为这是一个开源模型,进而催生了很多本地部署的需求。

 

有见及此,各大云厂商和包括芯片公司在内的AI硬件厂商,都开始打造相应的解决方案,为DeepSeek的落地做好充分的准备。

 

图片
图片

DeepSeek落地,三种方式

图片
图片

 

因为本身的特点,市场上的用户使用DeepSeek主要有三种路径:

 

一是使用DeepSeek官方的提供的服务,即是通过其官网或者APP访问。但正如前文所说,因为其访问流量大增,该公司的算力配置目前似乎并不能满足当前的需求,导致频频出现“服务器繁忙,请稍后再试”这样的提示,大大降低了使用体验;

 

二是使用云供应商提供的服务,例如百度云、AWS、阿里巴巴、腾讯云以及华为云等国内外知名的云厂商都提供了DeepSeek V3/R1服务,这些公司甚至还将DeepSeek植入到自己的产品矩阵中;

 

以百度为例,早在2月3号,百度智能云千帆平台就已正式上线满血版本的DeepSeek-R1和DeepSeek-V3模型,提供超低调用价格以及限时免费体验。“百度搜索”在2月16日进一步披露,百度搜索和文心智能体平台宣布将全面接入DeepSeek和文心大模型最新的深度搜索功能。搜索用户可免费使用DeepSeek和文心大模型深度搜索功能,文心智能体平台的开发者也将能随时调用DeepSeek模型创建并调优智能体。

 

三是本地部署DeepSeek。和以上两种通过网络访问DeepSeek的方式不一样,在本地部署DeepSeek不但在隐私上得到了最高维度的保障。在性能表现方面,本地部署可实现微秒级响应,也优于很多网络访问的服务。其他诸如使用的便捷性、控制权,甚至整个系统使用周期的成本,也都是优于前两种。这也正是各地企业、政府甚至私人都在纷纷部署本地DeepSeeK的原因之一

 

于是,对于想要部署本地DeepSeek的开发者来说,如何选择相应的硬件,就成为了他们头疼的问题。因为如上所述,包括芯片厂商在内的AI硬件供应商都在纷纷切入这个赛道,并发布了其产品。尤其是本土的芯片公司,更是纷纷切入这个赛道,争先恐后地推出支持DeepSeek的设备。

 

值得一提的是,当前推出的机器五花八门,当中有不少受限于本身的实力,只推出仅支持参数量较少的“蒸馏”模型的单机设备,或者是通过多机协同部署“满血版”的DeepSeek R1,这时候,能够支持满血版DeepSeek R1的单机设备显得尤为可贵。因为相较于多机部署,单机部署成本更低、数据更安全、部署更快。不过,因为满血版的DeepSeek R1需要处理大量数据,而芯片的算力和显存直接影响模型的运行效率。因此要想单机部署满血版DeepSeek R1,就需要能提供高显存和算力的芯片。

 

其中,昆仑芯正是国内少有的,能支持单机部署满血版DeepSeek R1的芯片

 

图片
图片

昆仑芯全方位支持DeepSeek

图片
图片

 

据了解,昆仑芯(北京)科技有限公司前身为百度智能芯片及架构部,于2021年4月完成独立融资。公司团队在国内最早布局AI加速领域,深耕十余年,是一家在体系结构、芯片实现、软件系统和场景应用均有深厚积累的AI芯片企业。

 

2025年2月20日,昆仑芯科技正式宣布,昆仑芯P800成为首款支持单机部署DeepSeekV3/R1671B满血版大模型的国产AI芯片,标志着国产AI芯片领域的一次重要突破。

 

作为国产高性能AI芯片的代表之一,昆仑芯P800是本土率先支持单机部署满血版DeepSeek R1的国产芯,单机部署就能发挥DeepSeek R1全部性能。昆仑芯P800还率先支持 8bit 推理,可提供精度无损的推理服务,在保证计算精度的同时,用更低的计算量完成任务,效率更高。

 

根据昆仑芯官方信息,P800在配置上提供了8卡与16卡两种选择。其中,单机8卡配置便可实现 2437 tokens/s 吞吐(处理数据快),在性能、功耗和部署灵活性上达到行业领先水平,满足轻量化与极致效价比需求。如果使用16卡版本,则最高能够实现每秒处理4825个token的吞吐量。

 

基于这些表现,对比市面上业已公开数据的厂商,昆仑芯的表现也是国内领先的。如上所述,这主要得益于其大显存的设计

 

图片

 

也正是在这个领先芯片支持下,早在2月初,百度智能云就成功点亮了昆仑芯三代万卡集群,该集群突破了硬件扩展性瓶颈,采用了创新的散热方案,并对模型进行了分布式训练优化。其实为了提升企业部署、管理大规模计算集群的效率,百度智能云早在2021年就推出了百舸异构计算平台,目前百舸平台已升级到4.0,百舸4.0提供了为昆仑芯万卡集群提供了容错和稳定性机制,以确保有效训练率达到98%。针对机间通信带宽需求,百舸还建设了一套超大规模HPN高性能网络来优化拓扑结构,从而降低通信瓶颈并提高带宽有效性。

 

面对DeepSeek R1/V3需求的崛起,在公有云服务方面,百度智能云千帆大模型平台为客户提供了极高性价比的API调用服务,价格低至DeepSeek官方刊例价的3折,创下全网最低价。

 

针对本地部署需求,百度智能云也为企业使用DeepSeek提供最具效价比的解决方案。据了解,百度智能云已经推出搭载昆仑芯 P800的百舸、千帆一体机产品,可支持在单机环境下一键部署DeepSeek R1/V3 全系列模型,提供开箱即用的便捷体验。其中,百舸DeepSeek一体机更是凭借其领先的配置,能满足高性能训练与推理需求。

 

据介绍,该机单机高吞吐,数据处理速度快,可支持500人团队并发使用,推理延迟低,响应速度快,平均50毫秒以内,运维成本低,最高可降低80%,这使其价格成为了国内最低的方案,省钱又省心;从开箱到上电到服务上线最快仅需0.5天,省时省力

 

图片

 

回看DeepSeek这一个多月来的梦幻经历,离不开性能与成本的极致平衡和开源生态的繁荣。作为国内唯一支持单机部署满血版DeepSeek R1的AI芯片,昆仑芯不仅以高算力、高显存和低成本的解决方案刷新行业标准,更通过百舸、千帆一体机为企业和开发者提供了即开即用的便捷体验。

 

从另一个角度看,也正是因为DeepSeek的异军突起,给昆仑芯等国产芯片创造了更多可能。展望未来,本土硬件和软件的紧密结合,将为本土大模型的发展提供一条更可控的成长路线,这一切都值得期待

原文链接:点击前往 >

文章作者:半导体行业观察

版权申明:文章来源于半导体行业观察。该文观点仅代表作者本人,扬帆出海平台仅提供信息存储空间服务,不代表扬帆出海官方立场。因本文所引起的纠纷和损失扬帆出海均不承担侵权行为的连带责任,如若转载请联系原文作者。 更多资讯关注扬帆出海官网:https://www.yfchuhai.com/

{{likeNum}}

好文章,需要你的鼓励

请前往扬帆出海小程序完成个人认证
认证通过后即可申请入驻
扫码添加小助手
微信扫描二维码,添加小助手
微信号:yfch24
扫码添加小助手
微信扫描二维码,添加小助手
微信号:yfch24
APP
小程序
微信公众号
微信小程序
扬帆出海APP
扬帆出海APP
微信
公众号
微信公众号
关注扬帆出海
专注服务互联网出海!
出海人
社群
微信公众号
扫码进群
与10万+出海人同行!