英伟达是怎么挣钱的?

芯片界小小学生 2024-10-26 04:22:55

2023年度,英伟达(NVIDIA)总收入609.22亿美元,毛利率高达72.7%,数据中心GPU市场份额98%。截至2024年10月6日,NVIDIA的市值达到3.064万亿美元,全球市值排名第三。

笔者从产品深度、产品广度和销售渠道三个维度分析NVIDIA当前成就以及长期发展的主要驱动力。如图1所示,具体而言,从产品深度看,NVIDIA敏锐把握市场规律,持续“延链”纵深发展,极大丰富产品内涵,提升附加价值;从产品广度看,NVIDIA利用开放平台和灵活架构,拓展产品应用领域,深度集成各领域生态系统成为主流工具;从销售渠道看,NVIDIA构建与垂直市场服务平台协同互利的销售网络,实现多方共赢。

图1:三方面因素主要驱动NVIDIA长期发展

一、产品深度

持续“延链”,提升产品附加价值

产品纵深发展体现在,NVIDIA基于市场需求持续“延链”,从GPU芯片硬件,到“GPU芯片硬件+软件”,到“GPU+DPU+CPU”三芯策略,再到数据中心产品。NVIDIA将新技术作为基础设施不断整合到既有产品中,持续扩大产品定义和内涵,提升其附加价值。同时,融合了系统优化、差异化竞争、技术收购等策略。

1软件定义产品,提升附加价值

NVIDIA原本是一家PC图形芯片公司,聚焦游戏市场,为客户提供符合行业标准的图形芯片,即GPU硬件本身。NVIDIA从硬件供应商向重点垂直领域的计算平台转型,从构建行业标准的芯片转变为客户提供完整解决方案,产品内涵从硬件向“硬件+软件”(即芯片、系统和在其基础上构建的差异化软件)转变。

图2:产品从GPU芯片硬件到“GPU芯片硬件+软件”示意图

NVIDIA自此跨入更广阔的市场空间、打开盈利上升渠道。NVIDIA认为,一个计算时代中软件和硬件占比为8:2,软件和生态系统市场空间更广阔,如果业务继续局限于硬件市场,将与少数市场主体瓜分20%的市场。另一方面,NVIDIA重新定义产品内涵,将功能固定的、以硬件定义的产品,改变为以软件定义的产品,通过软件持续附加新功能、提升性能,从而获得更高附加价值,有利于产品重新定价、提升毛利率,打开盈利上升空间。

2系统优化计算平台,实现指数级效能提升

NVIDIA的策略是将GPU及其上的系统和软件作为整体考虑,实现从架构、芯片、芯片设计、系统组件、顶层设计、系统软件、算法的全流程性能提升,不只局限于芯片制程、深度学习算法等热门领域。

基于系统优化策略,从Kepler架构开始,NVIDIA每2年推出新框架,短短5年时间内,Maxwell相比Kepler提升10倍,Pascal比Maxwell提升10倍,实现比摩尔定律更快的产品迭代速率。最近几年,NVIDIA推出新架构或新产品的周期降低为6个月。

产品效能提升意味着为客户带来更多经济利益或降低成本,意味着产品本身价值更高,有利于提升产品定价和毛利率。以数据中心业务为例,NVIDIA推出的Volta处理器能够取代大量商用服务器、网络接口卡和电缆,客户每购买一台Volta处理器可以节省数十万美元,购买的GPU越多节省的成本越高;互联网公司通过深度学习改善推荐系统服务,模型越复杂、计算量越大,准确率越高,准确度每增加1%带来的非凡经济影响。

3构建基础设施芯片DPU,以差异化价值蚕食CPU市场

NVIDIA定位产品时首先考虑新产品构建的差异化价值,以差异化价值作为竞争策略逐步蚕食CPU市场。

以DPU为例,在如今逆全球化、局部冲突的大环境中,更关注数据中心的安全性和稳定性,DPU相较CPU的差异化价值就体现在安全性和稳定性。

以往的数据中心架构由约20%~40%的CPU运行其中的基础设施(包括操作系统、安全服务),基础设施与应用程序在相同的处理器中运行。由于数据中心通过多租户云、公共云等方式由所有人共享,数据中心变成一个零信任环境,为防止其中某一应用程序是恶意软件、通过攻击处理器进入数据中心操作系统,基础设施应与应用程序隔离,并确保每个应用程序单独保护、零信任计算。

基于前述数据中心安全性需求,NVIDIA创建可编程加速基础设施处理器DPU,替换原有CPU,专门运行数据中心的基础设施,将基础设施芯片化,实现数据包、应用程序实时监控,以防入侵。同时,释放了原有20%~40%运行基础设施的CPU,改为运行应用程序。

采用类似的竞争策略,NVIDIA以GPU并行计算、数学能力、高吞吐量作为切入点替换CPU,以Arm CPU的节能作为切入点替换x86 CPU。至此,NVIDIA构建“GPU+DPU+CPU”三芯策略。蚕食CPU市场的结果具体体现为全球各地的数据中心广泛转型,其预算支出从传统CPU计算大幅转向GPU加速计算、智能网卡等。

图3:产品从“GPU芯片硬件+软件”到“GPU+DPU+CPU”三芯策略示意图

4延链开发数据中心产品,敏锐把握市场趋势

随着深度推荐系统、自然语言理解和对话式人工智能的突破,人工智能迎来爆发式增长。例如,微软与NVIDIA合作训练神经网络模型Megatron,模型参数从75亿个增加到175亿个。这揭示了计算市场变化趋势:数据量和计算需求指数增长,单一处理器无法满足计算需求,驱动计算市场以服务器作为计算单位,逐渐向以数据中心作为计算单位转变。

NVIDIA敏锐洞察这一市场发展趋势,将数据中心和超级计算机纳入产品范畴。NVIDIA的数据中心产品交付以周为单位,已建立5个数据中心,用时4周建造了最快最节能的人工智能自用数据中心Selene,同时帮助世界各地公司建立数据中心。

图4:产品从“GPU+DPU+CPU”三芯策略到数据中心产品示意图

“系统性能优化”也相应从原来基于GPU的系统范畴,扩大到在数据中心级规模上全流程优化,从系统软件、算法、网络直到数据中心,以最低成本实现最高吞吐量。

5收购高性能网络技术,快速填补技术短板

随着大模型和大数据高速发展,一台服务器已不能满足计算需求,必须实现以数据中心为单位的分布式计算,因此,数据中心转向分解与超融合的新架构。具体是指,一项服务或应用程序被分解成小块在数据中心中的多台服务器上运行,分解运行后的答案通过数据中心内部高速网络重新融合。因此,这种分解与融合的新架构使计算节点之间的高性能网络至关重要。在高性能网络上进行小额增量投资将增加数据中心数十亿美元吞吐量,大幅提高经济效益,可以立即收回投资成本。

NVIDIA原本以GPU和DPU等基于芯片的技术见长,鉴于高性能网络在数据中心产品中的重要地位,以及发展数据中心产品的业务需求,NVIDIA通过收购Mellanox公司获得高性能网络技术,快速填平补齐技术短板,跻身数据中心行业赛道。

Mellanox是延迟最低、性能最高、带宽最高的网络,取代数据中心中原本CPU的通信功能,极大提高数据中心的吞吐量,被用于全球60%的超级计算机和100%的人工智能超级计算机。2020年4月27日,NVIDIA收购Mellanox成为其网络部门,3,000名Mellanox员工加入,NVIDIA获得其深厚的网络技术。

二、产品广度

拓展产品应用领域,在各领域中成为主流

NVIDIA基于既有产品和专业优势,利用开放平台和灵活的业务组织架构,广泛拓展产品应用领域;通过深度集成垂直领域生态系统,在各应用领域中被广泛使用,成为主流工具。

1从特殊应用提炼普遍需求,在既有优势上拓展业务领域

NVIDIA从游戏领域起家,解决游戏中的计算机视觉问题。创始人黄仁勋意识到,除了游戏领域,医疗、工业设计等领域也有计算机视觉需求。2012年,AlexNet卷积神经网络(CNN)在ImageNet挑战赛中以压倒性优势胜出,超过最接近的竞争对手9.8个百分点,利用的就是英伟达的GPU,展现GPU出色的并行计算能力。

NVIDIA从游戏这一领域提炼普遍市场需求,不论是游戏、医疗视觉等可视化领域,还是挑战赛中的模型计算,本质反映的都是各行各业中的并行计算需求。NVIDIA已在游戏领域中积累了深厚的并行计算技术,因此,通过调整既有GPU,高效推出适用于新业务的GPU,解决其他领域中的并行计算问题,从而将业务领域从游戏横向拓展至专业可视化、数据中心(加速计算),在既有专业优势基础上拓宽产品应用领域。

2同一架构服务多个领域,架构组织形式支持拓展垂直市场

图5:NVIDIA以同一架构服务多个领域示意图

NVIDIA投资于一种核心硬件架构,分别服务于游戏、专业可视化、数据中心和汽车这四个增长市场。也就是,将多个业务领域相同或相似的部分统一为一个架构,在同一架构上构建适用于不同业务领域的系统配置和软件堆栈,以软件堆栈服务垂直领域。

这一架构组织形式支持NVIDIA把握市场商机拓展新业务领域。NVIDIA与上万个初创企业合作,接触各行各业潜在商机,当蕴含巨大发展潜力的商机出现时,NVIDIA能够节省针对特殊领域的硬件架构搭建过程,基于现有架构构建适用新领域的软件堆栈,快速进入新行业赛道,把握住瞬息万变的市场商机,拓展垂直市场。

此外,这一架构组织形式提升了投资效率和运营效率。从投资效率来看,不同业务领域共用同一架构,避免重复硬件开发投资;当发展前景好、尚处初期阶段的商机出现时,NVIDIA无需投资特殊领域硬件设备,避免了对新市场过度投资,同时通过小额增量软件堆栈投资跟进新市场发展,不丧失长期发展机会,最大化投资效用。从运营效率来看,专注于一个架构,通过维护升级一个架构,实现所有业务领域同步升级,降低运营成本,提升运营效率。

3开放平台持续催生创新应用,业务拓展有方向有抓手

黄仁勋认为,人们开发计算机方式的每一次转折点,都是因为计算机更易于编程、更易于访问,PC革命、互联网革命、移动云均是如此。由于开发和部署应用程序非常容易,移动云涌现了500万个应用程序。

NVIDIA总结了计算行业发展规律,在不断完善其加速计算平台的同时,通过提升其平台适用性,消除任何开发人员访问的障碍。具体方法是,NVIDIA与原始制造设备商、云计算公司、互联网公司等构建广泛的合作伙伴网络,使得加速计算平台能够适用任何PC、工作站、云端、汽车、机器人、嵌入式环境等开发环境。

由于加速计算平台编程简单、易于访问,逐渐吸引各行各业开发人员在NVIDIA平台上构建工具。历经18年发展,截至2023年末,NVIDIA能够支持全球超过470万名开发人员。开发人员的覆盖范围扩大后,加速吸引更多开发人员使用NVIDIA平台,形成良性循环,原因是开发人员能够在开发软件后接触到最多的终端用户,从而建立业务、获得回报。NVIDIA也因此不断吸引新应用程序,扩大其计算平台的应用场景。

4深度集成垂直领域生态系统,在垂直市场中成为主流

黄仁勋认为,在构建垂直领域的服务平台时,要与垂直领域的大型生态系统深度集成,使得NVIDIA的平台和技术能够在垂直行业中广泛应用,直接影响生产经营,成为垂直市场的主流工具。

具体而言,NVIDIA构建垂直市场团队,为每个行业创建了API,协助每个行业开发人员使用其技术,与他们合作重构应用程序,以便利用NVIDIA技术后的应用程序更符合市场需求,从而将NVIDIA的平台和技术深入到各行各业。NVIDIA的合作伙伴和客户遍布数十个垂直行业。

例如,VR技术应用广泛,可用于娱乐、工业设计、建筑设计、医学成像和科学计算等领域。NVIDIA构建名为DesignWorksVR和GameWorksVR平台,通过平台为250多家涉及视频游戏、娱乐和专业图形等终端应用的公司提供API和SDK,将VR技术通过合作开发模式集成到这些公司已有的系统中,使得终端用户通过这些系统使用VR技术。

三、销售模式

销售网络与垂直服务市场协同互利,实现多方共赢

NVIDIA的销售策略是借助合作伙伴网络进入终端市场。NVIDIA的终端客户包括云计算公司、互联网公司、数千家各行各业企业和上万家初创公司。由于销售覆盖范围不允许NVIDIA联系到每一家医疗保健公司、保险公司或零售公司,其合作伙伴网络发挥作用。他们能够凭借庞大的销售队伍和经销商网络为世界各地的企业客户提供NVIDIA产品和架构。

NVIDIA的合作伙伴网络包括全球、地区和专业的云服务商、原始设备制造商、原始设备设计商、系统集成商、独立软件供应商、附加板制造商、分销商、汽车制造商以及其他生态系统参与者,通过网络连接着数十万名IT销售专业人员。

NVIDIA垂直市场服务平台与销售网络发挥协同作用,使NVIDIA、销售合作伙伴和终端客户三方共赢。以数据中心业务为例,NVIDIA将AI基础设施托管于世界领先的云服务商,再由云服务商向各行各业企业、初创公司开放使用。对于NVIDIA而言,云服务商将其产品提供给各行各业企业,快速扩大产品使用范围和规模,占领AI服务市场。对于云服务商而言,该模式丰富其AI服务内容,扩大服务范围,更重要的是,NVIDIA垂直市场服务平台直接支持上万家AI初创公司,能够吸引新客户使用云服务,为云服务商带来直接用户和经济利益。对于各行各业的客户而言,他们没有自主构建AI知识体系的能力,通过“NVIDIA+云”的方式拥有最先进的AI基础设施和优秀的AI基础设施管理团队,轻松获得从基础设施到AI模型的全部专业知识,大幅降低AI使用的门槛。

信息来源:2014年~2023年英伟达季度业绩会会议纪要

0 阅读:0

芯片界小小学生

简介:感谢大家的关注