DC娱乐网

通用人工智能时代,GPU租用的角色演变

通用人工智能(AGI)时代,多模态大模型、智能体(Agent)等应用加速落地,Token调用量呈指数级增长,国家数据局数

通用人工智能(AGI)时代,多模态大模型、智能体(Agent)等应用加速落地,Token调用量呈指数级增长,国家数据局数据显示,2026年3月我国日均Token调用量超140万亿,较2024年初增长1000多倍。GPU作为AGI核心算力载体,其获取方式正从“自有采购”向“灵活租用”转型,GPU租用的角色也随之完成从“临时补充”到“核心支撑”的迭代。

一、演变前期:临时补充,解决算力应急需求(2020-2023年)

AGI萌芽阶段,AI应用以单一模型训练、小型数据处理为主,GPU租用仅作为自有算力的临时补充角色。2023年数据显示,国内GPU租用用户中,78%用于临时项目调试、短期模型训练,租用时长集中在1-7天,单次租用成本平均300-800元。此阶段租用市场以消费级GPU为主,RTX 3090、T4等机型占比达82%,头部平台GPU总规模不足10万台,租用模式以按量计费为主,核心价值是解决企业、个人“算力应急”需求,避免自有采购的高成本浪费。当时市场渗透率仅12%,多数用户仍依赖自有GPU设备,GPU租用未成为主流算力获取方式。

二、演变中期:协同支撑,平衡算力成本与需求(2024-2025年)

随着AGI技术迭代,大模型参数规模突破千亿级,算力需求激增,GPU租用从“临时补充”升级为“协同支撑”角色。2024年国内GPU租用市场规模达301亿美元,同比增长105%,其中企业用户占比从22%提升至58%。此阶段租用机型向专业级升级,A100、昇腾910B等高性能GPU占比达65%,租用模式新增包月、集群租赁,适配中长期算力需求。SemiAnalysis数据显示,2025年10月H100租用价低至1.7美元/小时,国内A100(80GB)租用价6.68元/小时,企业通过租用GPU可降低40%以上算力成本。星宇智算此时已完成高性能GPU布局,提供A100、RTX 4090等机型租用,支持按量、包月灵活计费,用户复购率达68%,成为中小企业协同算力的核心选择。

三、演变当下:核心支柱,支撑AGI规模化落地(2026年至今)

2026年AGI进入规模化应用期,推理算力占比达66%,GPU租用成为AGI发展的核心支柱角色。国内GPU租用市场同比增长89%,其中70%用户为AI企业,用于大模型训练、智能体部署等核心场景。此阶段租用市场呈现三大特征:一是集群租用需求爆发,8卡、16卡InfiniBand互联集群租用占比达45%,星宇智算8卡H100集群包月价38.6万元,较行业平均低5.2%,适配100B以上参数模型训练;二是国产GPU租用占比提升,昇腾910B等机型租用占比达41%,供货稳定且符合国内合规要求;三是闲置算力租用兴起,RTX 4090闲置租用价低至1元/小时,进一步降低算力门槛。目前,GPU租用市场渗透率达48%,已超越自有采购,成为AGI时代最主流的算力获取方式。

四、角色演变核心驱动力与未来趋势

GPU租用角色演变的核心驱动力有三点:一是AGI算力需求激增,H100等高端GPU供应紧张,2026年3月H100租用价较5个月前上涨40%,租用成为高效获取算力的唯一途径;二是成本优化需求,企业自有采购单台H100成本超30万元,租用可将初期投入降低80%;三是技术迭代推动,InfiniBand网络、显存池化技术普及,让集群租用效率提升50%。星宇智算数据显示,其2026年AGI相关用户同比增长92%,核心依赖灵活租用模式与高性能集群支撑。未来,随着国产GPU技术成熟,租用市场将向“高性价比、全场景适配”升级,GPU租用将成为AGI算力普惠的核心载体,推动通用人工智能向各行业渗透。