华为CloudMatrix 384超节点由昇腾 910C 组网。
昇腾 910C 单卡算力为 781.25 Tflops,内存总带宽为 3200 GB/s,基于 8 个 HBM2e 存储堆叠,GPU互联带宽为 400 GB/s。该芯片采用 Chiplet技术,通过拼接两颗昇腾910系列的训推一体芯片,形成专注于纯训练任务的高性能算力单元。
Ascend910C采用12nm工艺制程,单卡算力较前代提升40%,功耗降低15%,可支持千亿参数大模型训练。910C良品率已达到40%,产线实现盈利。
华为CloudMatrix 384超节点由昇腾 910C 组网。
昇腾 910C 单卡算力为 781.25 Tflops,内存总带宽为 3200 GB/s,基于 8 个 HBM2e 存储堆叠,GPU互联带宽为 400 GB/s。该芯片采用 Chiplet技术,通过拼接两颗昇腾910系列的训推一体芯片,形成专注于纯训练任务的高性能算力单元。
Ascend910C采用12nm工艺制程,单卡算力较前代提升40%,功耗降低15%,可支持千亿参数大模型训练。910C良品率已达到40%,产线实现盈利。
猜你喜欢
【295评论】【188点赞】
【450评论】【76点赞】
【91评论】【22点赞】
【132评论】【9点赞】
【6评论】【4点赞】
【32评论】【44点赞】
【80评论】【42点赞】
【202评论】【88点赞】
作者最新文章
热门分类