DC娱乐网

这两年跟几个做金融AI的朋友聊天,发现一个挺普遍的现象:GPU采购预算批得爽快,

这两年跟几个做金融AI的朋友聊天,发现一个挺普遍的现象:GPU采购预算批得爽快,上架之后实际利用率却惨不忍睹。显卡经常在那儿"等着",数据从存储搬过来要时间,网络传过来要时间,等数据到了,计算早就跑完了——典型的"车等油"。
金融智能体对这个问题的敏感度尤其高。实时反欺诈、动态授信、智能投顾,智能体要在毫秒级完成"感知-决策-执行"闭环。数据路径一拥堵,推理时延抖动,体验和风控效果一起打折。
中科曙光这次在金融展上推的"元融"方案,说白了就是冲着"不让GPU空等"来的。算力是scaleX40超节点——单节点40张GPU,显存加起来5TB多,万亿参数模型能装下。存储是ParaStor F9000,单节点带宽220GB/s,能同时给40张卡各喂5GB/s以上的数据。网络是scaleFabric,端到端时延压到0.93微秒。三层拉通之后,数据不用再从存储"长途跋涉"去找算力,算力就贴着数据跑。
"元融"专攻AI创新和智能体推理,当然也有FlashNexus 9000专门守住核心交易。
江海证券已经跑通了四大场景。大模型推理从秒级压到百毫秒级,这个提升在真实业务里体感还是挺明显的。
 中科曙光 元融 金融展