这两年跟几个做金融AI的朋友聊天，发现一个挺普遍的现象：GPU采购预算批得爽快，

这两年跟几个做金融AI的朋友聊天，发现一个挺普遍的现象：GPU采购预算批得爽快，上架之后实际利用率却惨不忍睹。显卡经常在那儿"等着"，数据从存储搬过来要时间，网络传过来要时间，等数据到了，计算早就跑完了——典型的"车等油"。
金融智能体对这个问题的敏感度尤其高。实时反欺诈、动态授信、智能投顾，智能体要在毫秒级完成"感知-决策-执行"闭环。数据路径一拥堵，推理时延抖动，体验和风控效果一起打折。
中科曙光这次在金融展上推的"元融"方案，说白了就是冲着"不让GPU空等"来的。算力是scaleX40超节点——单节点40张GPU，显存加起来5TB多，万亿参数模型能装下。存储是ParaStor F9000，单节点带宽220GB/s，能同时给40张卡各喂5GB/s以上的数据。网络是scaleFabric，端到端时延压到0.93微秒。三层拉通之后，数据不用再从存储"长途跋涉"去找算力，算力就贴着数据跑。
"元融"专攻AI创新和智能体推理，当然也有FlashNexus 9000专门守住核心交易。
江海证券已经跑通了四大场景。大模型推理从秒级压到百毫秒级，这个提升在真实业务里体感还是挺明显的。
中科曙光元融金融展

DC娱乐网

这两年跟几个做金融AI的朋友聊天，发现一个挺普遍的现象：GPU采购预算批得爽快，

热门分类