扯淡的银行大模型

潘晓俊（金融从业者）

一直觉得银行会吹牛逼，但没想到的是银行这么会吹牛逼。某国有大行公开宣讲号称建成同业首个全栈自主可控的千亿级AI大模型技术体系，实现在多个金融业务领域的创新应用。我就不禁纳闷了，上周还因为该行手机银行无法在线提升额度的bug，问了一圈客服。实在受不了接近弱智的智能客服，最后还是拨通了人工语音，接受建议乖乖的去了柜面重新销户开户手机银行。然后到这里就一下超越BATJ们，成为中国大模型的领先者了？但问题是这大模型先进技术怎么不给用户使用啊，钱都花在哪里了，是不是需要审计一下？

遥想ChatGPT火爆之初，招行一马当先，号称业内首次把大模型用在银行场景。本以为是什么了不起的创新，结果就是发布了一张信用卡，卡面文案用大模型生成。好笑是有点好笑，但也能看出银行对于新技术的开放态度。查询了下各个银行的年报和公开信息，发现提这千亿极概念的可不止一个银行，目前已经有中国银行（内部知识服务，辅助编码场景）、工商银行（座席助手，网点员工智能助手场景）、交通银行（办公助手，客服问答场景)、农业银行（客服知识库答案推荐，知识库辅助搜索场景）、邮储银行（研发测试，运营管理，客户营销，智能风控，投诉问题分类场景)、建设银行（向量知识库，文生图，智能客服，市场营销，投研报告，智慧办公，智能运营，智能风控场景）、中信银行（代码生成，智能操作场景）、平安银行（零售贷款审批，运营管理，消保降诉，汽车金融AI验车场景）、招商银行（零售，批发，中后台场景）、民生银行（数字化决策场景）、兴业银行（智能研报摘要生成，企金产品智能问答，研发代码辅助生成，数字助手场景），不完全统计，十一个银行公开提出了大模型建设并明确了对应的研发场景。

总体上看，各大银行都争先恐后进入大模型军备竞赛，至少是PPT层面的。具体大模型应用不说，在大模型的汇报层面已经形成了完备的方法论和理论知识体系，扯淡的功夫一脉相承。所谓的大模型或采购，或自研。但是，出彩的场景并不多，而且所谓自研，大概就是基于某个开源模型用场景数据微调。这无可厚非，毕竟银行是需要极度安全、极度可靠的服务，大模型目前为止还是黑盒，限制了它在严肃场景中的使用范围。而且银行数据不外流，行内资源又极其有限，大模型应用困难重重。甚至大部分行还没分清楚大模型和大小模型，大模型的核心技术底座和大模型应用的区别就出来大吹特吹，这完全符合银行科技部高管吹牛逼不打草稿而业务并不熟练的人设特征。但这会让自己和银行行级领导都成为笑柄的。

银行这人工提需求、通过传统IT技术就能解决的小问题都没解决，大模型的牛皮现在不吹也罢。

了解下基本概念

大模型是指参数量相对较多的机器学习模型，具有更复杂的结构和更多的隐藏层单元或卷积核数量，参数数量较多。由于其较大的规模，大模型能够处理更复杂的任务和更大规模的数据集，提供更准确、全面的输出。相对于小模型，大模型一般需要更多的计算资源和存储空间来进行训练和推理。小模型通常是指参数量相对较少的机器学习模型。通常具有简化的结构和较少的隐藏层单元或卷积核数量，因此参数数量较少。小模型在存储和计算资源方面的需求较低，能够快速训练和推理。大部分银行所谓的大模型就是与专业的大模型厂商合作的大模型应用层面的研发，或者是自身小模型的有益尝试。

再说那家提出千亿级AI大模型技术体系的银行，你家有多少数据中心、芯片和电网？在最近的季度财报电话会议上，谷歌、微软和Meta都强调了在AI上的巨大投资。Meta将今年的支出预测提高了至多100亿美元，谷歌计划每季度资本支出约120亿美元。值得一提的是微软最近也发布了一个千亿级大模型MAI-1，最近一个季度花费了140亿美元。我们的银行有没有花1.4亿美金？如果没有，那是我们的算法领先了还是PPT水平又领先了？

应用层是核心

说了这么多，并不是打击银行银行在人工智能领域的创新和尝试。但做事情的确需要严谨的态度和扎实的作风，嘴炮不仅干不成事情还浪费钱。可以说目前在国内，在经历了年初疯狂内卷大模型降价后，国内几家大厂对于大模型的态度也发生了变化，从实际来看投入开始变得谨慎。对于持续大投入但没有明显收益的大模型，大厂也开始弱化基础大模型迭代，强调应用的落地。没有应用，开源闭源模型都一文不值。反应到当下，大厂应用落地较为成熟如文生图，文生视频等，成了现在整齐划一的发展方向。

国内大厂的技术水平就是国内任何企业大模型应用发展的智子，我相信现在没什么国内银行还敢和谷歌、微软之流合作大模型了吧。既然国内大模型的核心能力是“生成”，那么现在围绕这个核心开发业务场景胜算才会更高，例如代码辅助、知识问答等。一个非常实用的场景是用大模型辅助标注，用于训练更精准的小模型。最近一两年，每家银行都把“降本增效”挂在嘴边。用同等能力的小模型替代大模型，就是一种降本增效的好方法。银行的服务属性与大模型的强大交互能力天然契合，在对内的客服检索和对外的客户营销体验上，一定能有银行在短期取得突破。

最后还是劝银行们少提提什么支柱、范式、平台、全域生态，万事都怕过火。与其滥用，不如不用。当前大模型能力远没有达到让人放心的程度。如果场景可以使用小模型解决，就没有必要投产大模型。场景为王，科技深入一线，少提概念，多干实事。（本文为作者观点，不代表本头条号立场）

DC生肖网

董希水