“一半是火焰,一半是海水”,金融大模型的爆发与困局
8月底一场由百度云主办的AI+金融专题论坛上,中国建设银行金融科技部副总经理张晓东也透露,为适应模型的快速迭代,建行打造了企业级松耦合的整体架构,基础大模型与建行大小模型间、建行大小模型与应用场景间双重解耦,达成“水涨船高”效果。行业人士告诉数智前线,上一代的手机银行,3-4层的繁杂菜单中,约有70%的按钮从未被按过,但真想找服务时又很难,而这些,未来都有可能一句话解决,让金融APP实现交互跃迁。
金融AI大模型来到爆发临界点。
文|周享玥
编|赵艳秋
“一半是火焰,一半是海水”,这是业界对金融行业落地大模型的现状描述。一方面,全球近半数金融机构已启动大模型应用建设,行业已处在爆发临界点;另一方面,“高投入、低渗透”一直是金融行业落地大模型遭遇的挑战,这让行业又未完全实现爆发。
金融行业与大模型之间,既有巨大的深度融合潜力,也存在落地的现实鸿沟。如何在监管合规与创新突破之间找到平衡点?如何将高投入转化为高产出?已成为金融机构和业界必须回答的问题。
01
“一半火焰,一半海水”
“过去一年,大模型在金融行业的落地状态,可以用‘一半是火焰,一半是海水’来形容。”近日的一场AI+金融论坛上,百度集团副总裁袁佛玉的这一观点,道出了行业的状态。
“火焰”的一面,大模型已成金融机构必选题,将给金融业带来体系性变革,而非简单降本增效,这包含三个根本性重构:重构用户体验与习惯,实现“人找服务”到“服务找人”;重构业务流程和模式,从“流程与数据驱动”到“知识与智能驱动”;重构员工角色和价值。
“每个场景都有可能会被重塑。”蚂蚁数科CTO王维表示,这轮AI革命给金融行业带来的影响,将不亚于移动互联网对社会各层面的改变。
人工智能在金融领域的应用已是全球现象。毕马威8月发布的《2025金融业大模型应用报告》中指出,2025年已成为金融行业深度整合AI、借助大模型进行创新的关键拐点。全球近半数金融机构已启动大模型应用建设,行业正从零星试验阶段迈入规模化部署期。其中,海外侧重技术与业务创新协同,国内目前更聚焦于知识库、文档处理等效率提升场景。
根据报告的统计,2024Q1至2025Q2这一年多时间,中国金融市场共计产生191个大模型相关中标项目,其中2024年112个,2025年上半年79个,基本形成银行业主导、证券保险跟进、信托资管探索的梯次发展格局,2025年建设节奏明显提速。
而“海水”的一面,大模型要落地到严谨业务场景,仍然困难重重。“高投入、低渗透”一直是金融行业最近几年共识的大模型“落地陷阱”。从“通才”到能成为理解业务、符合行业安全合规要求且能创造实际商业收益的“业务伙伴”,大模型还有不小差距。
比如,金融从业人员曾反馈,部分智能化工具没有契合业务场景痛点,反而增加了人工重新检验和校正的工作量。也有大行科技部门员工向外透露,引入大模型后,硬件设备投入成本大增,但实际业务效率提升并不明显,管理层因此对后续投入产生疑虑。
7月底的WAIC媒体沟通会上,蚂蚁数科金融AI产品总经理曹刚曾直言:“目前金融机构的AI应用中,80%集中在客服问答、文档处理等通用场景,而风控、投研、财富管理等核心业务的渗透率不足20%。”
百度智能云金融业务部总经理徐旭则观察到,最近金融机构的领导,尤其高层,思考维度已深入到更底层的挑战与问题。比如,大模型催生的数字员工并非单纯技术议题,而是新时代的人力资源课题。
技术创新可能引发的竞争格局变革,也在金融机构引发更深的思考。7月,徐旭在拜访一家头部保险公司副总裁,分享智能体应用场景时,对方便抛出核心疑问:“我知道这能做,但在这个时代,我们的护城河在哪?”而这可能需要让大模型直抵核心业务场景,用AI原生技术和新的管理范式重构竞争力。
02
技术快速演进中的三大共性趋势
“高投入、低渗透”陷阱背后,是大模型的通用性与金融业务的专业性存在矛盾。4月的一场峰会上,时任中国银行首席信息官孟茜指出,目前预训练基础大模型金融知识配比仅占约5%,导致金融专业性不足,限制了其在金融场景的深度应用。
今年,这个问题开始有了新解法,专业智能体是大模型落地到金融等严谨产业的有效路径。这个过程中,行业逐渐总结出了一些共性趋势和落地方法论。
趋势一,大小模型融合已成金融业场景主要解决方案。二者协同关键在匹配分工,大模型多承担指挥和协调角色,解决长尾、小样本问题;小模型则凭借多年打磨优势,负责生产执行,并着重满足业务场景中大模型暂时难以实现的毫秒级响应需求。
如反欺诈、合规审计中小模型打分判定,大模型解释说明;投资研究里,小模型拟合行情数据,大模型整理成报告。信贷审批时,大模型初评客户信用与还款能力,小模型深挖历史数据补充修正。
趋势二,金融垂直大模型,尤其金融推理模型,开始越来越被需要。
智能体需要好模型。要不要行业模型、场景模型,很多行业存在“非共识”。但经过实践,金融行业明确需行业大模型与垂类场景模型,以应对合规、严谨性、一致性、专业性等独特挑战,满足精准金融能力需求。
此前,一些金融机构,尤其头部大行,已开展二次训练,各家厂商也都在打造金融行业大模型。而今年,还要更进一步。
4月初的一场大会上,中国工商银行首席技术官吕仲涛曾透露,工行已建成以生成能力为主的企业级千亿级大模型,今年起,其核心方向之一是打造金融推理大模型,以解决可解释性问题,更好适配业务需求。
百度云则在6月推出了千帆慧金金融知识增强、推理增强两大模型,各含8B和70B两个版本。百度智能云千帆大模型行业增强技术负责人李曙鹏曾向数智前线举例称,推理增强模型适用于金融表格分析、金融计算等场景,如赋能房贷利率计算,推理得出最优金融方案。
7月底的世界人工智能大会上,蚂蚁数科也正式发布专为金融领域打造的金融推理大模型 Agentar-Fin-R1。
“一个好的垂直大模型,特别是推理能力很强的推理大模型,才能成为一个智能体可控、可靠、可优化的智能中枢。”蚂蚁数科CTO王维观察,尤其当步入深水区,想用智能体去解决理财、风控等场景的问题时,模型推理能力愈发关键。
蚂蚁数科AI技术负责人章鹏则告诉数智前线,这源于两方面的需要,一是技术内生需求,推理模型出现后,客户主动要求跟进先进技术。二是客户需可解释性,希望知晓大模型回答的思考过程,此前主要靠Prompt强制模型的思考,但金融复杂场景对推理链条和逻辑要求更高,仅靠Prompt难以满足。
但并非所有场景都需推理模型。进入业务深水区,客户更关注效率与成本,需按问题差异决定是否深度推理。“比如生成报告、审查报告是否该通过或审批等场景,是适用的;但在客服、呼叫、坐席助手场景不实用,因其实时性要求高,哪怕半分钟,对方都可能挂机。” 中关村科金副总裁刘倩说。
趋势三,与基础大模型解耦,逐渐成为金融机构共性选择。
当前,基础大模型迭代持续加速,每周都有新的或升级版基础大模型推出。基于之前模型开发的应用实践该何去何从?
在7月中旬一场由蚂蚁数科发起的直播中,香港科技大学数字金融实验室主任陈卡你提到,他们现在做AI应用,很多时候会设为“可插拔”模式,以便随时更换基础大模型。尤其金融行业,因多要求本地部署、成本高昂,对这种灵活适配的需求会更为迫切。
8月底一场由百度云主办的AI+金融专题论坛上,中国建设银行金融科技部副总经理张晓东也透露,为适应模型的快速迭代,建行打造了企业级松耦合的整体架构,基础大模型与建行大小模型间、建行大小模型与应用场景间双重解耦,达成“水涨船高”效果。“目前我们已完成39个大模型版本的更换,逐步提升了我们对业务的支撑能力。”张晓东说。
03
核心场景,有哪些突破?
当下,在金融场景落地中,已逐步形成以员工、客户为两大主线的发展方向,持续深化大模型与智能体的体系化应用。相关落地成果也在持续涌现。
在员工智能方面,百度云徐旭告诉数智前线,目前业界在前台、中台、后台全流程都已有不少案例。
以保险公司营销场景为例,一些险种的销售人员成本约占运营成本的40%-60%,且产品条款复杂、同质性强,销售难度大,业界围绕保险销售全链路开展场景探索。比如,泰康在代理人培训场景推了AI智训,可将特殊险种代理人持证上岗的培训期缩短一半。
建行张晓东则介绍,建行为客户经理打造了“帮得” 智能助理,实时推送高净值客户、资金变动客户信息,匹配理财产品与客户画像,提供营销话术。借助该智能助理,专营客户经理服务客户数从200人升至了600人,直营客户经理服务客户数从几百人提升至2万人,几乎超过单个网点覆盖的客户经营范围。
位于中台位置的投研顾问场景,如高华证券发布了大模型指数化股票投资系统。其中,华证高度大语言稳健50策略指数自2024年11月上线以来,年化收益率在25%以上,较中证红利全收益指数实现15%超额年化收益。
在更核心的风控领域,今年行业内也有新突破。工商银行用大模型+智能体形式,把业务流程串接起来,更快地完成风险评估和体系性的能力。在这个过程当中,通过强化学习理解业务专家的工作模式,更好地形成可解释的风险管理的报告。
今年5月谷歌DeepMind 发布AlphaEvolve,以科学计算结合大模型,实现算法自动生成、评估与迭代。百度以此为思路,攻克工程化难点,推出了“伐谋” 智能体,试用于金融行业风控特征工程与建模。在与某直销银行的试验中,最终端到端风控模型抓违约人群能力提升了3个千分点。“风控领域提升一个千分点就属于显著指标了。”一位行业人士表示。
而客户智能方面,大模型及智能体,正在推动金融行业的客服、交易、交互等发生形态变化。
如新交互方面,不管是银行、证券还是保险公司,都已经在尝试探索下一代金融APP,最终目标是从“人找服务”变为“服务找人”。行业人士告诉数智前线,上一代的手机银行,3-4层的繁杂菜单中,约有70%的按钮从未被按过,但真想找服务时又很难,而这些,未来都有可能一句话解决,让金融APP实现交互跃迁。
另外,交易形态也在发生变化。银行做市业务,原来主要靠人工操作。中国工商银行软件开发中心大数据和人工智能实验室资深经理夏知渊告诉数智前线,通过构建面向债券交易员的债券交易智能体,实现系统多渠道复杂询价交易的一站式交易,平均回价时长从3分钟降至15秒,交易效率提升10倍,日均交易报价笔数从200+笔提升至2000+笔。
04
ROI在某些场景可以被量化了
自大模型落地探索至今,ROI(投入产出比 / 投资回报率)始终是金融机构关注的关键指标,却也长期面临难量化的问题。
早期开拓阶段,因企业不了解大模型技术,多需服务商主动帮忙将ROI明确出来。彼时,ROI测算相对简单,有时甚至是较为直观的计算。比如,工作效率的具体提升,获新客户与客户转化的量化、购买数字人与新招一个员工的成本比对。
而随着金融AI落地进入深水区,ROI的重要性和受关注度还在持续提升。“我们现在见客户经常会是科技加业务的领导一块见。” 中关村科金副总裁刘倩表示,这背后是金融行业更加向业务预算或科技+业务联合立项预算的方向在迁移,立项逻辑更多以“以业务价值为导向”,也是其更注重ROI的一个表现。如某银行新任董事长最近暂停或降低了部分产品属性类项目预算,保留甚至加大与“增收、降本、增效” 相关预算。
这个过程中,需要建立一个更完善的价值评估体系。
最近,百度云联合IDC发布的《金融大模型应用落地白皮书》中就提出,金融机构在落地大模型过程中,要以ROI为核心构建模型落地效果评估体系,包括提效、增益、使用频率(MAU、DAU)等维度。同时围绕 ROI 成本与收益类指标划分场景落地优先级,进行动态调整。
部分金融机构在一些场景中,已通过多种途径开展ROI测算,且能明确量化出相应价值。
“我们现在主要看业务量。”工行夏知渊告诉数智前线,比如原来人工操作日业务量可能只有1000笔,使用AI后,每笔业务的操作时间能压缩十几分钟,业务量可能增加到2000-3000笔。
一方面,这些业务每一笔都会收取手续费,将每天多调用AI的次数与多收的手续费相比,就能换算出成本和收益。另一方面,原本因人力处理不过来而放弃的50万元以下的汇款业务,随着AI带来的提效,可能也能做了。这将会带来业务边界的扩展。
05
下半场,还存在哪些挑战?
业界观察,过去一年,金融行业对大模型已经从“追逐”转向“审视”,关注焦点从参数规模、榜单排名、打榜成绩,全面转向了模型在实际业务场景中的价值创造、投入产出测算,以及如何同时说服科技部门和业务部门。
这或是产业已经在走向成熟的重要信号。
在这个过程中,除了需继续关注算力如何有序建设、模型与应用范式如何选择等问题,更关键的是,人工智能已进入以智能体应用为核心的下半场,企业需重点解决围绕智能体规模化应用的一系列新挑战。
第一,解决面向智能体规模应用的架构适配挑战。
银行原来的业务架构、技术架构按业务部门划分,不同部门有各自的业务系统、用户及研发团队。而智能体时代,一个智能体可能需跨系统处理业务。“这个过程中,智能体的研发和配置到底由谁来负责,由谁来驱动,它底层的子智能体又是谁来负责研发,保证它的质量,需进一步思考。”夏知渊表示,这样才能实现更高效运转,否则可能出现大量重复的低效智能体,浪费研发资源。
徐旭也提到,智能体落地目前存在工具建设重复的问题,认为其落地更需企业级服务及连接技术与业务的能力。其团队与某股份制银行合作搭建全行员工智能体平台后,该行通过这一平台建立了一个总分行MCP库,使得其中一家分行开发的智能体上线后快速被三十多家分行拷贝,实现了能力的快速复用。
第二,解决面向智能体的技术资产纳管治理挑战
AI时代融合了业务专家知识的专业模型、行业模型是宝贵资产,如何保护、复用、管理这些模型,以及管理、更新、调整那些结合业务流程打造的智能体,将面临类似过往数据资产治理的挑战。
第三,解决面向模型的专业数据集采洗管用的挑战。
好的模型和智能体,都需要高质量的专业知识和数据。哪些数据可以使用,数据安全和隐私如何保障,如何将分散的数据整理成大模型可用的知识,仍然是一项长期工程。
张晓东介绍,建行正在探索应对措施。如在数据隐私方面,打造了一个数据安全的双闭环,一方面,数据用于大模型训练方面一定要脱敏,另一方面,训练到大模型里面的数据禁止下载。
第四,解决智能体嵌入业务迈过最低智能门槛的挑战。
最首要的是,模型要可控,保障它回答的准确性、专业性,同时尽可能降低幻觉问题。目前,业界正在通过推动金融可信机制或一些工程化手段,提升模型可控性,但这仍将是未来几年内的最大挑战之一。
大模型和智能体的浪潮还在滚滚向前,随着金融AI落地迈入深水区,行业正在加速深挖有深度、高性价比的场景。如何更大范围渗透进金融核心生产场景,解决好“最后一公里”问题,仍然是一个长期课题。
更多推荐
所有评论(0)