近日,2026中国国际金融展在上海开幕。海光信息携CPU+DCU双芯亮相。

当前,金融AI应用从单纯的“模型应用”迈向“智能体落地”的新阶段。从知识问答、文本生成进一步深入到制度查询、智能运维、合规风控等业务流程中,金融智能体正成为效率革新的新抓手。

然而,深入核心场景也带来了重重挑战:一方面,核心系统升级对安全合规提出更高要求;另一方面,智能体高并发推理带来算力成本与能耗压力持续攀升。如何在性能、安全与成本之间取得平衡,成为行业共性难题。

围绕这一趋势,海光信息副总裁吴宗友指出:“过去金融数智化建设往往需要在性能与安全之间权衡取舍。面向AI时代,海光的作用就是让金融机构无需再做‘选择题’。”

面对上述挑战,海光信息以CPU+DCU双芯协同架构给出系统性解法。海光CPU采用C86架构,兼顾高性能与高安全,负责统筹调度、复杂工作流编排与知识库调用,稳固核心交易与合规底线;海光DCU专注于大模型高效智算,大幅降低Token推理成本与能耗。

海光信息展台 图源:观察者网

“CPU+DCU,能够完整地完成一个Agent AI的全部任务,由两颗芯片一起完成。为什么要两颗芯片一起做呢?因为芯片和芯片之间有些需要协同的地方。比方说芯片里面,CPU的带宽要够,算力要够,GPU也得够,两边的也得合起来。否则一边大,一边小,那肯定对算力会造成浪费。”海光信息副总裁应志伟在展会现场对观察者网说道。

安全是金融的生命线。海光基于芯片级内生安全机制,通过CSV技术构建硬件保护的机密计算环境,打造了“机密Token”方案。

“我们在CPU里面做了很多安全技术,比较可信。CPU启动的时候,从第一条指令,就开始度量。没有认证过的程序就没法执行。插一个后门进来,是非常困难的。”应志伟表示。

同时,针对前沿安全威胁,海光联合国泰海通证券、格尔软件正式发布了抗量子密码平滑迁移解决方案。该方案将高安全强度算法全面嵌入核心环节。实测数据显示,该系统可稳定支撑10000-30000TPS的高并发连接,业务平均时延低至48-61ms。

展会期间,海光信息联合北京国家金融标准化研究院、国泰海通证券正式启动“面向数智金融的芯片级内生安全与创新发展研究”。

海光信息副总裁李一昂表示,“该研究旨在攻克智能体落地中的安全与工程化难题,探索并构建起一条‘自主算力底座—芯片级安全心脏—智能体平台—业务场景’的全栈落地范式,为银保证细分场景提供具象化的实践指引,让金融智能体真正‘敢办事’。”