近日,微众银行在AI领域取得重大突破,推出金融行业首款自研AI智算场景交换机及高性能AI智算网络解决方案。该方案实现了从硬件交换机到软件网络操作系统,再到智能网络管控的全链路自主可控,目前已在微众银行生产环境投入使用,最高可支持400G GPU/NPU算力卡组网,建网成本降低约70%。
大模型时代,AI分布式训练对网络性能要求极高,传统以太网方案常因流量低熵特性导致网络拥塞,难以满足金融业的高带宽、低时延、零丢包需求。而依赖外部商用解决方案成本高昂且缺乏灵活性。微众银行的解决方案另辟蹊径,深度结合自身业务需求,打造软硬件全栈自主可控的高性能AI智算网络。
硬件方面,该方案基于12.8T国产交换芯片和国产CPU,适配主流GPU和NPU计算资源,支持高达1.6T的RDMA接入能力,能够在无损以太网环境下支撑400G算力卡组网,为金融行业AI算力卡选型提供了更多可能性。
软件方面,微众银行基于开源SONiC自研网络操作系统,创新研发了适应不同组网架构的自定义链路级负载分担组件,提升了大规模无损以太网部署效率。该组件能够在链路故障时毫秒级切换流量至备份链路,最大程度减少故障影响。
此外,微众银行还自研了智能网络管控系统,实现全网设备拥塞指标秒级采集监控,精准定位拥塞业务流量并自动调度至最优路径,有效应对AI训练过程中的网络拥塞问题。
值得关注的是,微众银行积极参与开源社区建设,将网络协议性能优化方案开源反哺SONiC社区,成为唯一上榜SONiC官方贡献组织名单的金融机构,提升了中国金融科技的国际影响力。未来,微众银行计划将AI智算网络解决方案的成熟经验标准化,形成公共组件面向全球开源共享,进一步推动AI智算网络高质量发展。
技术细节补充:
未来展望:
微众银行的AI智算网络解决方案的成功实践,为金融行业乃至其他高性能计算领域提供了宝贵的经验和借鉴。未来,随着AI技术的持续发展和应用场景的不断拓展,对高性能计算网络的需求将越来越大,微众银行的这套解决方案有望在推动行业发展中发挥更大的作用。 这套方案的成功也证明了自主研发和开源协作对于提升中国金融科技竞争力的重要性。