中科曙光发布国内最大AI4S集群:60000卡国产超智融合算力巅峰

青青百科 百科资讯 2

4月14日,在河南郑州国家超算互联网核心节点,中科曙光正式发布了6万卡AI4S(AI for Science)计算集群并宣布投入使用,这是目前国内规模最大的AI4S计算集群,没有之一。

本次发布的6万卡集群,具备六大特征:强大算力、全面精度、高速互连、存算协同、灵活调度、稳定可靠。

算力层面,6万卡集群的超算算力、AI算力双双达到了全球顶级水平,能够满足软件模型优化、科研应用效率到科学智能体开发的多维需求。

精度层面,集群支持8/16/32/64位宽全精度计算;互连层面搭载国内首款类InfiniBand无损高速网络的scaleFabric系列产品,可充分满足AI4S计算集群对高带宽、低时延网络的极致需求。

存储层面曙光通过存、算、传协同优化,给出了三层协同、五档加速的方案,包括芯片、系统到应用的三层传输协同,核心就是避免存储IO瓶颈。

调度层面集群实现了每秒10000+次并发作业调度效率,通过多元融合调度策略加上数据亲和性算法,让超算和智算的资源可以在同一套系统里灵活调配。

浸没相变液冷加上稳定可靠依托智能化运维、数字孪生系统,稳定性上系统可用性达到99.99%。

整个核心节点还采用了湖水冷却加余热回收方案,从湖中多点取水,退水温度升高控制在1℃以内,余热还能用于供暖和生活热水,等效WUE≈0,年减排二氧化碳4万吨。

硬件参数再强,也要能落地使用,曙光配套推出了国内首个科学大模型一站式开发平台OneScience,集成数十个AI4S热点模型及数据集,覆盖地球科学、生物信息、流体仿真、材料化学等多学科。

通过自然语言交互,用户只需说出科研需求,系统便能自动拆解任务并调度算力,将科研任务完成时间从天级直接压缩到小时级 。

目前集群已落地多个科研场景,覆盖生命科学、材料科学和流体力学等AI4S最核心的应用场景:

3万卡规模蛋白质折叠模拟,较传统算法加速超1000倍;

4.5万卡万亿原子液态水分子动力学模拟,打破世界模拟规模纪录,提升3个数量级以上;

智能湍流直接模拟,规模扩展至百万亿网格。

另外随着6万卡集群的落地,国家超算互联网平台已经构建起国内规模最大的AI4S计算基础设施,总计链接超300万CPU核和超20万GPU卡,接入全国一体化算网调度体系。