产品概述|S1400系列

星云智联S1400系列AI智算高速互联网卡专为满足人工智能大模型训练与推理等智算场景的极致需求而设计,凭借其全自研核心技术与卓越性能,为飞速发展的人工智能产业提供极致高效、稳定可靠的全场景互联解决方案与坚实的网络底座。 目前,产品已成功适配DeepSeek的DeepEP开源通信库,显著提升AI计算集群的通信效率,为AI应用创新注入强劲动力。

 

S1400系列AI智算高速互联网卡具备1x400G或2x200G的网络接口模式,采用PCIe Gen 5.0 x16接口,提供高达双向100Mpps的RDMA消息速率。其关键特性包括:全面支持RoCEv2协议标准,并兼容NCCL、DeepEP,BCCL等主流集合通信库,确保与现有AI生态的无缝对接。另外,S1400支持先进的GPUDirect技术(GDR、GDA),为大规模AI计算集群提供了极致的低延迟和高带宽。尤为突出的是,S1400系列AI智算高速互联网卡自研NBL-SRP协议支持对所有RoCE v2操作(包括Write/Atomic/Send/Read等)的DDP方式的乱序接收和选择性重传,并针对GPU侧Atomic操作和低延迟Local read进行了特别优化,这些特性进一步弥补了国内生态在此方面的不足。S1400系列AI智算高速互联网卡大幅优化了数据处理流程,显著提升了AI智算场景下的互联效率。

 

在拥塞控制方面,S1400系列搭载了星云智联自研的NBL-CC算法。该算法基于RTT探测与丢包统计进行主动的端到端拥塞控制,不依赖交换机特定配置,具有参数少、部署便捷、性能优异的特点,能实现快速启动、快速收敛,并保持交换机低队列深度与高吞吐量。实际测试数据显示,NBL-CC相较于传统的DCQCN算法,在平均性能上提升50%,99分位性能提升48%,尤其在短流场景下提升幅度高达60%-100%,有效保障了网络的低队列拥塞和持续高吞吐。配合自研的NBL-SRP协议(逐包多路径、DDP乱序接收、选择性重传、快速重传),S1400系列AI智算高速互联网卡在AI主流场景及有损网络下都能够充分发挥接口带宽潜力,其NCCL通信性能在多个关键指标上展现出持平并且部分超越业界标杆产品,并在特定业务场景时延测试中表现出与国际顶尖产品相媲美的168us优异数据(GDR write 7M + atomic),展现了强大的市场竞争力。

 
 

产品规格

• 产品名称:S1405WQ-F00NHT(1x400G), S1406VQ-F00NHT(2x200G)

• 结构尺寸:半高半长 (HHHL), 单槽位卡 (Single Slot) 尺寸                           

                     

 

 

 

 

• 供电方式:PCIe金手指供电

散热方式:被动散热

• 网络接口:1x400G, 2x200G

• 主机接口:PCIe Gen 5.0x16

 

产品特性

 

网络

• 性能: 双向转发总和100Mpps

                  800Gbps(RDMA)

                  400Gbps(非RDMA) 

• 卸载加速:TOE、 RSS

• 网络协议:IEEE 802.3bs 400 Gigabit

                         Ethernet,RS-FEC

                         IEEE 802.3ad (LACP)

                         IEEE 802.1Q (VLAN)

                         IEEE 802.1ad (QinQ)

                        Jumbo frame (9.6KB)

 

 

 

运维管理

• 日志管理:一键收集

 

 

 

 

RDMA

• 协议:RoCEv2:RC/UD/XRC

              NBL-SRP

• QP:256K

• 拥塞控制:DCQCN+PFC、NBL-CC、 可编程CC

• QoS:ETS、基于QP优先级调度

• GDR:支持

• GDA:支持

• 选择性重传:支持

• 乱序接收:支持

• 负载均衡:支持

• 大模型训练:支持NCCL和其他、基于NCCL的 CCL通信库

• AI推理:支持DeepSeek大模型、适配DeepEP通信库

• 可靠性:选择性重传、超时重传、快速重传