场景介绍
自2015年起,CPU频率趋于稳定。公有云算力提升的边际成本显著提高。然而,应用的激增使得当代数据中心中的网络流量以每年25%的速度急剧增长。为了适应这种巨大的流量增长,网络向高带宽和新型传输体系发展,其网络传输速率迈向100Gbps,且快速向200Gbps与400Gbps发展。
随着数据上云的持续深入,通信能力和计算能力成为数据中心基础设施的相辅相成的两个重要发展方向。若数据中心仅关注计算能力的提升,通信基础设施的提升跟不上,那么数据中心的整体系统性能依然受限,无法发挥出真正的潜力。DPU的提出背景正是应对这些数据量和复杂性的指数级增长,满足公有云将数据计算移至接近数据位置的需求
解决方案
星云智联首款DPU产品NebulaX D1055AS,聚焦云计算的裸金属、虚机、容器等场景,实现网络与存储卸载与加速,提升业务性能,节省主机CPU,简化IaaS运维。产品为PCIe插卡形态,安装于标准服务器内运行,产品功能包括数据面和管控面两部分:
• 数据面以纯硬件方式实现对数据流处理,以获得高吞吐量和低延时性能,其中包括报文分析、流表查找、报文编辑、流量QoS控制、虚拟化队列等处理功能,支持灵活可配置可编程。
• 管控面采用通用的CPU+Linux架构实现,其中DPU OS上运行了OVS控制面、弹性块存储客户端EBS-Client、管理监控等软件,支持带外管理网口,通过管理网络对接云平台。用户可在DPU OS上按需安装部署软件,比如OpenStack Agent,K8S Kubelet等IaaS/PaaS应用,也可移植现有云基础设施中的软件到DPU OS上运行。这种开放的管控面架构,简化了DPU与用户云管控平台集成,加速定制化DPU新功能开发上线。
公有云是最广泛应用的算力基础设施,承载的业务和对网络的需求最为领先,因此对DPU的业务需求也最为多样。在各类前沿业务可能性中,星云智联认为,DPU产品解决方案应首先解决云计算最共性的业务需求,包括裸金属,虚拟机,容器等:
裸金属场景
和传统基于PXE和iSCSI的裸金属服务不同的是,星云智联DPU解决方案有如下优势:
• 芯片硬件实现PCIe virtio-blk和virtio-net设备,HOST侧使用OS内核标准驱动即可运行;
• 运行高性能弹性块存储客户端,支持分布式块存储,实现裸金属服务器的云盘启动,云盘挂载;
• 集成OVS控制面和芯片硬件流表,实现高性能VPC网络;
• 内置DPU OS运行独立的管理监控应用,实现独立于HOST的管理和监控;
• 真正实现了裸金属服务器HOST侧的“0开销”。
虚拟机场景
针对虚拟机场景下,HOST部署OVS网络转发性能差、VM性能隔离不足、热迁移方案复杂、HOST资源占用率高等难题, 星云智联DPU解决方案有如下优势:
星云智联DPU解决方案,在如下方面实现了业界领先:
• 全硬件高密度I/O虚拟化
• 全硬件卸载灵活多样存储栈
• 完整管控面卸载
• 全硬件卸载高性能网络转发
• 创新RDMA更强扩展性
业务需求
客户价值
• vDPA数据直通,支持虚机平滑热迁移;
• 百万级流表,网络数据流量通过芯片硬件高速转发,确保吞吐率和低时延转发性能;
• 芯片硬件全流统计,层级化QoS调度,精准平稳,进一步降低HOST开销;
• 支持标准的OVS RTE_Flow下发接口,便于与控制器集成。
容器场景
面向云原生高密集容器部署等场景,针对容器网络和存储性能开销和可扩展性瓶颈,星云智联DPU解决方案有如下优势:
• 海量的SR-IOV VF和virtio队列,实现高密度容器可硬件直通网络和远端存储;
• 硬件实现频繁的容器流表操作,硬件实现队列和带宽隔离,确保容器拉起/销毁,业务突发等过程中,各个应用保持平稳运行和互不影响;
• CNI/CSI插件为容器网络提供overlay网络和弹性块存储服务,实现更大范围的容器集群的网络和存储资源调度;
• K8S Kubelet可部署于DPU内置OS,实现容器管控与HOST的分离。
公有云解决方案