今天这篇,小枣君和大家聊聊骨干网光通信的一些最新技术动向。
█ 400G,真的来了
大家也许都有所耳闻,从去年开始,国内运营商骨干网已经全面拉开了 400G 商用的帷幕。
先是 2023 年大量的商用验证,然后是集采的全面启动。2024 年,是规模商用的正式落地。
不久前,2024 年 3 月,中国移动开通了全球首条 400G 全光省际(北京-内蒙古)干线,被视为一个重要的标志事件。
骨干网升级 400G 的原因,是显而易见的。
一方面,居民数字生活(高清视频、远程会议、在线直播、在线游戏等)所带来的消费互联网流量增长,仍在持续。
另一方面,全行业都在推动数字化转型,来自行业数字化系统的流量激增,加剧了骨干网的压力。
骨干网压力陡增,还有一个关键的原因 ——AI 大爆发。
AIGC 大模型崛起之后,引发了一股 AI 浪潮。为了满足 AI 业务的需求,需要建设大量的智算中心。模型从千亿参数向万亿参数发展,GPU 算力集群也从千卡集群走向万卡集群甚至十万卡集群。
小枣君在以前的文章中介绍过,GPU 算力集群其实就是海量的 GPU 卡(GPU 服务器)通过高性能网络(例如 InfiniBand、RoCEv2)连接在一起的一个阵列。它对网络性能和可靠性的要求极高,直接影响到训练效率和成本。
仅从 GPU 服务器的网络端口速率来说,就已经从单口 400G 起步,甚至要用到 800G 或更高。
以前,GPU 算力集群属于 DCN(数据中心内部网络)的范畴。现在,随着集群规模不断扩大,已经开始考虑将分布式智算中心应用于模型训练。
也就是说,将异地的几个智算中心,一起用来进行训练。
这就对 DCI(数据中心互联网络)提出了更高要求,光通信骨干网必须在技术性能上能够满足这一需求。
我们国家在算力上的战略,还是秉承了“全国统筹、整体布局”的思路。从 2022 年 2 月开始,我国启动了东数西算工程,打造全国一体化算力体系。
简单来说,一方面,我们要建设大量的数据中心(相当于电厂),另一方面,也要建设粗壮的骨干传输网络(相当于输电网),把这些算力给“流通”起来,满足各行各业的需求。
█ 400G,是如何做到的?
当前的光通信骨干网,作为整个数字社会底座的光通信网络,必须具备超大带宽(400G,将来 800G 甚至 1.6T)、超低时延(多级时延圈)、超大规模组网(服务于分布式计算,以及刚才说的 AI 集群)、超高稳定性、超高可靠性、超高安全性、超灵活部署、智能运维管控等多方面特性。
今天,主要说说最重要的速率带宽。
光通信技术发展到现在,想要实现速率的提升,无非就是在以下几个方面做文章:
首先,是波特率。
传输速率,是比特率,是单位时间传送的比特个数,单位是 bit / s。
比特率 = 波特率 × 单个调制状态对应的二进制位数。
波特率是单位时间内传送的码元符号(Symbol)的个数。波特率越高,每秒传输的符号越多,当然信息量就越大,速率就上来了。
波特率由光器件的能力决定。器件芯片制程越先进,波特率越高,速率(比特率)就越高。
目前,CMOS 工艺从 16nm 提高到 7nm 和 5nm,波特率也逐渐从 30+Gbaud 提高到 64+Gbaud、90+Gbaud、128+Gbaud。
现在的 400G 能够商用,就是得益于波特率能够达到 128Gbaud。
再看看调制方式。
刚才那个公式,里面的“单个调制状态对应的二进制位数”,就是调制方式决定的。
400G 技术的调制方案,目前主要有 16QAM、16QAM-PCS(PCS 是概率整形技术,下次专门介绍)和 QPSK 三种,适用于不同的应用场景。
光通信和无线通信不太一样,不会一味追求高阶调制。
调制阶数越低,对线路的要求越低,建网成本也越低。所以,长途骨干网早期设计阶段的时候,基本上聚焦于 16QAM 和 QPSK。后来有了 16QAM-PCS,也加入了竞争。
以前没提“东数西算”、运营商们都认为 400G 不会需要太长距离的传输,所以,采用技术更成熟、价格更低的低波特率器件,配合调制阶数较高的 16QAM,是行业的主流意见。
后来,一方面因为传输距离的要求增加,从 1000 多 km 变成几千 km,再一个,128GBaud 波特率器件迅速成熟(在 DCN 场景,800G 迅速崛起,对产业链产生刺激和推动),为 QPSK 脱颖而出创造了条件。
QPSK 对非线性的耐受能力更高,相比 16QAM-PCS 可以适当提高入纤功率。其次,QPSK 的背靠背 OSNR 门限相比 16QAM-PCS 有优化。再有,设置 QPSK 的通道间隔为 150GHz,使得在传输过程中几乎没有滤波代价。
这些优势,都使得 QPSK 逐渐成为行业在骨干网和 DCI 的一致首选。
现在,前两种方案,被考虑的应用场景更多是城域或省干。
第三,是扩展波段。
波特率和调制主要影响的是单波速率。一根光纤,是可以有多个波的,只要频谱范围足够大,就可以了。
单波带宽 × 单纤波数 = 单纤带宽。
前面表格写了,QPSK 400G 的通道间隔达到 150GHz。传统的 C 波段和扩展 C 波段都不足以满足频谱带宽的需求。
于是,现在逐渐采用了 C6T+L6T 的方式,一共是 12THz 的频谱带宽。计算一下,80 个波,单波 400G,一起就是单纤 32T 容量。如果牺牲一点距离,用在省干的话,部署 QPSK 或 16QAM-PCS,容量还能再大些,达到 48T。
关于波段的详细介绍,可以看这里:光通信到底有哪些波段?
扩展波段的最大问题,在于器件是否能够支持,且成本是否可控。这里所说的器件,包括 ITLA、CDM、ICR、EDFA 及 WSS 等,涉及到光的收发和光路交换、放大等。
波段扩展的话,还涉及到一个问题,那就是整合。
现在的波段扩展,其实更像是两套系统(C 和 L)的简单绑定。两套系统独立运作,通过合波的方式,进行传输,然后到了对端,再进行分波,各自继续处理。
两套系统的话,体积会更大,功耗会更高,设计也更复杂。所以,行业需要研究,怎么进行器件整合,真正让一套系统,同时支持不同的扩展波段。也就是实现真正的一体化。
光纤通信,除了光模块和光设备,还需要关注光纤。
现在的主流光纤是 G.652D 光纤。400G QPSK,在 G.652D 上,借助 EDFA 放大,也能传输 1500km。
行业经过多年的验证,已经认定,G.654E 光纤是新的继任者。如果用性能更好的 G.654E,同等条件下,400G QPSK 的传输距离,可以增加 30% 以上。
G.654E 光纤已经具备规模化生产的能力,将在长途干线上进行大规模部署。G.654 系列的一些低损耗光纤,也成为海缆系统跨洋超长距离传输的首选。
除了传统光纤之外。行业还认为,多芯光纤和空心光纤拥有广阔的应用前景。
多芯光纤是一种空分复用,在一个光纤里,塞入更多的纤芯,采用少模,可以大幅提升光纤的容量。
空心光纤就更牛逼了,直接把光纤做成空心,用空气取代玻璃纤芯。
空心光纤被证明可以带来更大的容量、更低的时延,更小的传输损耗,以及超低非线性,被行业一致认为是光通信里最具潜力的技术之一。
█ 400G 的下一步,800G or 1.6T?
400G 正式规模商用之后,整个行业的目光将会放在 400G 以上(beyond 400G)的技术标准体系上。
对于接下来是搞 800G、1.2T 还是 1.6T,行业还在加紧论证。
如果想要实现更高的速率,就必须在“调制方式 + 波特率”上继续做文章。130GBd,或者更高的 260GBd,是必然方向。更高波特率,意味着相关器件必须跟上,形成成熟的产业链。
超过 400G,不能再指望 QPSK 了。16QAM 调制,是行业目前普遍认可的选项。
波段也需要进一步扩展。在扩展 C 和 L 的基础上,考虑往 S 波段、U 波段、E 波段等进行扩展。如果是 C+L+S,那就是 12T+5T,达到 17THz 的频宽。
多方面因素相叠加,单根光纤单个方向传输速率超过 100Tbps,指日可待。
在数据中心内部,800G(基于 100GBd 以上波特率,单通道 100G)已经商用了。单通道 200G、400G、800G,只是时间有早有晚。在这方面,国外的进度更快一些。
随着容量的不断提升,带来的技术挑战也不断增加。光通信的发展,说白了,依赖于器件、芯片、制程、材料。
想要满足前面提到的功耗、安全、运维等方面的要求,还依赖于工艺、架构、封装、人工智能、数字孪生等一系列的创新。产业链上下游需要做的工作,还有很多。未来的路,还很长。
█ 最后的话
光通信是整个社会的数字动脉。这些年,人们对很多技术(包括 5G)都提出过质疑,但没有人会对光通信提出质疑,因为它是社会发展的刚需。
人类数据流量不断增加的趋势,在未来几十年都是不会变的。人工智能技术的高速崛起,会将这个趋势进一步放大。
光通信目前的发展,是无法满足需求的。这意味着,企业会有更大的动力,投入资源进行研发,以获得利润。
希望光通信产业能进一步爆发,为数智社会发展铺平道路。
参考文献:
1、《AI 时代高速光传输关键技术、应用进展及未来展望》,信通院技术与标准研究所,张海懿;
2、《算力网络开启 400G 全光新时代》,中国移动研究院,段晓东;
3、《AI 时代的 400G 全光算力互联网》,中国联通研究院,唐雄燕。
本文来自微信公众号:鲜枣课堂 (ID:xzclasscom),作者:小枣君
广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。