← Back to Blog
光通信模组光模块数据中心光互连高速通信

AI 时代重新定义光通信模组

This article was written in Chinese and auto-translated via Google Translate.
View Chinese Original →

专栏:光通信模组技术深度解析 · 第 01 篇


光通信模组剖面解释图:外壳、PCB、DSP芯片、TOSA、ROSA、光纤接口和散热结构
图:把光通信模组先看成一个系统级物体:外壳、PCB、DSP/驱动、TOSA/ROSA、光纤接口和热路径共同决定最终规格。

开篇:一场安静的革命

如果你在几年前向数据中心工程师询问”光模块的瓶颈是什么”,答案大概率是:成本和功耗。而到了 2020 年代中期,同样的问题换了答案:速率、密度、功耗——同时

这不是技术的微调,而是一次系统性的重新定义。推动这场变革的,是以大语言模型(LLM)为代表的 AI 训练和推理基础设施的爆发式增长。

本篇是专栏开篇,从宏观视角梳理 AI 时代对光通信模组提出的新需求,以及产业链为此做出的架构响应。


一、从 HPC 到 AI 集群:流量拓扑的根本变化

传统高性能计算(HPC)集群的流量模型相对规则:节点间通过 InfiniBand 或以太网互联,南北向接入流量与东西向节点间流量有明显分层,单链路速率需求在 100 Gb/s 量级。

AI 大模型训练集群打破了这一格局:

规模极端扩大。 大模型训练需要数千至数万块 GPU 紧密协同,集群规模跨越量级。

全连接拓扑(All-to-All)。 模型并行(Tensor Parallelism)和流水线并行(Pipeline Parallelism)要求任意节点对之间都能以低延迟、高带宽通信。Fat-Tree 或 Dragonfly 拓扑成为主流,东西向流量密度前所未有。

带宽饥渴。 单节点对外网络带宽需求已达 400 Gb/s 甚至 800 Gb/s,并仍在快速增长。

延迟敏感。 AllReduce、AllGather 等集合通信原语对网络延迟极为敏感,光模块的信号处理延迟成为系统级关键参数。

下图展示了传统 HPC 与 AI 集群在拓扑和带宽需求上的根本差异:

AI 集群与传统 HPC 拓扑对比


二、速率路线图:从 400G 到 1.6T

IEEE 802.3 以太网速率演进

IEEE 802.3 以太网标准是数据中心光模块速率演进的主要驱动力。关键里程碑:

标准主要速率关键说明
IEEE 802.3bs200GbE / 400GbE首次定义 400G 以太网
IEEE 802.3cd50GbE / 100GbE / 200GbE引入 50G 单通道 PAM4
IEEE 802.3ck100G / 200G / 400G100G 每通道,支撑 400G/800G 链路
IEEE 802.3df800GbE / 1.6TbE定义 800G 和 1.6T 以太网接口

具体参数以 IEEE 802.3 Working Group 官网最新版本为准。

OIF 电气接口:芯片到模块的桥梁

光模块与交换机 ASIC 之间的电气接口,由 OIF CEI(Common Electrical Interface)系列规范定义:

  • CEI-112G-VSR/MR/LR:112 Gb/s 每通道,当前 400G/800G 模块主流电接口
  • CEI-224G:224 Gb/s 每通道,支撑 1.6T 模块

OIF CEI 规范严格定义发射端、接收端的信号电平、ISI 容限、抖动预算,确保不同厂商芯片与模块之间可互操作。

封装形态演进

速率提升倒逼封装迭代:

  • QSFP-DD(400G/800G):8 通道双密度,向下兼容 QSFP28,由 QSFP-DD MSA 定义
  • OSFP(400G/800G):8 通道,热管理性能更佳,由 OSFP MSA 定义
  • CPO / LPO:共封装光学和线性可插拔光学代表下一代架构方向

三、AI 基础设施催生的新需求维度

功耗:从”考虑”到”约束”

AI 集群中,光模块功耗已成为系统设计硬约束:

一个万卡规模的 GPU 集群可能需要数万个高速光模块。每个模块哪怕节省几瓦,整个集群层面就是 100 kW 量级的节省,直接影响数据中心的 PUE 和运营成本。

这正是 LPO(Linear-drive Pluggable Optics) 方案兴起的根本逻辑——去除模块内 DSP,将均衡任务转移给主机端 ASIC,可将模块功耗降低约 30–50%。代价是对电气通道质量要求更高,OIF 正在制定相关互操作规范。

密度:端口数量决定集群拓扑可能性

交换机前面板端口密度直接决定集群 Bisection Bandwidth。随着单端口速率从 400G 升到 800G 再到 1.6T,单台交换机的端口数量减少,意味着需要更多级交换机才能实现相同规模的全连接。模块速率升级与端口密度必须协同规划。

可靠性与可维护性

AI 训练任务对故障极为敏感——一块光模块失效可能导致整个训练任务中断。这推动了以下需求:

  • MTBF:模块厂商需提供严格认证数据
  • DDM/DOM:实时报告光功率、温度、偏置电流,支持主动预测性维护
  • 热插拔可靠性:高频插拔场景下的机械和电气可靠性

四、架构革命:CPO 与 LPO 的技术逻辑

传统可插拔模块的极限

可插拔光模块的核心优势是模块化和可替换性,但随着速率提升,它面临两个物理极限:

电气接口带宽极限。 高速串行信号(112G/224G PAM4)在 PCB 上的插损随频率升高急剧增大,可插拔连接器本身就引入了不可忽视的信道损耗。

散热密度极限。 前面板可插拔位置的散热通道有限,800G 以上模块的热管理面临挑战。

CPO(共封装光学)

CPO 将光引擎直接封装在交换机 ASIC 旁边,大幅缩短电气互联距离,降低功耗,提升信号完整性。Ethernet Alliance 发布的 CPO 白皮书对其架构和潜力做了系统阐述。

CPO 的挑战在于:光模块不再可单独更换,维护成本和供应链管理复杂度显著上升。

LPO(线性可插拔光学)

LPO 保留可插拔形态,但去除模块内 DSP,改用线性驱动。主机侧 ASIC 承担均衡任务,OIF 正在制定 LPO 互操作规范(基于 CEI-112G-LR+ / CEI-224G 电气接口)。LPO 是 400G/800G 向 1.6T 演进路径上的重要过渡技术。


五、产业链全景

光通信模组的产业链涉及多个环节,各自由不同组织主导:

环节关键产出
标准制定(IEEE/OIF/MSA/Ethernet Alliance)速率标准、电气接口规范、封装规范
光芯片EML、VCSEL、硅光子芯片
电芯片(DSP)400G/800G DSP、SerDes
模块厂商完整光模块产品
系统集成商交换机、网卡、HPC 系统

六、工程总结

  1. AI 训练集群是当前光模块技术演进的最强驱动力,带宽需求、规模效应和功耗约束正在重塑整个产业路线图。

  2. 速率演进路径清晰:400G → 800G → 1.6T,IEEE 802.3df 为里程碑,OIF CEI-112G/224G 定义电气接口。

  3. 封装形态分化:QSFP-DD 和 OSFP 并行演进,CPO 和 LPO 代表下一代架构方向,可插拔形态短期不会消亡。

  4. 功耗和密度已成为系统级约束,不再只是性能指标,这推动了 LPO 和 CPO 的商业化进程。

  5. 互操作性至关重要:MSA 和 OIF 规范是不同厂商模块与交换机可互换的基础,工程选型时必须确认合规性。


参考来源建议


本文为”光通信模组技术深度解析”专栏第 01 篇。下一篇将深入解析光模块的内部架构与工作原理。

事实边界说明:本文侧重工程框架与技术逻辑。涉及速率、功耗、价格、份额等具体数值时,以 IEEE 802.3、OIF、MSA 规范及目标厂商正式 datasheet 为准,不同场景参数不可直接横向套用。