AI 时代重新定义光通信模组

专栏：光通信模组技术深度解析 · 第 01 篇

光通信模组剖面解释图：外壳、PCB、DSP芯片、TOSA、ROSA、光纤接口和散热结构 — 图：把光通信模组先看成一个系统级物体：外壳、PCB、DSP/驱动、TOSA/ROSA、光纤接口和热路径共同决定最终规格。

开篇：一场安静的革命

如果你在几年前向数据中心工程师询问”光模块的瓶颈是什么”，答案大概率是：成本和功耗。而到了 2020 年代中期，同样的问题换了答案：速率、密度、功耗——同时。

这不是技术的微调，而是一次系统性的重新定义。推动这场变革的，是以大语言模型（LLM）为代表的 AI 训练和推理基础设施的爆发式增长。

本篇是专栏开篇，从宏观视角梳理 AI 时代对光通信模组提出的新需求，以及产业链为此做出的架构响应。

一、从 HPC 到 AI 集群：流量拓扑的根本变化

传统高性能计算（HPC）集群的流量模型相对规则：节点间通过 InfiniBand 或以太网互联，南北向接入流量与东西向节点间流量有明显分层，单链路速率需求在 100 Gb/s 量级。

AI 大模型训练集群打破了这一格局：

规模极端扩大。 大模型训练需要数千至数万块 GPU 紧密协同，集群规模跨越量级。

全连接拓扑（All-to-All）。 模型并行（Tensor Parallelism）和流水线并行（Pipeline Parallelism）要求任意节点对之间都能以低延迟、高带宽通信。Fat-Tree 或 Dragonfly 拓扑成为主流，东西向流量密度前所未有。

带宽饥渴。 单节点对外网络带宽需求已达 400 Gb/s 甚至 800 Gb/s，并仍在快速增长。

延迟敏感。 AllReduce、AllGather 等集合通信原语对网络延迟极为敏感，光模块的信号处理延迟成为系统级关键参数。

下图展示了传统 HPC 与 AI 集群在拓扑和带宽需求上的根本差异：

AI 集群与传统 HPC 拓扑对比

二、速率路线图：从 400G 到 1.6T

IEEE 802.3 以太网速率演进

IEEE 802.3 以太网标准是数据中心光模块速率演进的主要驱动力。关键里程碑：

标准	主要速率	关键说明
IEEE 802.3bs	200GbE / 400GbE	首次定义 400G 以太网
IEEE 802.3cd	50GbE / 100GbE / 200GbE	引入 50G 单通道 PAM4
IEEE 802.3ck	100G / 200G / 400G	100G 每通道，支撑 400G/800G 链路
IEEE 802.3df	800GbE / 1.6TbE	定义 800G 和 1.6T 以太网接口

具体参数以 IEEE 802.3 Working Group 官网最新版本为准。

OIF 电气接口：芯片到模块的桥梁

光模块与交换机 ASIC 之间的电气接口，由 OIF CEI（Common Electrical Interface）系列规范定义：

CEI-112G-VSR/MR/LR：112 Gb/s 每通道，当前 400G/800G 模块主流电接口
CEI-224G：224 Gb/s 每通道，支撑 1.6T 模块

OIF CEI 规范严格定义发射端、接收端的信号电平、ISI 容限、抖动预算，确保不同厂商芯片与模块之间可互操作。

封装形态演进

速率提升倒逼封装迭代：

QSFP-DD（400G/800G）：8 通道双密度，向下兼容 QSFP28，由 QSFP-DD MSA 定义
OSFP（400G/800G）：8 通道，热管理性能更佳，由 OSFP MSA 定义
CPO / LPO：共封装光学和线性可插拔光学代表下一代架构方向

三、AI 基础设施催生的新需求维度

功耗：从”考虑”到”约束”

AI 集群中，光模块功耗已成为系统设计硬约束：

一个万卡规模的 GPU 集群可能需要数万个高速光模块。每个模块哪怕节省几瓦，整个集群层面就是 100 kW 量级的节省，直接影响数据中心的 PUE 和运营成本。

这正是 LPO（Linear-drive Pluggable Optics） 方案兴起的根本逻辑——去除模块内 DSP，将均衡任务转移给主机端 ASIC，可将模块功耗降低约 30–50%。代价是对电气通道质量要求更高，OIF 正在制定相关互操作规范。

密度：端口数量决定集群拓扑可能性

交换机前面板端口密度直接决定集群 Bisection Bandwidth。随着单端口速率从 400G 升到 800G 再到 1.6T，单台交换机的端口数量减少，意味着需要更多级交换机才能实现相同规模的全连接。模块速率升级与端口密度必须协同规划。

可靠性与可维护性

AI 训练任务对故障极为敏感——一块光模块失效可能导致整个训练任务中断。这推动了以下需求：

MTBF：模块厂商需提供严格认证数据
DDM/DOM：实时报告光功率、温度、偏置电流，支持主动预测性维护
热插拔可靠性：高频插拔场景下的机械和电气可靠性

四、架构革命：CPO 与 LPO 的技术逻辑

传统可插拔模块的极限

可插拔光模块的核心优势是模块化和可替换性，但随着速率提升，它面临两个物理极限：

电气接口带宽极限。 高速串行信号（112G/224G PAM4）在 PCB 上的插损随频率升高急剧增大，可插拔连接器本身就引入了不可忽视的信道损耗。

散热密度极限。 前面板可插拔位置的散热通道有限，800G 以上模块的热管理面临挑战。

CPO（共封装光学）

CPO 将光引擎直接封装在交换机 ASIC 旁边，大幅缩短电气互联距离，降低功耗，提升信号完整性。Ethernet Alliance 发布的 CPO 白皮书对其架构和潜力做了系统阐述。

CPO 的挑战在于：光模块不再可单独更换，维护成本和供应链管理复杂度显著上升。

LPO（线性可插拔光学）

LPO 保留可插拔形态，但去除模块内 DSP，改用线性驱动。主机侧 ASIC 承担均衡任务，OIF 正在制定 LPO 互操作规范（基于 CEI-112G-LR+ / CEI-224G 电气接口）。LPO 是 400G/800G 向 1.6T 演进路径上的重要过渡技术。

五、产业链全景

光通信模组的产业链涉及多个环节，各自由不同组织主导：

环节	关键产出
标准制定（IEEE/OIF/MSA/Ethernet Alliance）	速率标准、电气接口规范、封装规范
光芯片	EML、VCSEL、硅光子芯片
电芯片（DSP）	400G/800G DSP、SerDes
模块厂商	完整光模块产品
系统集成商	交换机、网卡、HPC 系统

六、工程总结

AI 训练集群是当前光模块技术演进的最强驱动力，带宽需求、规模效应和功耗约束正在重塑整个产业路线图。
速率演进路径清晰：400G → 800G → 1.6T，IEEE 802.3df 为里程碑，OIF CEI-112G/224G 定义电气接口。
封装形态分化：QSFP-DD 和 OSFP 并行演进，CPO 和 LPO 代表下一代架构方向，可插拔形态短期不会消亡。
功耗和密度已成为系统级约束，不再只是性能指标，这推动了 LPO 和 CPO 的商业化进程。
互操作性至关重要：MSA 和 OIF 规范是不同厂商模块与交换机可互换的基础，工程选型时必须确认合规性。

参考来源建议

IEEE 802.3 Working Group：https://www.ieee802.org/3/ — 历次以太网标准正式文本
OIF：https://www.oiforum.com/ — CEI 系列电气接口规范、400ZR、LPO 规范
QSFP-DD MSA：https://www.qsfp-dd.com/ — QSFP-DD 封装规范
OSFP MSA：https://www.osfpmsa.org/ — OSFP 封装规范
Ethernet Alliance：https://ethernetalliance.org/ — CPO 白皮书、以太网路线图

本文为”光通信模组技术深度解析”专栏第 01 篇。下一篇将深入解析光模块的内部架构与工作原理。

事实边界说明：本文侧重工程框架与技术逻辑。涉及速率、功耗、价格、份额等具体数值时，以 IEEE 802.3、OIF、MSA 规范及目标厂商正式 datasheet 为准，不同场景参数不可直接横向套用。