随着人工智能数据中心对带宽和功耗需求的激增,行业正加速从电互连向光互连转型,但长期以来,相干光引擎的核心组件——激光器本身,一直是共封装光学(CPO)方案中缺失的关键一环。这一局面上月已被打破,Tower Semiconductor与Scintil Photonics联合宣布,全球首款专为AI基础设施设计的单芯片密集波分复用(DWDM)光引擎已投入量产。该技术通过在单根光纤中传输多个光信号,大幅降低了功耗与延迟,并实现了数十块GPU的高效互联。
Scintil Photonics首席执行官Matt Crowley指出,光学多路复用并非新概念,其历史可追溯至互联网诞生之初。上世纪90年代,电信运营商铺设了大量光纤,最初假设每根光纤仅需单波长传输。然而,当行业发现通过复用技术可在单根光纤中传输数十个波长时,整个通信产业迎来了革命性突破。然而,DWDM技术迟迟未能在AI数据中心部署,主要受限于成本与可扩展性挑战。
AI数据中心的数据传输规模相当于超算的规模化扩展,其核心难点在于“规模扩展”(Scale-up)网络,即直接连接机架或集群内的加速器,而非连接不同集群的“规模外扩”(Scale-out)网络。优化数十块GPU与内存使其作为一个整体运行,要求带宽无缝衔接且延迟极低。目前,网络工程师已用光互连取代铜缆以优化规模外扩网络,而目光正转向规模扩展网络,试图通过共封装光学技术,将光互连进一步推近处理器核心。
“大型芯片公司制造的一切都涉及将光芯片键合到GPU上,”Crowley表示,CPO已成为处理器的输入输出芯片。但若无可扩展的激光集成工艺,便无法在单芯片上实现多波长传输。Scintil与Tower的解决方案采用了“SHIP”(Scintil异质集成光子学)技术,将激光器、光电二极管、调制器等组件集成到大规模生产的硅晶圆上。该工艺始于Tower提供的标准300毫米硅光子晶圆,通过翻转晶圆暴露埋氧层,**键合微小的InP/III-V半导体芯片,并利用先进光刻工具刻蚀衍射光栅,最终形成8个分布式反馈激光器。
最终产品“LEAF Light”光子集成电路集成了两组8阵列的分布式反馈激光器,每个光纤端口可输出8或16个波长,通道间隔为100或200吉赫兹,确保无重叠或模式跳变。配合第二块ASIC芯片控制激光阵列,该设计实现了“慢而宽”的架构演进:将50 Gb/s的数据分散至8个通道,而非单通道传输400 Gb/s,从而大幅提升单根光纤的数据容量与整体能效。该芯片支持单光纤高达1.6太比特/秒的传输速度,未来甚至可能实现每比特低于1皮焦耳的能耗。
Crowley强调,该技术最核心的优势在于降低延迟。在拥有数十甚至数百块GPU的规模扩展网络中,若单个处理器速度过快而网络传输滞后,GPU将陷入等待数据的困境,导致利用率急剧下降。通过低带宽DWDM技术连接多块GPU,可将GPU利用率提升一倍。Scintil与Tower计划到2026年底向客户交付数万台设备,并计划次年将产量提升一个数量级,确保在2028年DWDM技术大规模部署时供应链已准备就绪。
对中国AI产业而言,这一突破标志着光互连技术正从“连接集群”向“融合计算单元”深度演进,对于解决国产AI芯片集群在大规模训练中的通信瓶颈具有极高参考价值,未来应重点关注硅光集成工艺与异构封装技术的本土化突破。