日本软银公司近期宣布,在推进通信基础设施智能化与人工智能应用加速并行的战略中,正致力于实现“AI-RAN”架构。该架构旨在同一基础设施上灵活执行与控制AI工作负载及无线接入网(RAN)工作负载。作为核心支撑,软银开发的AITRAS编排器通过与AI代理的协同,构建了管理多集群的高效机制,标志着通信网络向自主化运维迈出了关键一步。
在构建AI-RAN基础设施的运营中,面对多集群环境,最大的挑战在于如何针对复杂场景做出灵活决策。当资源紧张时,系统需合理分布工作负载以分散压力。然而,资源紧张并非单一指标,而是涉及各集群的功耗、资源利用率、网络带宽等多重因素,同时还要综合评估应用性能(如推理吞吐量、延迟)及成本效益。为应对这一多维度评估难题,软银开发了“动态评分框架(Dynamic Scoring Framework)”,将各集群的评估数据集中汇总,从而实现对资源状况的多角度动态把握,辅助做出最优决策。
尽管有了全面的评估数据,但在实际优化中,如何权衡不同目标仍是一个难题。例如,推理吞吐量与功耗通常呈此消彼长的关系,当多个评估轴同时存在此类权衡时,依靠人类设定规则来制定最优策略已变得极其困难。为此,软银提出将AI代理作为解读人类意图的接口,通过AI代理驱动AITRAS编排器执行多集群优化。系统逻辑分工明确:涉及统计处理、机器学习或数理优化的性能保障部分由预设逻辑完成;而基于当前评估数据决定优化哪个指标,则交由AI代理根据人类意图进行判断。
为实现这一目标,软银在技术架构上做了三项关键设计。首先,构建了基于“大型电信模型(LTM)”的AI代理。该模型预先学习了通信基础设施的专业知识,使AI代理在拥有RAN领域知识的前提下,能自主进行资源设定,例如在保障通信需求的同时,将闲置资源分配给AI工作负载。其次,设计了“对AI友好的接口”。通过MCP服务器连接,AITRAS不仅提供评分数值,还附带评分含义、数值范围及所用指标等元数据,确保AI能准确理解数据含义。同时,利用Kubernetes服务账号实施严格的权限管理(RBAC),防止AI误操作访问非授权资源,保障系统安全。最后,引入基于GitOps的审核流程。AI代理制定的优化方案在实施前,会生成变更请求并推送到Git仓库,由运维团队人工审查批准后方可执行。这一机制不仅增加了决策的可靠性,积累的人工审核数据还可反哺AI代理,促进其持续学习。
日本电信运营商正面临人口老龄化导致的劳动力短缺与5G/6G网络复杂度激增的双重压力,推动网络向“零接触”自主运维转型成为行业共识。软银此次发布的AITRAS与AI代理协同方案,正是对这一趋势的深刻回应。通过引入具备行业知识的专用大模型与严谨的“人机协同”流程,软银不仅解决了多目标资源优化的数学难题,更在安全性与可解释性上建立了新标准。对于中国通信行业而言,这种将垂直领域专业知识注入AI、并通过流程控制确保AI决策安全落地的思路,为未来算力网络与通信融合基础设施的自主演进提供了极具价值的参考范式。