人工智能正在深刻改变半导体设计的 workflows、岗位设置及数据管理挑战。随着训练和推理负载的增长,数据移动、拥堵及能效问题已超越原始算力,成为行业首要难题。行业正从单纯关注AI工具类型,转向重构底层数据管理策略,从被动存储转向主动、结构化且机器可读的系统。
工程团队必须将分散的日志和设计产物整合为机器可读的数据湖,通过元数据和本体论丰富数据,并构建工具间的高效管道。这一过程需利用Copilot、检索增强生成(RAG)及微调模型,同时严格遵循安全和本地化部署约束。随着数据量激增,EDA数据管理员等新角色应运而生,企业需持续投入数据结构与质量的治理。
若数据仅静止存储而无有效组织,则毫无价值。无论是RAG还是模型微调,都需要从不同集群、工具和项目中收集数据,按项目、流程阶段和团队进行清洗分类。代码、文本、图像、时间序列及二进制格式均需解析分块。这推动了团队从临时文件共享转向集中式数据湖和向量化数据库,数据管理的核心转变为机器可读性与检索效率。
Keysight EDA总经理Simon Rance指出,行业关注点已从“如何引入AI"转向“如何解决数据基础问题”。企业面临数据安全风险、算力瓶颈及AI幻觉等挑战。当前,数据编排优先级已超越创建语言模型本身。若地基不稳,企业将在多个环节陷入停滞,这种瘫痪效应源于数据质量与访问机制的缺失。
Siemens EDA产品总监Niranjan Sitapure强调,EDA数据具有独特性。通用大模型擅长处理互联网文本和代码,但EDA领域存在大量专有格式(如SPRF)及非公开语法,且电路图等复杂图像难以被AI直接理解。这导致微调模型缺乏高质量EDA数据,而RAG应用虽相对直接,但也受限于数据解析和可用性。
为应对挑战,企业正采取两种路径:一是构建类似ChatGPT的EDA Copilot,利用RAG技术提供基础设施和交互界面;二是开发本地微调模型,针对特定设计流程(如SPICE仿真)进行优化,预测运行时间、内存占用及PPA指标。目前,EDA厂商提供技术接口,但数据通常保留在企业本地,通过安全隔离架构实现上下文感知服务。
Synopsys产品营销总监Marc Swinnen介绍,行业正从孤立文件向云原生大数据基础设施演进。以Ansys收购Gear Design Solutions后形成的Seascape数据库为例,其采用“云优先”策略,利用MapReduce等技术实现跨物理域数据的协同分析,这是传统系统无法实现的。
ChipAgents CEO William Wang指出,数据质量而非模型规模才是瓶颈。不良上下文导致智能体输出失效,因此安全与数据溯源比数据规模更重要。企业更关注数据来源、访问权限及模型接触记录。解决之道在于将数据治理嵌入工程工作流,默认提供溯源和访问控制,由智能体自动执行权限管理。
Fraunhofer研究所研究员Martin Neumann-Kipping认为,单纯的大数据已非灵丹妙药,行业需要的是“知情数据”。数据孤岛是主要障碍,必须通过语义层、知识图谱和共同语言将分散数据连接,构建系统级数字孪生。只有将数据视为系统整体的一部分,AI才能真正优化全流程,而非仅做局部修补。
未来,工程师将转型为AI智能体管理者,而EDA数据管理员将成为关键角色。该岗位负责确保数据的结构化、元数据完善、格式统一及权限合规。尽管该角色处于设计后端,看似不够光鲜,却是企业AI战略的基石。若缺乏对数据结构的持续投入,必将陷入“垃圾进、垃圾出”的困境。
随着企业并购增多,数据碎片化问题加剧。Keysight的Rance指出,许多企业仍依赖Confluence或SharePoint等非索引系统,导致数据分散、重复及延迟,进而引发AI幻觉。企业急需建立数据治理团队,明确单一事实来源,解决存储、加密及访问控制等IT基础设施问题。历史遗留的商用服务器已无法支撑海量数据训练与推理,必须升级高性能计算架构。
数据管理范式的转变还带来了独特的组织挑战。如今,工程团队需与IT、安全专家甚至法务部门紧密协作,评估数据出口管制风险及合规性。这些跨部门的复杂评估在过去往往被忽视,如今已成为AI解决方案落地的关键考量,显著增加了项目管理的复杂度。
对中国半导体从业者而言,这一趋势表明,在追逐先进AI算法之前,必须优先夯实数据治理基础,建立统一的数据标准与治理体系,避免陷入“有数据无价值”的陷阱,这将是未来国产EDA工具与AI融合发展的关键胜负手。