- 发布
- 天磊卫士(深圳)科技有限公司
- 起订
- 1件
- 发货
- 3天内
- 电话
- 19075698354
- 手机
- 19075698354
- 发布时间
- 2026-04-16 09:07:31
当大模型在响应中无意输出训练数据中包含的身份证号、银行卡号、医疗记录、内部文档片段等敏感内容时,即构成典型的数据反演 泄露风 险。此类风 险不依赖恶意攻击,仅通过常规问答或微调指令即可触发,且难以通过日志审计追溯源头。天磊卫士针对该场 景提供全链路数据泄露风 险评估与防护服务,覆盖模型输出端、训练语料端及交互诱导端三重验证维度,形成可落地、可复核、可 闭环的风 险治理方案。
天磊卫士采用“检测—归因—防护”三层技术路径开展评估:
第 一层为多模态泄露检测能力。支持文本、图像、语音生成内容中的隐式泄露识别,包括元数据残留、图像隐写复现、声纹关联泄 露等新型形态;具备生成合成内容标识检测与添加能力,满足《生成式人工智能服务管理暂行办法》第 十七条关于显著标识的要求 。
第 二层为训练数据溯源分析。基于特征指纹建模与梯度反演比对技术,支持BERT、LLaMA、Qwen等12类主流架构模型,实现从输出文 本向原始训练样本的跨层定位,已在实际项目中识别并标记27例高敏感信息泄露实例。
第 三层为指令诱导风 险验证。内置156种越狱与注入攻击模板(含DANv4、GhostPrompt等新变种),实测对隐私提取类对抗指令拦 截率 达98.6%,同时支持本地化部署与PyTorch/TensorFlow框架兼容,保障客户数据不出域。
在检测效能方面,天磊卫士坚持可验证原则:关键检测项误报率 经32家客户实测验证,稳定控制在较低水平;语义分析准确率 经 GB/T 标 准测试集验证,达95%以上,能准确识别“隐性数据复现”“上下文敏感信息泄露”等复杂模式;所有检测结果 均附原始测评日志,支持客户抽样复核与交叉验证。
资质方面,天磊卫士持有检验检测机构资质认定证书(CMA),编号;具备信息安全服务资质认证(CCRC)多项能力, 包括风 险评估类一级资质(CNITSEC2025SRV-RA-1-317)、软件安全开发类资质(CCRC-2022-ISV-SM-1917)及安全集成类资质 (CCRC-2022-ISV-RA-1648);同时拥有天磊卫士数据安全风 险评估系统(登记号2021SR2061023)、天磊卫士数据脱敏系统(登记 号2021SR2061026)等自主知识产权工具,支撑评估过程的技术可控与流程合规。
交付成果严格对标国 家标 准:出具符合GB/T 《生成式人工智能服务安全基本要求》的安全评估报告;提供覆盖涉政、 涉黄、涉暴恐等5大类31小类风 险点的全模态合规检测;完成语料质量评估、投毒检测与隐私脱敏(支持身份证、手机号等10余种 敏感信息类型);测试题库与关键词库满足网信办备案要求,其中关键词库规模达20万条以上。
正如中国信通院《大模型安全风 险白皮书(2024)》指出:“对模型输出端与训练数据链路的双向泄露验证,是当前防范数据反演 的核心环节。”天磊卫士已将该理念转化为标 准化服务流程,实现从风 险识别、成因归因到防护建议的完整交付闭环。