以上按照验证对象来划分的测试验证工作并不能覆盖所有内容,针对项目做具体的方案时还应该考虑设计图纸、设备配置、客户需求等因素来增减条目,才能真正符合验证系统是否满足运行要求的目标。
4 常见问题及案例分享
(1) 测试验证中出现的常见问题
在测试验证过程中,一些设备性能、系统联动方面的问题就暴露出来,这也正是我们做测试验证工作的目的。如果这些问题不及时发现,进行整改,机房上线后就可能出现无法弥补的损失。按照验证对象分类角度,列举相关系统测试验证中出现的常见问题及其危害,分别见表7至表11。
(2) 案例介绍
北京某大型IDC数据中心,总建筑面积25552.51m2,地下1层,地上2层,建筑高度(最高处)19.9m,是原有建筑改造工程。该项目共分三期进行,以二期的第一阶段为例,测试验证工作共涉及4个机房,766个机柜。
测试验证团队针对电气系统、空调系统、智能建筑系统、消防系统、装饰装修系统进行了测试验证工作,共完成77大类测试项目,实时记录4809个数据,其中4400个数据在正常范围内,409个数据偏离正常值。经过对非正常数据的分析,总结出19个问题,主要包括:UPS室空调气流短路,无法有效地给UPS散热;UPS室上面线槽距离UPS太近,UPS散热效果不好;4个机房均为负压,机房密闭性差;PMS、BMS无法正常显示监控数据,仍需继续进行调试;变压器失电后,PMS系统中UPS上口配电柜没有声光报警;机柜运行参数中通讯故障,监控室无数据显示:CCTV系统摄像头编号未编写,软件中无法看到是在什么房间什么位置;CCTV软件中无地图,无法判定是什么位置的摄像头;门禁系统软件地图个别地方与实际不符,需要重新调整,需要添加房间编号;门禁系统延迟时间太长,门状态改变之后至少需要1.5min之后,软件中的状态方能改变;温湿度监控系统现场没有标签,误差值较大;干接点测试中变压器模拟故障时,干接点系统无声光报警;空调的过滤网没有进行固定。这些问题如果不在机房上线前解决,将为机房运行带来非常大的隐患,也为运维工作增加了难度。
用户在收到这些问题反馈之后,及时进行了整改,复测全部合格。目前该数据中心二期已经上线运行,运行状况良好,测试验证工作达到了预期的目标。
测试验证是一个确保系统设计、安装、功能测试、系统联调、运行状态与设计意图相符合的过程,是设施获得良好功能和可靠运行过程中的重要组成部分。一个好的测试验证不应仅满足“测试”相关的设备功能指标,更重要的是“验证”系统是否可以满足运行阶段的要求。运维人员也应利用测试验证的过程,熟悉未来的管理对象,验证设备操作流程的正确性,增加实际操作和应对突发事件的经验。
另外,部分用户认为测试验证工作只与新建项目有关,其实不尽然,测试验证同样也适用于扩建、改造项目和日常的维护活动。对已经运行的数据中心做测试验证,通常称为“健康评估”,就是通过仪表测量、观察、分析等方式,找出隐藏的运行隐患,确保基础设施达到功能要求,实现预期的可靠性和可用性。用户应考虑将“健康评估”作为一种常态的测试验证形式,融入到日常的操作和维护工作中。