2018年,在I/O开发者大会上,Google推出了专为机器学习设计的芯片TPU的第三代,一个TPU3.0部署可提供超过100Petaflops的运算能力,高密度的设计和高性能的计算速度让Google不得不在其数据中心中引入液冷技术。
国外在液冷技术上的尝试多多少少都是受性能所迫,当传统的配套设施无法满足日益增长的计算和性能需求时,新的技术势必会被催生,液冷也是在这个情境下重整旗鼓逐渐被厂商们重视起来。
4 问题和思路
目前来看,部署液冷还需要面对很多问题。
①原有机房适配的问题。传统机房的承重、管路等设计均来自传统机柜的规格。而在液冷方式下,由于制冷方式的转变,部署环境将会有很大的不同。如果在传统机房部署液冷系统会带来部署成本、部署难度等方面的问题。
②由于浸没式和喷淋式会直接接触发热器件,液体和IT部件之间的兼容性是需要考虑的一个重要问题。IT部件长期浸泡在相关液体中,是否会对其功能和性能带来影响需要关注和验证。另外,液体对人体和环境的友好性也至关重要。
③液冷的行业标准缺失将会阻碍技术的发展。目前,各企业关于液冷的研发处于各自为战野蛮生长的状态,亟需相关的行业标准组织对液冷的标准化进行管理。对液体、供配电、管控、安防和运维等各个方面制定明确的技术要求,促进液冷技术的良性发展。
④我国各大服务器厂商基本都在进行液冷服务器的研发。如果国家能有相关专项进行研发资金的支持,将会更好地推动液冷技术国产化的发展,拉近我国与国际先进水平的距离,更好地实现液冷由中国制造向中国智造的转变。
液冷是一项投入巨大、产出过程较慢的高技术系统工程。除了必须具备传统服务器的设计研发能力之外,还需要有流体相关的经验积累。目前,国内仅有曙光、华为、联想、浪潮等几个传统服务器厂商具有相关产品,此外绿色云图、广东合一也在浸没式和喷淋式液冷方面积累了一定的经验。
我国数据中心行业组织开放数据中心技术推进委员会(ODCC)于2017年成立了液冷项目组,组织系列规范的编写,系列规范已于2018年10月16日“2018开放数据中心峰会”上正式发布。