软件质量新定义:从混沌工程到韧性测试

发布时间:2026-03-21 05:44  点击:1次

长期以来,软件测试的核心目标仅是证明代码按设计运行。然而,现代企业系统已不再处于可预测的环境中。如今的系统多为云原生架构,地理分布广泛,持续更新,且深受AI辅助开发的影响。在这种环境下,软件即便通过了传统测试,一旦依赖项断裂、流量激增或基础设施行为不可预测,仍可能在生产环境中失败。

正是为了解决这一痛点,Harness产品副总裁Umasankar Mukkara多年来致力于推动行业变革。作为开源云原生混沌工程领域的知名人物,Mukkara指出,行业正从传统的混沌工程迈向更广泛的“韧性测试”(Resilience Testing)。其目标不再局限于确认软件是否可用,而是确保系统能够承受故障、快速恢复,并在加速交付的同时,避免留下所谓的“韧性债务”。

Mukkara分析认为,变化的根源在于软件系统本身的演进。一方面,全球及印度等市场的数字化转型加速,对数字服务的需求激增;另一方面,架构从单体转向微服务,组件数量增加了数十倍,交付周期从季度或半年缩短至每日构建。这种高动态性使得传统测试难以覆盖所有未知风险。2018年,Mukkara发起开源项目LitmusChaos,旨在通过故意引入故障来验证系统的韧性,目前已有超过2000家组织在使用。

企业***常提及的异构性、分布式系统及技术债务,在韧性测试面前有了新解法。Mukkara强调,若不做韧性测试,等同于留下了“韧性债务”。这不仅是技术债务,更是未知的未知数。韧性测试涵盖了从小规模的混沌工程(模拟小故障)到大规模灾难恢复(模拟区域宕机、验证RTO和RPO目标)的全方位场景。这些测试共同构成了完整的可靠性策略,弥补了传统质量测试的不足。

关于“左移”(Shift Left)概念,Mukkara指出,其核心已从单纯的功能测试转向将韧性测试纳入软件开发生命周期(SDLC)的准入关卡。虽然Netflix等公司曾推崇在生产环境进行“游戏日”测试,但这需要极高的组织成熟度,难以大规模推广。真正的左移意味着在代码上线前,通过自动化手段在开发阶段就完成韧性验证,从而在文化层面建立质量工程师的韧性思维,逐步减少风险。

市场实践中,Harness采取直接服务与通过大型全球系统集成商(GSI)合作并行的策略。Harness拥有千余家客户,其产品线覆盖软件交付全生命周期,能够从战略层面帮助企业在代码编写后的“外环”(Outer Loop)中提升测试、效率与运维能力。Mukkara观察到,负载测试、混沌测试和灾难恢复测试原本由不同团队分散进行,现在正逐渐融合为统一的韧性测试体系,利用同一基础设施和团队实现端到端的效率提升。

面对AI加速代码生成的趋势,Mukkara认为测试需求不降反升。AI虽然能更快生成代码,但也意味着需要更复杂的测试来保障韧性。行业正从“人工编写测试”转向“AI辅助生成测试”,例如Harness正在开发智能代理来推荐更高效的测试用例。如果交付速度提升十倍而故障率翻倍,将造成巨大的声誉和财务损失。因此,测试创新必须紧随开发创新,甚至更快。

印度在Harness的战略版图中占据重要地位,既是重要的客户市场,也是核心工程基地。Harness在班加罗尔拥有强大的工程团队,超过50%的代码由AI辅助生成,利用时区优势和工程深度加速韧性测试模块的开发。许多全球客户的技术中心也设在此处,成为创新协作的枢纽。

对于中国软件行业而言,随着国内企业加速上云和AI应用落地,单纯的功能测试已无法应对复杂的分布式架构风险,借鉴“韧性测试”理念,将故障恢复能力纳入CI/CD流水线,可能是提升系统稳定性和业务连续性的关键一步。

武汉新唯琪科技有限公司

联系人:
王生(先生)
手机:
15927196990
地址:
武汉东湖新技术开发区流芳园横路3号东一产业园电子装备车间一一楼113(注册地址)
邮件:
planodm@163.com
软件新闻
拨打电话
QQ咨询
请卖家联系我