第20讲:没有ATDD,就没有用户故事的可测试性
文章目录
从这一讲开始,我们就进入了第 4 部分的学习:测试左移更体现敏捷测试的价值。因为敏捷更提倡团队对质量负责、预防缺陷胜于发现缺陷,这两点就意味着我们要构建出高质量的产品,把质量构建推向源头——需求,把测试活动左移到需求阶段,持续地对需求和设计进行评审、及时发现需求和设计的问题。
测试左移的目的是及时发现研发前期的错误,避免将错误带到代码阶段、测试阶段,TDD/ATDD(测试驱动开发/验收测试驱动开发)是更为彻底的测试左移,一次把事情做对,即零缺陷质量管理思想在软件研发中的实践,从而帮助企业节省研发成本并缩短开发时间。测试左移还包括测试计划和设计尽早开始,所有这些就构成了第 4 部分要讨论的内容。
测试左移还包括让开发人员做更多的测试、加强单元测试、持续集成等,在敏捷开发里这些都是核心实践,持续集成已经在第 12 讲讲过了,单元测试的内容将在第 42 讲中介绍。
在第 7 讲介绍敏捷团队中的专职测试人员时,提到过测试人员的责任之一是对软件的可测试性进行把关,可测试性是测试的基础或前提,没有可测试性,谈何测试?这一讲,我就来讲解什么是可测试性、可测试性的不同层次,以及如何提高用户故事的可测试性。
可测试性概念
软件的可测试性,从字面上的意思来说是指一个系统能不能进行测试。从理论上讲,可测试性基本上是由可观察性和可控制性构成的,还可以包括可预见性。
可观察性(Observability)是指在有限的时间内使用输出描述系统当前状态的能力。系统具有可观察性意味着一定要有输出,没有输出就不能了解系统当前处于什么状态,也就不能确定系统行为表现是否正确。
可控制性(Controllability)是指在特定的合理操作情况下,整个配置空间操作或改变系统的能力,包括状态控制和输出控制。系统具有可控制性表明一定要有输入,只有通过输入才能控制系统。
理解了前面两个,那可预见性(Predictability)也就好理解了,就是在一定的输入条件下,输出的结果是可以预测的,这样我们就可以给出系统的预期行为或预期结果,常常用于测试用例设计中。
图1 可控制性和可观察性的示意图
在此基础上,你可以重新理解一下可测试性:通过被测系统提供的接口对系统进行操作,然后,能够通过输出的结果了解到系统的状态是否符合预期。
如果一个系统缺乏可控制性和可观察性,如图 1 所示,可以通过增加接口的方式,使之可以控制它或产生输出。在敏捷测试中,没有自动化测试万万不行,而自动化测试对可测试性提出更高的要求,因为自动化测试更需要明确的输入和输出,所以要求系统能够提供可以调用的接口,通过接口调用来驱动程序运行并验证返回的结果。接口可以是 UI 界面或 UI 下面那一层面向业务的 API, 也可以是微服务模块暴露给其他模块的 API。
AI 软件的可测试性就是一个挑战,因为缺乏可预见性,不太容易事先定义好 Test Oracle 来验证输出结果是否符合预期。比如,Google 在 2018 年公布了用于 NLP(Natural Language Processing,自然语言处理)技术的 BERT(Bidirectional Encoder Representations from Transformers)模型,这个模型通过超过 3 亿个参数提供了强大的语句预测能力。但是,模型处理的结果需要人类去综合判断分析是否正确,并且需要理解参数微调带来的变化。不过,目前人们也在探索如何解决这些问题,第 44 讲会讨论 AI 软件的测试设计与执行。
需求、设计和代码等不同层次的可测试性
对可测试性的需求不仅仅是能够进行自动化测试和手工测试,既然我们要测试左移,那可测试性应该包括三个方面:需求的可测试性、设计的可测试性和代码的可测试性。
需求的可测试性,包括所定义的功能正确性是否能够被判断?输入、输出的数据是否有清楚的定义从而能验证其精准性?系统的性能、可靠性等是否有验证的标准和方法?
设计的可测试性,是指通过设计来确保系统的特性具有可控制性、可观察性。另外,需要通过设计确保系统的简单性。从测试角度来说,设计越复杂,系统各组件之间的耦合度越高,对单个组件的测试难度就越大。
代码的可测试性,一方面要保证需求和设计的可测试性得到实现,比如各项功能需求得到了满足,并且按照设计实现了系统的松散耦合、模块之间的接口定义。
用户故事的可测试性和 ATDD
敏捷开发提倡“可工作的软件胜于完备的文档”,强调开发团队成员之间通过沟通来澄清需求,这就造成文档质量不高、需求描述不清楚。敏捷采用用户故事的形式对需求进行描述,一个用户故事(User Story)通常按照下列的格式(模板)来表述:
As a who(谁?),I want to what(什么行为?)so that why(为何?)。
(作为一个用户角色,我需要做某事,这样就能达到某个目的)
用户故事示例:
作为这家购物网站的买家,我要通过商品名称查询历史订单,这样我就能查看某个订单的详细信息了。
用户故事是以业务语言来描述的,而不是使用技术语言,比如,我要实现微服务 A 的一个 API 供微服务 B 调用,这就不是一个好的用户故事。同时,用户故事必须是可测试的,要不然怎么验证用户故事的实现是不是符合预期?
在实际工作中,也许你经常会碰到这些情况:某个用户故事的描述太简单,每个看到用户故事的人,其理解都不一样,但产品负责人(PO)可能和开发人员有过面对面的沟通,开发人员基本知道做什么,但测试人员还是不清楚,测试就追着开发问这个用户故事究竟要实现到什么程度?开发会说:别急,等过两天,我做好了给你和 PO demo 一下,就清楚了,如果你们觉得不行,我再改。看似态度很好,但测试人员能做什么吗?根本无法设计测试用例或写自动化脚本。
功能性的用户故事还好,非功能性的用户故事不可测问题更大。 例如,用户故事描述是这样的:作为一个注册用户,我希望能够快速地登录到系统内。那么,你会问,究竟多快算快?1 秒钟还是 3 秒钟?
为了保证用户故事是可测试的,需要对用户的实际需求有一个明确的说明,这就是用户故事的验收标准(Acceptance Criteria,AC)。比如,你阅读上面那个用户故事示例,会有很多疑问:
查询历史订单,能够查询多长时间的历史订单?最近一年的,还是没有时间限制?
支持不支持模糊查询?
如果查到多个,如何显示?
如果没有查到,给出什么提示?
查看订单的详细信息,究竟包含哪些项?
有这么多问题不明白,验收标准就是要让这些问题明白,因此为这个用户故事示例增加相关的AC:
缺省是查询过去一年的历史订单;
如果没查到,问用户是否选择一个查询的时段;
支持模糊查询;
按匹配度来排序,而不是按时间排序;
每页最多显示十个记录;
查到后只显示订单号、商品名称、价格和日期;
如果想继续看,再点击订单查看;
……
这样,所要实现的用户故事就清楚了,也可以验证了。如果没有明确的验收标准,就没有用户故事的可测试性。用户故事的验收标准不仅让测试有据可依,而且由于列出了各种条件,开发人员在实现用户故事时就不容易犯错误,代码质量也会高得多。也正因为用户故事的验收标准澄清了需求,避免了开发和测试的争吵,有利于开发和测试的协作,而且减少了沟通成本,可以提高开发效率。
验收测试驱动开发(Acceptance Test Driven Development,ATDD)就是在开发设计、写代码之前,先明确(定义)每个用户故事的验收标准,然后再基于用户故事的验收标准进行开发。这样有利于我们之前强调的“质量是构建出来的”、“预防缺陷比发现缺陷更有价值”。
ATDD 与 TDD(UTDD)的关系
测试驱动开发(Test Driven Development,TDD)是指测试先行的理念,即测试在前、开发在后,提倡在编程之前,先写测试脚本或设计测试用例。TDD 在敏捷开发模式中被称为“测试优先的编程(Test-First Programming)”。
TDD 中测试先行的理念是为了给开发人员对编写的代码有足够的信心,代码的错误可以通过测试来验证。敏捷开发往往是快速迭代,程序设计不足,所以经常需要不断重构代码,而重构的前提是测试就绪,这样重构的质量就可以通过运行已有的测试得到快速的反馈。所以,有了 TDD,程序员就有了勇气进行设计或代码的快速重构,有利于快速迭代和持续交付。
重构是指在不改变代码外在行为的前提下,对代码做出修改。——《重构:改善既有代码的设计》
ATDD 和 UTDD(Unit Test Driven Development,单元测试驱动开发)都属于 TDD 思想指导下的优秀实践,可以看作是 TDD 具体实施过程的两个层次:
ATDD 发生在业务层次,在设计、写代码前就明确需求(用户故事)的验收标准。
UTDD 发生在代码层次,在编码之前写单元测试脚本,然后编写代码直到单元测试通过,这里的 UTDD 相当于传统概念(如极限编程)的 TDD。
在开发实践中,UTDD 在备受推崇的同时,也受到了广泛且持久的争议。 David H.Hansson 是著名的 Web 开发框架 Ruby On Rails 的开发者,他在 2014 年写了一篇文章对 TDD 提出了公开的质疑和否定,该文章是“TDD is dead. Long live testing”(TDD 已死,测试永生)。这篇文章一出来就引起了广泛的讨论,赞成者认为说出了自己的心声,当然也趁机表达了自己的意见,比如,工期紧、时间短根本来不及写单元测试;TDD 对开发人员的要求过高,推行的最大问题在于很多开发人员不会写测试用例,也不会重构代码。
反对者认为 David 对 TDD 的理解是片面的、不正确的,认为 TDD 就是 UTDD,而忽略了 TDD 还包括 ATDD。这里暂时不对 UTDD 进行详细讨论,但就目前的情况来看,UTDD 虽然没有死,但推行的也不好。我在今年年初公布的 2019 年软件测试调查结果中显示,只有 21% 的团队在做静态代码分析、单元测试,更别提更加高大上的 UTDD 了。
而相比 UTDD,面向业务层面的 ATDD 推行起来就比较容易,而且是必须的。因为需求模糊、需求不具有可测试性,你能接受吗?模糊的需求往往意味着返工和浪费,没有可测试性也就意味着无法开展测试。 所以,团队按照验收标准来实现用户故事,是不是理所当然?
到这里,这一讲的内容就讲完了,我简单总结一下:
系统的可测试性包括可观察性、可控制性和可预见性;
明确用户故事的验收标准是让用户故事具备可测试性的关键,也是必要的;
把 TDD 看成是“测试先行”的理念,这样 ATDD 和 UTDD 则是其两个不同层次上的落地实践;
相比 UTDD 引起的争议和推行的困难,ATDD 更容易在实践中落地。
最后出一个思考题:你所在的公司里是在推行 UTDD、还是 ATDD 呢?有哪些挑战和优秀的经验可以分享?欢迎留言讨论。
-– ### 精选评论
文章作者
上次更新 10100-01-10