运行无节制的可用性测试的6个步骤是:定义研究目标,选择测试软件,编写任务描述,进行先导试验,招募参与者,并分析结果。
许多UX团队依赖于远程可用性测试来有效地从用户那里获得设计反馈。有两种类型的远程用户测试:
- 节制远程测试是指研究人员通过远程屏幕共享软件与参与者进行会议,该软件允许研究人员提供指导,实时观察用户与设计的交互,并针对参与者的会话提出后续问题。
- 无节制远程测试不需要研究员参加每一个测试环节;相反,软件应用程序向用户提供指令,记录他们的操作,并可能向用户询问预先确定的后续问题。
无节制的测试适合你的项目吗?
无节制的研究不包括研究者和研究参与者之间的任何直接互动,这既是它们最大的好处,也是它们最大的缺点。
因为没有必要为每个参与者安排单独的会话,无节制的测试通常比节制的研究快得多。有可能启动一项研究并在几小时内收到结果。无节制的研究还允许你同时收集数十甚至数百个用户的反馈。对于国际研究,你不必在一个不合适的时间起床来匹配用户的时区。
然而,无节制的可用性测试也有重要的局限性:
- 如果没有调节者来解释并帮助参与者从原型的错误或限制中恢复过来,那么早期原型测试是很困难的。
- 如果没有一个调节者,参与者在那些依赖于想象、决策或情绪反应的任务中就会变得不那么投入,也会表现得不那么现实。
为了更好地理解第二个限制,例如,思考一下购物和购买之间的区别。购物可以包括许多不同类型的研究和比较——没有单一的“正确”方法。为了现实地购物,参与者必须首先想象自己需要那个产品,然后注意细节并进行比较。一个假装购物的参与者通常只会看几样商品,然后很快地选择一个看起来合理的。
但是,在现实生活中,那些把自己的钱花在自己真正需要的产品上的消费者表现得非常不同。当然,节制研究也不是完全现实的,但因为参与者意识到调节者正在观察他们,他们会有充分参与任务的社会动机。因此,这种社会压力弥补了节制研究中个人动机的缺乏——在面对面的研究中更是如此。
无节制的研究最适合评估实时网站和应用程序或功能强大的原型。它们适用于研究不需要参与者大量想象力或情感的活动。
无节制的研究需要比节制的研究更细致的计划,因为你不能依靠人类的判断来动态地调整研究程序。对于一个无节制的可用性研究,你需要完成以下所有步骤:
1.定义研究目标和参与者招募标准
选择软件不应该是无节制研究的第一步。在你决定使用哪个测试软件之前,你应该清楚地了解你希望通过研究来完成什么。然后你可以选择最适合你的研究目标的工具,而不是将你的研究限制在特定工具的技术约束之内。明确的学习目标使你能够识别测试软件的必要需求。
不同的研究有不同的目标,一个工具适合一个研究,可能对另一个研究没有任何效果。为了做出好的工具选择,了解研究目标是必要的。
在这个阶段,你还需要考虑你想要研究的参与者的类型。他们的人口年龄结构应该是什么?他们需要被安置在哪里?他们是系统的新用户还是专家?它们是否与目标受众中的特定角色或用户组匹配?这些问题通常是由你的研究目标决定的,也可以为你的工具选择提供信息。
2.选择测试软件
对于无节制的研究,管理测试的软件对于获得有用的结果是绝对关键的。软件必须引导参与者通过会话并记录发生了什么。它也可能控制研究参与者的选择。
幸运的是,有许多不同的无节制的测试服务可用,在不同的价格点有不同的功能组合。过多的选择意味着你现在可以更加批判地选择适合你项目需求的工具。(许多无节制测试工具的功能和价格经常变化,所以一定要将它们与你研究时的需求进行比较。)
这绝对值得你花时间去彻底地研究和试验测试工具,因为在你启动一个研究之后,由于技术限制而将一个研究迁移到一个不同的系统并不有趣!(同样地,尝试整合两种不同工具收集的数据也并不有趣!)
3.写任务说明和后续问题
许多无节制测试服务包括带有通用示例任务的研究模板。不要盲目地模仿它们。你让参与者在你的站点或应用程序上执行的任务应该与你的情况高度相关。一般的任务,例如“这个站点的目的是什么”,不太可能给你好的洞见:要真正评估系统的可用性,你需要编写自己的任务。
在我们培训其他公司运行他们自己的远程可用性测试的经验中,编写任务是大多数研究人员失败的地方,这导致他们无法从他们的研究中得到他们需要的结果。
要为无节制的研究编写良好的任务说明,首先要清楚地说明你希望用户完成的任务(例如:使用帮助部分回答问题、升级帐户或保存文章以供以后阅读)。然后,用具体的、现实的、可操作的说明来描述目标——不要包含使任务过于简单的提示。你需要不同类型的任务说明,这取决于你是在做定性研究还是定量研究。
在无节制的研究中,你希望参与者进行的活动必须比节制会话的任务写得更仔细。如果参与者不理解说明,他们就不能要求进一步解释,如果他们做错了,你也不能要求他们再试一次。如果用户误解了你的指令并执行了错误的任务,那么你的测试就浪费了。无节制任务指令还应该明确地告诉用户何时应该停止;请记住,调节者不会站在那儿要求他们转移到其他任务。
你也应该仔细计划任何后续问题。这些问题可以包括定量的问题,即参与者对活动的主观难度或满意度进行评分。或者你可以问一些开放性的问题,让用户描述体验的特定部分。仔细选择提问的措辞;宽泛的措辞,比如“你如何描述这个品牌?”可能会导致无节制的参与者谈论他们过去的经历,而不是他们刚刚使用的系统。
4.先导试验
先导试验是在实际研究开始前进行的试验,目的是发现研究设计或过程中的任何问题。先导试验对于所有的用户研究来说都是一个好主意,但是对于无节制研究来说尤其重要,因为在研究进行的过程中不会有一个调节者来修复问题。即使是最彻底的先导试验也不可能面面俱到,但你通常可以通过以下方法检测和修复问题:
- 因为措辞含糊而被人们误解的任务说明
- 缺少的任务,或以错误的顺序呈现的任务(特别是在有许多任务的复杂研究中)
- 缺少研究所需功能或内容的原型
- 不兼容或技术限制阻止测试软件捕获你想要记录的数据——特别是当你试图测试内部网或本地移动应用程序时
(如果你的测试软件通过web浏览器扩展来记录数据,那么浏览器或网站的限制可能会阻止它捕获整个页面或网站,或者导致难以分析的低质量记录。如果你是第一次使用测试服务,那么在设置任务之前,先对记录过程进行快速测试。)
你可以通过自己进行一遍研究来发现其中的一些问题,就好像你是一个参与者一样,但是其他的问题只有在你有真正的参与者使用他们自己的设备时才会显现出来。请务必分析在你的先导试验中收集的数据!
5.招募参与者
如果参与者与你的目标受众不匹配,那么看他们使用你的系统就是没有意义的。确保你对参加测试的人有一定的控制权,可以通过筛选问题,也可以通过招募自己的参与者。
有些工具只提供无节制用户测试,参与者来自他们的测试人员组,而其他工具将提供一个URL,以供你分发给自己的测试人员。
使用一个提供的参与者小组是快速和容易的(特别是如果你的产品是与广大消费者相关的)。小组成员也熟悉研究软件,他们一有时间就可以参加你的测试。几乎每个小组都包含一些基本的人口统计过滤,但如果你使用有关参与者行为的问题(而不仅仅是关于他们的年龄或性别)来筛选参与者,大多数研究都会得到更好的结果。如果你测试的体验只与那些符合特定标准的人有关,比如开车或经常在网上购物,那么一定要使用一个工具,它可以让你编写自己的定制筛选问题。
使用小组参与者的缺点是,许多人频繁地做这些研究,以至于他们学会了关注设计的某些方面,并寻找可以批评的东西。为了弥补可能的“专业测试人员”,要招募额外的参与者,并排除那些似乎不诚实地参与活动的人的数据。
在线意味着你可以像测试街道另一边的人一样轻松地测试地球另一边的用户。许多无节制测试服务现在有来自世界各地的参与者。如果你的网站针对的是国际客户,那么无节制的测试是一个很好的方法,可以让你接触到各种各样的地方。只要记住,如果你招募参与者用其他语言完成测试,你还需要一位精通该语言的研究人员或翻译来解释结果。
总而言之:
- B2B站点、针对精英或富人客户的站点以及其他目标受众较窄的服务通常不能使用提供的测试组,必须自己招募测试参与者。
- 针对广大受众的B2C网站和其他服务通常通过使用提供的测试组获得更快更便宜的结果。
- 你并不总是需要最大的测试组,但如果你需要来自特定地区的用户,则某些测试组可能需要很长时间才能完成你的研究。(如果你确实需要特定的受众,请提前与测试服务或测试组管理人员讨论你的需求,如果他们对是否可以这样做一点都不清楚,请考虑使用不同的服务。)
6.分析结果
无节制的研究可以快速积累大量数据,因此你需要一种有组织的、分析性的方法来将这些数据转化为关于你的设计的可操作的洞见。
如果你收集定性的数据,例如参与者操作和评论的视频和音频记录,那么你需要检查每个会话记录。用户的口头和书面评论可能会产生误导,所以你必须观察他们的行为,以了解哪些是有效的,哪些是无效的。在节制研究中,你可以在参与者进行活动时跟随他们,但无节制研究中,你需要能够在之后观看录像。
录屏是有帮助的,但是,在没有录音的情况下,很容易忽略某些行为发生的原因。如果屏幕上什么都没有发生,是因为参与者正在阅读,还是她在考虑下一步该点击哪里?参与者用语言描述他们的行动的录音是必不可少的。(参与者的网络摄像头记录下他们的面部表情也很好,但不是必需的。招募那些有网络摄像头、愿意被记录的参与者可能会比较困难,所以把它作为次要要求。)
在每段录音中,你都要找出问题,疑问,以及对设计的正面和负面反应。如果你只有几段录音要回顾,这个过程可能会比较快,但是对于有几十个参与者的大型研究,视频分析就会变得非常耗时。如果你希望分析大型研究(或进行几个不同的小型研究),寻找一个无节制的测试工具,提供强大的功能视频分析,特别是:
- 当你观看视频时,在视频上贴上时间标签
- 聚合、导出、共享和可视化你添加到视频中的注释
- 制作短剪辑或突出视频重要时刻的视频集
当然,即使这些功能没有内置到无节制测试工具中,你也可以做笔记和视频剪辑——但是包含这些功能的无节制测试服务并不一定比没有这些功能的基本工具贵多少。如果你要分析几个小时以上的录音,那么花更多的钱购买一个可以加速数据分析的工具是值得的。
对于非常大的定性研究,可以考虑使用工具来收集一些定量测量或提供自动转录。这些特性并不能消除仔细检查你的记录的需要,但是它们肯定可以通过将你的注意力引导到可能具有重要意义的特定记录(例如用户满意度较低的记录或提到特定关键字的记录)来加速这个过程。
如果你的研究主要是定量的,你的分析将是非常不同的。你的学习工具将自动收集诸如成功率、任务时间和主观评分等指标。但为了确保你的结论是准确的,你需要回顾你的数据并:
- 通过识别和排除不准确的值来清理数据。例如,如果有几个任务时间比其他任务时间短或长得多,那么调查一下原因,如果由于参与者没有完全完成任务或执行了错误的任务而导致值不准确,则从分析中排除异常值。
- 执行统计测试来评估结果的重要性(特别是当你的目标是比较多个设计或任务时)。
- 生成数据可视化,以帮助向其他人传达你的发现。
一些无节制测试工具可以自动排除异常数据点的过程,许多工具有内置的数据可视化图表。但是,由于千篇一律的图表并不总是显示最重要的结果,如果你计划进行定量分析,请确保你的工具包含导出数据的功能,以便你能够使用Excel或专门的统计软件执行自己的分析。
总结
无节制的研究比节制的测试在会话期间需要更少的工作,但它需要在研究开始前细致的预先计划。
原文链接:https://www.nngroup.com/articles/unmoderated-usability-testing/
翻译:马克笔设计留学
如果对于设计专业留学和作品集有任何疑问,可以随时和我们联系,微信:13718574833,知无不言言无不尽!