在可用性測試中，如何做好義務(wù)評估模型與計量體例？

2018/1/8 9:19:46來源：互聯(lián)網(wǎng)

金蝶云之家用戶研究員-鄭少娜：在可用性測試中，如何去評估測試的場景或流程呢？應(yīng)該包含哪些維度？每個維度要如何測量？怎樣在不同的義務(wù)間做橫向?qū)Ρ?？本文就此逐一講述。

公司的產(chǎn)品最近發(fā)布了一個版本，上線了比較多的新功能。所以必要針對這些新功能做一輪可用性測試。

可用性測試算是用研的一個入門級技能，即使是從業(yè)年限不多的我也已經(jīng)做過多次，基本的方法和流程都比較認識了。但是之前做過的可用性測試有個缺陷：沒有建立一個嚴謹、科學的義務(wù)評估模型。在可用性測試中如何去評估測試的場景或流程呢？應(yīng)該包含哪些維度？每個維度要如何測量？怎樣在不同的義務(wù)間做橫向?qū)Ρ龋?/p>

評估模型

iSO9241中對「可用性」的定義是：特定用戶在特定的使用場景中，為了達到特定目標而使用某產(chǎn)品時，所感受到的有用性、服從和寫意度。

也就是說，在定義好了用戶、場景和目標的前提下，可用性包含了下面三個維度：

有用性（Effectiveness）：用戶完成特定目標的精確和完備程度。
服從（Efficiency）：用戶完成特定目標的服從，與消費的資源（如時間）成反比。
寫意度（Satisfaction）：用戶使用產(chǎn)品時感受到的主觀寫意程度。

優(yōu)秀的可用性必須能夠同時知足有用性、服從和寫意度三個條件，但是這三個維度也有條理之分，一樣平常來說，有用性題目>服從題目>寫意度題目。

在可用性測試中，僅僅了解每個功能的可用性水平還不夠。即使兩個功能的可用性水平一樣，若一個是產(chǎn)品的基本功能、一個是價值不大的邊緣功能，我們照舊必要優(yōu)先去優(yōu)化價值更高的功能。也就是說，在評估一個義務(wù)時，除了可用性之外我們還必要考慮功能自己的價值。尤其是在上線了新功能，或者我們對待測功能的價值還不太確信的時候。

功能的價值可以簡單分為兩部分：用戶價值和商業(yè)價值。盡管偶然候必要在商業(yè)價值和用戶價值之間權(quán)衡，但是作為一個體驗導(dǎo)向的產(chǎn)品，照舊應(yīng)該將用戶價值放在第一位。在用戶價值之上，若能夠知足商業(yè)價值，則是更令人寫意的效果。

所以，在可用性測試中可以用下面這個模型來對測試的義務(wù)進行評估：

測量方法

在上述模型中，有用性、服從、寫意度都是常見的評估維度，有一些經(jīng)驗方法可以參考，用戶價值也可以通過用戶評價獲得。而商業(yè)價值則必要根據(jù)產(chǎn)品的現(xiàn)實情況進行評估，并且這一樣平常是既有的知識，不必要在可用性測試過程中收集這個數(shù)據(jù)。因此在可用性測試中我們必要收集的數(shù)據(jù)就只包含四個維度：有用性、服從、寫意度和用戶價值。

1.有用性

可以用義務(wù)的完成情況來評估有用性，這個數(shù)據(jù)通過觀察用戶的操作過程即可獲得。

義務(wù)完成情況的測量重要參考NNG的建議，將每個用戶的操作效果標記為失敗、部分完成或悉數(shù)完成。

失敗：假如用戶認為本身完成不了而摒棄了義務(wù)，或者超過了限制時間仍然無法完成義務(wù)，則標記為失敗。

必要對每個義務(wù)都設(shè)置一個限制時間。要求對功能特別很是認識的人（相干的產(chǎn)品、設(shè)計師都可以）按照義務(wù)提醒進行操作，記錄完成操作所需的時間，稱為諳練用時。假如想要進步諳練用時的測量正確度，可以多找?guī)讉€熟手操作然后取其用時平均值。義務(wù)的限制時間根據(jù)諳練用時確定，一樣平常是諳練用時的3-10倍，但是最高也不要超過10分鐘（沒有效戶會有耐心花10分鐘完成一個義務(wù)，假如真的必要這么久，說明義務(wù)設(shè)計得太復(fù)雜了）。

可以根據(jù)義務(wù)的難度確定倍數(shù)，假如義務(wù)對于小白用戶來說確實很有難度，那么可以適當延伸義務(wù)限時；假如義務(wù)很簡單，或者其中包含一些輸入的操作，那么可以適當削減義務(wù)限時（由于打字每每比較費時，而且對功能認識的人打字未必比用戶快）。

部分完成：用戶只完成了一部分的義務(wù)，沒有完成義務(wù)卡上的所有要求。比如，你盼望用戶創(chuàng)建一個日程并約請小王加入，用戶成功創(chuàng)建了日程但是卻不知道如何（或者忘了）約請小王，這就是部分完成。之所以要區(qū)分「部分完成」這個類別，是由于它跟100%完成有差距，但是又不能與失敗混為一談。

完成：這個很容易理解，就是在限制時間內(nèi)完成了義務(wù)卡上的所有要求。

最后，我們必要根據(jù)這些數(shù)據(jù)計算每個義務(wù)的成功率。NNG的建議算法是：義務(wù)成功率=(完全完成的用戶數(shù)+部分完成的用戶數(shù)*0.5)/用戶總數(shù)，即完全完成率+部分完成率的一半。

除了用完成、部分完成和失敗來評價義務(wù)完成情況外，還可以考慮另一種體例：順利完成、碰到停滯后完成、失敗。這是我之前使用的計分體例。這種體例下，以上所述的部分完成會被歸于失敗的類別（但假如用戶犯的是無傷大雅的錯誤，比如輸入錯誤，可以視為完成）。而成功完成的用戶會被細分為順利完成的和碰到停滯后完成的。之所以如許區(qū)分是由于這兩種情況揭示了不同的可用水平——能讓用戶輕松地完成的功能可以說是相稱易用的。

2.服從

服從可以用時間測量，對用戶的操作過程計時。

可以從用戶拿到義務(wù)卡開始計時，在用戶公布本身已經(jīng)完成、或者限制時間到了的時候即結(jié)束計時。不要等到用戶讀完義務(wù)卡、開始操作時才計時，由于有的用戶風俗讀完再操作，有的卻喜好一邊讀一邊做。也不要在看到用戶完成了就結(jié)束計時，而要等用戶本身認為他已經(jīng)完成了，由于用戶偶然候會在做完操作之后去檢查本身的操作是否成功了，這也應(yīng)該算作義務(wù)用時的一部分。

計時不必要太正確。手動計時存在幾秒鐘的偏差都算是正常的，而且用戶在操作過程中多說了句話、或者應(yīng)用相應(yīng)速度慢了些，這些都會影響義務(wù)的完成時間（并且許多影響因素跟可用性并沒有關(guān)系）。所以計時只要正確到秒就好了，進步記錄的正確度也沒故意義。

在計算每個義務(wù)的服從水平的時候，可以用用戶的平均用時除以諳練用時所得的倍數(shù)透露表現(xiàn)（數(shù)值越大透露表現(xiàn)服從越低）。

這是為了便于義務(wù)間的橫向比較，由于不同義務(wù)的復(fù)雜度不同，A義務(wù)平均用時1分鐘、B義務(wù)平均用時4分鐘，也不能說明A的操作服從比B高。通過平均用時/諳練用時的比值，可以知道新手與熟手之間的差距，從而了解由于體系的可用性及學習成本給用戶帶來的操作時間損耗。

3.寫意度

寫意度涉及到用戶的主觀評價，因此必要通過用戶自評量表來收集。

這里參考的是Jakob Nielsen使用的一個單題項七點量表，并根據(jù)必要對標題進行了修正：

4.用戶價值

用戶價值是指用戶感知到的功能價值，也必要通過用戶的評價獲得。

由于我們做的是一款辦公軟件，所以通過扣問功能對工作的幫助來了解用戶價值：

寫意度和用戶價值都必要用戶評分，因此用戶在完成每個義務(wù)之后都會拿到同樣的兩個標題，要求對該義務(wù)做出評價。我會把不同義務(wù)的標題打印在統(tǒng)一張紙上，如許用戶在評價時可以參考本身對前面的義務(wù)的評價來調(diào)整分數(shù)。

義務(wù)橫向?qū)Ρ?/strong>

用有用性、服從、寫意度、用戶價值四個維度對義務(wù)進行評價后，我們可以根據(jù)這些數(shù)據(jù)對不同的義務(wù)做橫向?qū)Ρ?，可以通過類似下方如許的折線圖對比不同義務(wù)的情況。

比如從上面這個示例圖中，我們可以看到義務(wù)2的可用性水平是比較低的（有用性水平低、完成時間長、用戶寫意度低），但是它的用戶價值處于相對較高的水平；而義務(wù)3的用戶價值最高，可用性水平居中。

有用性、服從和寫意度都是用來評估可用性水平的。假如根據(jù)這三個數(shù)值計算出可用性水平，直接用可用性去做橫向?qū)Ρ?，是否更方便呢？前文提到在可用性中，有用性題目>服從題目>寫意度題目，所以在計算可用性水平時它們應(yīng)該有不同的權(quán)重；并且因為度量體例的不同，它們的量綱有較大差異（從上圖可以看出），必要做標準化處理。

因此，我們必要對有用性、服從、寫意度分別做標準化處理，然后按照5:3:2的權(quán)重計分（或者其他權(quán)重，按需調(diào)整）：

可用性水平=Z(有用性)*0.5-Z(服從)*0.3+Z(寫意度)*0.2（服從處用減號是由于其用時間測量，數(shù)值越大服從越低）

如許我們得以在同個量綱上比較不同義務(wù)的可用性水平，結(jié)合對功能價值的評估，可以得出類似如許的四象限圖：

如許的象限圖不僅可以幫助我們比較測試的各個功能的情況，還能幫助確定體驗優(yōu)化的優(yōu)先級。功能價值高、可用性差的功能應(yīng)該列入最高優(yōu)先級，其次是功能價值較低、可用性差的功能。

題目優(yōu)先級

除了上述的評估模型外，在可用性測試中我們還會發(fā)現(xiàn)許多可用性題目，這些題目也許是可用性測試產(chǎn)生的最緊張的數(shù)據(jù)了。那么，這些可用性題目是否必要進行優(yōu)先級評估呢？

可用性題目當然是有優(yōu)先級之分的，一個題目是影響了功能的有用性、服從照舊寫意度，就決定了這個題目的優(yōu)先級如何。我認為可以在每個義務(wù)之內(nèi)按照這個標準對發(fā)現(xiàn)的可用性題目進行排序，但是不必要把所有義務(wù)發(fā)現(xiàn)的所有題目羅列出往來來往排列優(yōu)先級。

優(yōu)化可用性題目時應(yīng)該以功能（即可用性測試中的義務(wù)）為單位，而不是以題目為單位——以題目為單位容易只見樹木不見森林，可能在修改了許多細節(jié)后仍然算不上好用。所以排列題目優(yōu)先級時，也建議根據(jù)上面的四象限圖先確定功能的優(yōu)先級，然后再去查看每個功能詳細的可用性題目的優(yōu)先級。

迎接關(guān)注微信公眾號：「UXD-Cloudhub」

[教程作者：互聯(lián)網(wǎng)]

關(guān)鍵詞：可用可用性測試如何做好任務(wù) 評估模型計量

分享到 0

免責聲明：本站文章系圖趣網(wǎng)整理發(fā)布，如需轉(zhuǎn)載，請注明出處，素材資料僅供個人學習與參考，請勿用于商業(yè)用途！
本文地址：http://m.pkvc.cn/tutorial/di3922.html

上一篇:設(shè)計師如何推動本身想法？專訪百度輸入法設(shè)計總監(jiān)JJ Ying

下一篇:天貓設(shè)計師為什么說不真實的產(chǎn)品測試是無效的？

您可能還喜歡

Macaron 馬卡龍系色譜；附HC（16進制碼

7個手機版網(wǎng)頁設(shè)計的原則

折紙多邊形網(wǎng)頁背景效果制作教程

龐門正道：好好玩耍的點線面（上）

網(wǎng)頁設(shè)計中的常見頁面布局方式

WAP APP的柵格設(shè)計

八種很漂亮的排版方法和技巧分享

網(wǎng)頁設(shè)計的首屏標準你了解多少？

字體大寶庫：40款為網(wǎng)頁設(shè)計師準備的時

視覺設(shè)計分享—專題頁面設(shè)計篇

網(wǎng)頁教程分類

設(shè)計理論

ps教程

視覺設(shè)計

移動前端

交互設(shè)計

視頻教程

設(shè)計欣賞

用戶研究

這些是最新的

專訪：石墨文檔產(chǎn)品總監(jiān)羅穎

UI設(shè)計不得不知的移動端UI尺寸適

光音移動設(shè)計規(guī)范 — 表單類

體驗設(shè)計中的排序問題

網(wǎng)頁設(shè)計精粹網(wǎng)頁中那些迷人的按

aliued：響應(yīng)式設(shè)計的現(xiàn)狀與趨勢

10個智能對象處理的ps技巧

網(wǎng)頁UI - 原子設(shè)計理論(上)

如何通過設(shè)計提升banner點擊率？

晉小彥視覺設(shè)計系列文章（二）：全屏

最熱門的教程

多迪杯，轟動全國各大高校的網(wǎng)站設(shè)

Macaron 馬卡龍系色譜；附HC（16進

Cut&Slice me 切圖神器（PhotoSho

jquery Jcrop圖像裁切插件中文ap

PS6教程-特別調(diào)色功能

7個手機版網(wǎng)頁設(shè)計的原則

@media適配不同尺寸的手機

折紙多邊形網(wǎng)頁背景效果制作教程

干貨分享！推薦8個高清無水印無版

國外黃色網(wǎng)站系列欣賞之一

在可用性測試中，如何做好義務(wù)評估模型與計量體例？