問題内容の明確化

第 9 章本手法の評価

9.2 ユーザビリティ評価

9.2.2 問題内容の明確化

 Non-parametric検定

表9.3、表9.4より熟練者ユーザ、初心者ユーザのデータにおいてどちらかで

も正規性が見られなかった場合、Wilcoxon rank sum test[17][18]の実施によってデータを分析する。Wilcoxon rank sum testの結果を表9.7に示す。

表 9.7 Wilcoxon rank sum testを実施した結果

ステップスクロールシングルタップダブルタップ戻る操作時間

step1 ○

step2 ○

step3 ○

step4 ○

step5 ○

step6 ○

step7 × ○

step8

step9 ○ ×

step10 × × ×

step11 ×

step12 × ×

step13 ○ × ×

step14

step15 × × ×

step16 × ×

(○：有意差あり、×：有意差なし)

表 9.8 Nielsen10箇条と問題箇所との対応結果ステップ Nilsen10箇条との対応

step1 ①②④⑤⑦⑧

step2 ②⑥⑩

step3 ②⑤⑥

step4 ②⑤⑥

step5 ①②④⑤⑥⑦⑧⑩

step6 ①②④⑤⑥⑦⑧

step7 ①②④⑤⑦⑧

step9 ②⑥⑩

step13 ②⑥⑩

図 9.2 ステップにおける問題内容の提示例

本システムによってユーザの操作履歴を基に問題視されるステップ、そのステップに存在する問題内容を9ステップに計42項目抽出できた。しかしステップの操作内容がステップ1～7に類似しているステップ9～15からは問題内容がほぼ発見できなかった。問題内容の抽出によって修正箇所の発見を容易にし、

ユーザビリティを向上させることができる。

ユーザテスト後、初心者ユーザにアンケートを取ることでその Android アプリケーションの問題点に関する意見を求めた。アンケートでは、どのステップを操作する際、どのような問題があったかどうかということを調査している。

このアンケートの結果と本手法の結果とを比較することで本研究の有効性を評価する。アンケートによる問題箇所、問題内容の結果を表9.9に示す。アンケートによる問題内容が Nielsen10 箇条のどの項目に対応しているのかが明確になっていなければ本手法との比較ができない。そのためそれぞれの問題内容が含まれる項目をNielsen10箇条と対応させている。さらに表9.9を表9.8と同様な表示にした結果を表9.10に示す。

表 9.9 アンケートによる問題箇所、問題内容

問題箇所（ステップ）問題内容 Nielsen10箇条

step2 step10 入力項目が小さい ②⑥

step1 step9 GUIオブジェクトが直観的に理解困難 ②⑥

step4 step8 step16

操作方法に一貫性がない ③⑤ step4 step5

step7 step12

操作状況が理解困難 ①⑤⑥ step1 step3

step9

デザインかボタンかわからない ①⑤⑥ step1 step5

step9

無駄なGUIオブジェクトが存在 ④⑧

Step6 step8 文章表現が多い ⑧

step4 step5 ヘルプ、マニュアルが必要 ⑨⑩

step5 step13 文章表現がわかりづらい ②⑧

step5 画面の変化がわからない ①③

Step6 step7 step14 step15

スクロール操作できる箇所が不明確 ①

表 9.10 Nielsen10箇条と問題箇所との対応結果（アンケート）

ステップ Nilsen10箇条との対応

step1 ①②④⑤⑥⑧

step2 ②⑤⑥⑩

step3 ①②⑤⑥

step4 ①②④⑤⑥⑨⑩

step5 ①②③④⑤⑥⑧⑨⑩

step6 ①②④⑤⑥⑧

step7 ①②④⑤⑥⑧

Step8 ③⑤⑧

Step9 ①②⑤⑥

Step10 ④⑥

Step11

Step12 ①⑤⑥

Step13 ①②⑤⑥⑧

Step14 ①

Step15 ①

Step16 ④⑤

表 9.10 よりユーザはステップ 11 以外全てのステップにおいて問題点の存在を感じる結果となった。問題内容は15 ステップ中に計50 項目という結果になった。しかし、前述の通り今回のユーザテストではステップ1～7とステップ9

～15 は類似した内容に設定してある。そのため前半のステップ 1～7 に含まれた問題内容の一部がステップ9～15に含まれていた。

第 10 章考察

表9.8と表9.10よりユーザがAndroidアプリケーションを操作した結果、主観的に感じたユーザビリティ上の問題を本手法によって明らかにすることができているのか評価する。また、ユーザには認識されていない潜在的な問題内容、

本手法では抽出できなかった問題内容に関して確認する。また、今回ステップ9

～15はステップ1～7に類似しているためステップ9～15を含めない 9ステップ（ステップ1～8、16）の操作内容が異なっている状態の結果も比較対象とした。本手法による問題内容の発見数とアンケートによる問題内容の発見数の比較表をステップ9～15あり、なしでそれぞれ表10.1、表10.2に示す。

表 10.1 16ステップにおける結果発見数本手法

のみ

アンケートのみ

本手法&

アンケート

本手法 42 6

アンケート 63 27

全体 69 36

表 10.2 ステップ9～15抜きの結果発見数本手法

のみ

アンケートのみ

本手法&

アンケート

本手法 36 4

アンケート 47 15

全体 51 32

まず表10.1では本手法よりもアンケートの方が問題内容を抽出することができている。しかし類似した操作内容であるステップを排除した表10.2では本手法の方が問題内容を多く抽出することができた。これは本手法が操作履歴を基にユーザビリティ評価を行っているため、ユーザのアプリケーション操作の慣れが関係していることが考えられる。よって異なった操作内容のステップを設

定した上で本手法を利用することでより多くの問題内容を発見できると考えられる。

また、表10.1より本手法は本手法とアンケートの共通項目を除いた全体の問題内容69項目のうち42項目を発見し、約60%を満たすことができた。一方、

表 10.2 では本手法とアンケートの共通項目を除いた全体の問題内容 51 項目のうち36項目を発見し、約70%を満たした。よってステップ設定時に異なった操作内容にすることで本手法の精度も向上することが分かった。

表10.2より本手法はアンケートで発見された問題内容の結果と約63%一致した。本手法でのみ発見されたユーザが操作した結果感じることができなかった潜在的な問題は約8%発見することができた。しかし本手法は1つの評価項目に

つきNielsenの10箇条[7]のうち複数項目を対応させているために余分な結果が

抽出された。今回の例としては本手法のみ抽出された項目「⑦使用の柔軟性と効率」である。対象アプリケーションは初心者ユーザと熟練者ユーザで異なった操作を設定していないにもかかわらず項目⑦も本手法では抽出されてしまった。

一方、本手法はアンケートによってのみ発見されたユーザが主観的に問題ありと感じた内容に関しては約 29%満たすことができなかった。ユーザビリティの向上にはユーザの満足度向上が密接に関係しているためユーザの主観的な結果を満たした上で潜在的な問題内容を見つけ出せるようにできるようにしなければならないだろう。

アンケートのみ発見することができた問題内容を本手法でも発見できるように改善するためには大規模なアプリケーションにおける本手法の利用結果が多く必要である。大規模なアプリケーションで操作履歴を取得し、ユーザ操作のなんらかのアルゴリズム（例：シングルタップとスクロールの利用頻度になんらかの関係性があるかを考える、複数のアクションの決まった組み合わせによってユーザ操作のミスを明確にするなど）を分析し、Nielsenの10箇条の項目を対応させることで余計な結果を減らすことができるだろう。さらに、アンケートによって多くのユーザが主観的に感じやすい問題内容をNielsenの10箇条の他に例外として設定しておく。その結果、アンケートのみの発見も減らすことができるだろう。

第 11 章おわりに

本研究では、タブレットに着目し、実行されたインターネットに依存しない

Androidアプリケーションのユーザビリティ評価を行い、UIデザインのユーザ

ビリティを向上するための問題箇所とNielsenのヒューリスティクス10箇条に照らし合わせることで問題内容を自動で抽出する支援手法を提案した。

その結果、ユーザテストで設定するタスクをより細かくステップとして分割することで各評価項目におけるより詳細な Android アプリケーションの問題箇所、問題内容を具体的に抽出することができた。さらに評価者が大量のユーザテスト結果を分析するための時間、労力などを削減することができた。しかし、

ユーザが主観的に感じる問題内容を全て発見することができなかったため、ユーザの操作のアルゴリズムを分析し、新たな手法を考案するためにいくつかの課題が残る。

本研究における今後の課題は以下の通りである。

(1) Web アプリケーション、ネイティブアプリケーションの同様な手法によるユーザビリティ評価

(2) 大規模なAndroidアプリケーションでの本手法の実施

謝辞

本研究を勧めるに当たり、御助言、御助力を頂いた早稲田大学基幹理工学研究科情報理工・情報通信専攻の深澤良彰教授に深く感謝致します。また、2年間に渡るご指導をして頂いた東京女子大学現代教養学部人間科学科の白銀純子准教授、神奈川工科大学情報学部情報ネットワーク・コミュニケーション学科の岩田一助教に深く感謝致します。

参考文献

[1] Android and iOS Squeeze the Competition, Swelling to 96.3% of the Smartphone Operating System Market for Both 4Q14 and CY14

http://www.idc.com/getdoc.jsp?containerId=prUS25450615

[2] Worldwide Tablet Growth Expected to Slow to 7.2% in 2014 Along With First Year of iPad Decline

http://www.idc.com/getdoc.jsp?containerId=prUS25267314

[3] Who’s Winning, iOS or Android? All the Numbers, All in One Place http://techland.time.com/2013/04/16/ios-vs-android/

[4] Nahumi Nugrahaningsih, Marco Porta, Stefania Ricotti, “Gaze Behavior Analysis in Multiple-Answer Tests: an Eye Tracking Investigation”, Proc.

of Information Technology Based Higher Education and Training , 2013.

[5] M´arcio V. Figueira, M.Sc., Dario F.G. de Azevedo, Ph.D., Thais Russomano, Ph.D., Ramon F. Lilienthal, “Evaluation Tests for Eye Tracking Systems”, Proc. of Engineering in Medicine and Biology Society, 2008.

[6] 黒須正明編著,“ユーザビリティテスティングユーザ中心のものづくりに向けて”, 共立出版, 2003.

[7] キャロル・M・バーナム著, 黒須正明監訳, 牧野祐子訳,“実践ユーザビリティテスティング「利用品質」を忘れていませんか”, 翔泳社, 2007.

[8] ユーザインタフェース(UI)デザインとは http://usabilitytest.alco.co.jp/

[9] Normality Tests – StatesDirect

http://www.statsdirect.com/help/default.htm#parametric_methods/norm ality.html

ドキュメント内操作履歴を基にした (ページ 46-58)

第 9 章 本手法の評価