中央大学理工学部情報工学科
卒業研究論文
表の見易さの評価モデル
学籍番号
05D8101013K
杉田 朋晃指導教員 田口 東 教授
2009
年3
月あらまし
本研究では,表の見易さに関する評価モデルの構築と,そこから推定される「見易い表」
の検証を行う.
まず,研究室内アンケートにより,「見易い表」の特徴を分析し,把握する.次に,その 分析結果から表の見易さを定量的に表す評価モデルを構築し,そこから推定された「見易 い表」とモデルの妥当性を学内アンケートにより検証する.
キーワード:リーダビリティー,表の見易さ,評価モデル
目次
第1章 はじめに...1
第2章 リーダビリティーについて...2
2.1 リーダビリティーの概要...2
2.2 リーダビリティーの推定方法...2
2.3 言語モデル法による日本語テキストの難易度推定...3
第3章 表の見易さを評価するモデルの構築...5
3.1 モデル構築アンケートについて...5
3.1.1 モデル構築アンケートの概要...5
3.1.2 モデル構築アンケートの結果,及び考察...8
3.2 表の見易さ評価モデル... 11
3.2.1 評価モデルの概要... 11
3.2.2 評価モデルにおける各評価項目の重み付け... 12
3.2.3 評価モデルから推定される「見易い表」... 13
第4章 表の見易さ評価モデルとそこから推定される「見易い表」の検証... 14
4.1 検証方法... 14
4.2 検証結果と考察... 18
4.2.1 検証アンケートの結果と考察... 18
4.2.2 評価モデルと検証結果との相違点... 27
第5章 おわりに... 28
5.1 まとめ... 28
5.2 今後の課題... 28
謝辞... 29
参考文献... 29 付録
第
1
章 はじめに人々の生活に幅広く用いられる書類等には,情報伝達をスムーズに行うため,「分かり易 い」ことが求められている.テキストにおける「分かり易さ」のことをリーダビリティー と呼び,その関連研究は,英語に対しては1920年代から,日本語に対しては1940年代か ら行われている[2].
リーダビリティーの応用研究として,教育への適用が考えられる.例えば,小学校等で 使用される教材の難易度を数値で表すことは,直接的に教育に携わる教師のみならず,保 護者等に対しても適切な教材が使われているのかどうか,という判断材料の 1 つと成り得 る.
しかし,「分かり易さ」という感覚を定量化する研究の多くは,テキストに関するもので あり,書類に掲載されるグラフや表などに関しての研究は少ない.そこで,テキストの難 易度を推定することと同様に,表の見易さを推定することを試みる.「表の見易さの客観的 評価」を定量化することは,円滑な情報伝達の実現や,適切な教材を選ぶ際の判断材料に なると考えられる.そのためには,表の見易さを測るための基準や方法が必要となる.
本研究では,表に関する見易さについて,モデル構築アンケートを基に分析し,表の見 易さの評価モデルを構築する.さらに,その評価モデルから推定された「見易い表」とそ の評価モデルの検証を行う.
第
2
章 リーダビリティーについて本研究は,リーダビリティーの研究と同様に,人が持つ感覚を定量化することを目的と している.本章では,リーダビリティーについて説明する.
2.1 リーダビリティーの概要
リーダビリティー(readability)というのは,通常,次の三称に用いられる.
(1)筆跡,あるいは印刷された活字の読み易さ
(2)文章の内容に対する興味の度合いによる読み易さ
(3)文章の内容に対する理解しやすさ
この内,3 つ目の意味で用いられることが最も多く,研究数も最も多い[1].また,リーダ ビリティーがテキストの難易度を推定する研究であるのに対し,リスナビリティー
(listenablity)のように「聞き易さ」を推定する研究も行われている.
2.2 リーダビリティーの推定方法
リーダビリティーの難易度推定方法は,大きく分けて次の2種類に分類できる.
z 語長や文長など,いくつかの特徴量の値を公式に代入して難易度を計算する方法(公 式法)
z 複数の言語モデルに対する尤度を計算し,分類問題として難易度を計算する方法(言 語モデル法)
なお,特徴量とは,文長やテキストに対するひらがな・カタカナ・漢字の割合等,テキス トが持つ特徴を数値に置き換えたものである.
言語モデル法による研究として,名古屋大学大学院工学研究科の佐藤らによる教科書コー パスを用いた日本語テキストの難易度推定方法がある[2].コーパスとは,電子化されたテ キストデータベースのことであり,言語研究のための資料を集約したものである.
2.3 言語モデル法による日本語テキストの難易度推定
日本語テキストの難易度推定方法の 1つである言語モデル法について,文献[2]に基づい て述べる.まず,(ⅰ)難易度区分の決定と,(ⅱ)規準コーパスの構築を行う.
(ⅰ)文献[2]において,テキストの難易度を表す区分として学年区分を使用している.こ れは,テキストの難易度が直感的に分かり易く,実用的な区分だと考えられるため である.
(ⅱ)難易度推定を実現させるために,その規準となるコーパスが必要である.これを規 準コーパスと呼ぶ.規準コーパスに含まれるテキストは,その難易度が既知であり,
更に前述の難易度区分を含んでいる必要がある.文献[2]において,規準コーパスの 収集源として教科書が用いられている.
次に,尤度計算によって難易度の推定を行い,テキストの難易度を決定する.文献[2]にお ける,日本語テキストの難易度推定方法を以下に示す.
(1)単語unigramモデルではなく,文字unigramモデルを用いる.
(2)尤度計算により難易度を決定する.
unigramとは一単位を表す言葉であり,単語unigramとは1単語ごと,文字unigramと
は1文字ごとという意味を持つ.単語unigramモデルが1単語ごとに着目し,テキストの 難易度を推定していく方法であるのに対し,文字unigram モデルとは,1文字ごとに着目 し,テキストの難易度を推定していく方法である.
(1)単語unigramモデルではなく,文字unigramモデルを用いる理由
日本語と英語の差異に起因する,以下の理由が挙げられる.単語unigramモデルを用い る場合,全ての文を 1 単語ごとに区切る必要があるが,日本語の場合,全ての文を正確に 単語ごとに区切ることができるという保証がない.しかし,文を 1 文字ごとに区切ること は可能なので,文字unigramモデルを使用する.
(2)尤度計算について
最初に,用語の説明を以下に示す.
難易度クラスGi:あらかじめ設定するN個の難易度クラス(i=1,2,…,N)
言語モデルMi:難易度がGiであることが既知であるテキストの集合から構築した言語モ デル
)
| (x Mi
P :言語モデルMiにおける文字xが生起する確率
前述した規準コーパス用いて,13の難易度クラス(小学校第1学年から高等学校第3学年 までの12クラスと,大学を加えた合計13クラス)のそれぞれに対して文字unigramモデ ルを構築する.言語モデルMiにおいて,文字 が生起する確率x P(x|Mi)は次式で求める.
) , (
) , ) (
| (
i i
i C z D
D x M C
x
P =
∑
z∈Diまず,Di,z,C(z,Di)について,以下に示す.
Di:難易度クラスGiが付与されたテキストの集合(学習テキスト)
z:学習テキストDiに含まれる,異なる文字(ひらがな・カタカナ・漢字のみ)
) , (z Di
C :Diにおける文字zの出現回数
次に,テキストTの難易度を推定するため,各難易度クラス の言語モデル に対し,次 式を用いて尤度を計算する.
Gi Mi
)
| ( log ) , ( )
|
( i
T
i T z C zT P z M
M
L =
∑
∈こうして得られる 13 個の尤度のうち,最大の尤度をとる言語モデル を求め,これに対 応する難易度 を推定結果とする.
Mi
Gi
上述したように,言語モデル法とは尤度による分類から推定結果を決定するものである.
第
3
章 表の見易さを評価するモデルの構築本章では,まず,本研究で使用する中央大学理工学部情報工学科田口研究室内の学生 8 人を対象に行った,表の見易さに関するアンケート(以下,モデル構築アンケート)につ いて説明する.次に,本研究で構築した表の見易さ評価モデルについて説明する.
3.1 モデル構築アンケートについて
本研究で構築した表の見易さ評価モデルの基となる,中央大学理工学部情報工学科田口 研究室内の学生8人を対象に行ったアンケートについて説明する.
3.1.1 モデル構築アンケートの概要
モデル構築アンケートで使用されている用語の説明を以下に示す.
マス:表中の縦と横の格子状に区切られた部分
要素:マス内に書かれている文字,もしくは数字,記号 項目:各要素が何を示しているのか,説明するもの
モデル構築アンケートにおいて,提示したことを以下に示す.
z 表
z 表から読み取りたいこと z より見易い表にするための方針
z それらの方針を用いて,実際に変化させた表の一例
「表」とは,本アンケートで使用した表である.本アンケートでは,適当な表を 1 つ使用 した.この表を表3.1に示す.
表3.1 モデル構築アンケートで使用した表
学部・学科 科目 A 科目 B 科目 C
専任担当科目数(A) 52 0 112
兼任担当科目数(B) 3 0 17
専門教育
専兼比率 %
(A/(A+B)*100)
94.5 86.8
専任担当科目数(A) 29 0 284
兼任担当科目数(B) 47 0 145
学科①
教養教育
専兼比率 %
(A/(A+B)*100)
38.2 66.2
専任担当科目数(A) 57 11 127
兼任担当科目数(B) 9 0 69
専門教育
専兼比率 %
(A/(A+B)*100)
86.4 100 64.8
専任担当科目数(A) 37 7 301
兼任担当科目数(B) 25 19 146
学科②
教養教育
専兼比率 %
(A/(A+B)*100)
59.7 26.9 67.3
専任担当科目数(A) 61 0 114
兼任担当科目数(B) 9 0 79
専門教育
専兼比率 %
(A/(A+B)*100)
87.1 59.1
専任担当科目数(A) 44 14 314
兼任担当科目数(B) 18 21 137
学部①
学科③
教養教育
専兼比率 %
(A/(A+B)*100)
71 40 69.6
「表から読み取りたいこと」とは,被験者が表を見る際に読み取ろうとする対象である.
本アンケートでは,この対象を表3.1の「専兼比率」と予め設定する.
「より見易い表にするための方針」とは,アンケートで使用した表を,被験者にとってよ り見易い表にする際の方針である.方針の具体案は以下の4つである.
z 1マス内の要素位置を移動させる z 目印,もしくは色分けにより強調する z 項目の縦と横とを部分的に入れ替える z 表を複数に分ける
「それらの方針を用いて,実際に変化させた表の一例」とは,上記の4つの方針を用いて,
アンケートで使用した表を変化させたものである.本アンケートでは,上記の 4 つの方針 を用いて変化させた表を9つ用意した.
モデル構築アンケートにおいて,被験者が回答する項目を以下に示す.
z 設問
z 被験者の意見
「設問」は,以下の通りである.
① 1マス内の要素の位置はどこが適していると感じたか:
左詰・中央・右詰・その他
② 目印,もしくは色分けによる強調は必要か:
必要・必要でない・その他
③ 項目の縦と横とを部分的に入れ替えるのは必要か:
入れ替えたほうが良い・入れ替えないほうが良い・その他
④ 表を複数に分けた方が良いか:
分けたほうが良い・分けないほうが良い・その他
⑤ これら4つの方針の内,被験者が重視した順番
これらの設問の内,設問①から④までは選択式であり,設問⑤は記述式である.但し,設 問①から④において,「その他」を選んだ場合は記述式となっている.
「被験者の意見」では,表の見易さについて,アンケートで調査しきれなかった部分に対 する意見を記述させる.
3.1.2 モデル構築アンケートの結果,及び考察
まず,モデル構築アンケートの結果を表3.2に示す.
表3.2 モデル構築アンケート結果
アンケート結果 人数
左詰 1
中央 2
右詰 5
1 マス内の要素の位置はどこが適していると感じたか
その他 0
必要 7
必要ない 0
目印,もしくは色分けによる強調は必要か
その他 1
入れ替えたほうが良い 6
入れ替えないほうが良い 2
項目の縦と横の部分的な入れ替えは必要か
その他 0
分けたほうが良い 2
分けないほうが良い 6
表を複数に分けた方が良いか
その他 0
ポイント
1 マス内の要素の位置 14
目印・強調の有無 16
縦と横の入れ替え 22
これら 4 つの手法の内,被験者が重視した順番
表を複数に分ける 8
設問①から④に関しては人数で振り分けを行った.設問⑤の「これら 4 つの方針の内,被 験者が重視した順番」に関しては,1番目に重視したものに4ポイント,2番目に重視した ものに3ポイント,3番目に重視したものに2ポイント,4番目に重視したものに1ポイン トを付加して,それぞれに振り分けた.また,設問①から④までの回答者は 8 人であった が,設問⑤の回答者は8人中6人であった.
モデル構築アンケートの結果より,各設問に対して回答数が最も多かった意見を反映さ せた表を,表3.3に示す.
表3.3 モデル構築アンケートの結果を反映させた表
学部・学科
専任担当科目数(A) 兼任担当科目数(B)
専兼比率 %
(A/(A+B)*100)
専門教育 52 3 94.5
科目 A
教養教育 29 47 38.2
専門教育 0 0
科目 B
教養教育 0 0
専門教育 112 17 86.8
学科①
科目 C
教養教育 284 145 66.2
専門教育 57 9 86.4
科目 A
教養教育 37 25 59.7
専門教育 11 0 100
科目 B
教養教育 7 19 ※ 26.9
専門教育 127 69 64.8
学科②
科目 C
教養教育 301 146 67.3
専門教育 61 9 87.1
科目 A
教養教育 44 18 71
専門教育 0 0
科目 B
教養教育 14 21 40
専門教育 114 79 59.1
学部①
学科③
科目 C
教養教育 314 137 69.6
次に,アンケート結果の考察を以下に示す.
z 本アンケートではマス内の要素が数字であるためか,8人中5人が右詰を選んでいる.
z 「目印,もしくは色分けによる強調」は,必要と回答した人が8人中7人であり,「そ の他」と回答した人も「色分けによる強調は必要である」と述べている.このことか ら,予め表から読み取りたい対象を設定する場合,その対象を強調したほうが表は見 易いと考えられる.
z 「項目の縦と横の部分的な入れ替え」は,「入れ替えたほうが良い」と回答した人が 8 人中6人であった.本アンケートでは部分的に入れ替えたことにより,表3.1では読み 取りたいと仮定したものが表中ではバラバラであるのに対し,表3.3では一列に並べら れている.この結果,被験者にとって,より見易い表になったと推測できる.
z 表を複数に分けることよりも,「1つにまとめた方が良い」と回答した人が8人中6人 だったので,表の複雑さよりも,それぞれの項目の関連性を重視したと推測できる.
3.2 表の見易さ評価モデル
本研究で構築した表の見易さ評価モデルについて説明する.
3.2.1 評価モデルの概要
表の見易さ評価モデル(以下,評価モデル)は中央大学理工学部情報工学科田口研究室 内の学生 8 人を対象に行われたアンケートを基に構築する.アンケートの結果は本章の表 3.2の通りだが,そこから導いたことを以下に示す.
z 「項目の縦と横の部分的な入れ替え」に関して,研究室内アンケートでは「入れ替え たほうが良い」と回答したものが 8人中6人であったが,これは表から読み取りたい 項目が一列に並べられているためだと推測できる.そのため,評価モデルを構築する 際,項目の縦と横の部分的な入れ替えではなく「表から読み取りたいものが表内で一 列に並んでいるか」と評価項目を変更する.
z 研究室内アンケートの結果を受け,表内の項目数を評価モデルに含める.これは,表 内の項目の縦と横を部分的に入れ替える,もしくは表を複数に分ける(もしくは複数 の表を1つにまとめる)場合,要素数は変わらなくても項目数が変わるためである.
以上より,評価モデルの評価項目を以下の2つに決定する.
z 表から読み取りたい部分が一列に並べられているかどうか z 表を複数に分けるかどうか
また,それぞれの評価項目に対する場合分けを以下に示す.
z 表から読み取りたい部分が一列に並べられているかどうか:ある場合−ない場合 z 表を複数に分けるかどうか:分ける場合−分けない場合
よって,評価モデルにおける評価項目は 2つ,さらにその場合分けの数はそれぞれ2つ,
合計4通りで評価を行う.
3.2.2 評価モデルにおける各評価項目の重み付け
評価モデルにおける各評価項目の重みを,以下のように決定する.まず,モデル構築ア ンケートの結果から得られた,「これら4つの方針の内,被験者が重視した順番」のポイン ト付けを,そのまま各評価項目の重みとする.次に,各評価項目の場合分けに対して,各 評価項目に割り当てられた重みと各場合分けに対する人数の割合を掛けることにより,表 の見易さを示す値である評価値を決定する.具体的に言えば,モデル構築アンケートの結 果から,「項目の縦と横の部分的な入れ替え」は22ポイント,「表を複数に分ける」は8ポ イントであったため,それを各評価項目の重みとする.但し,3.2.1項で述べたように,「項 目の縦と横の部分的な入れ替え」は「表から読み取りたいものが一列にある」に変更した.
次に,例えば,「表から読み取りたいものが一列にあるかどうか」の重み22に対して,「あ る場合」は6/8を,「ない場合」は2/8を掛けた値を,各評価項目の各場合分けに対する最 終的な重みとする.以上のようにして決定した各評価項目の重みを表3.4に示す.
表3.4 評価モデルにおける重み付け
評価項目 各評価項目に対する重み 場合分け 各場合分けに対する重み
ある場合 16.5
表から読み取りたい部分が 1 列に並べられているかどうか 22
ない場合 5.5
分けない場合 6
表を複数に分けるかどうか 8
分ける場合 2
また,表に対する評価の仕方は以下の通りである.
(1) 各評価項目において,各場合分けに対する値を決定する.
(2) 2 つの評価項目のそれぞれに対して値が決定した後,それらの合計値を表の見易さ に対する値(評価値)として決定する.
この評価モデルによれば,本章の表3.1の評価値は11.5,表3.3の評価値は22.5という結 果になり,数値の高い表3.3の方が見易い表であることが分かる.
3.2.3 評価モデルから推定される「見易い表」
評価モデルによれば,「表から読み取りたいものが一列にあり,更に表自体が複数に分け られていない表」の数値が一番高くなる.即ち,そのような表が,本研究においては最も 見易い表であると推測できる.逆に「表から読み取りたいものが一列に並んでない,更に 表自体が複数に分けられている表」の数値が一番低くなる.即ち,そのような表が,本研 究においては最も見辛い表であると推測できる.
第4章 表の見易さ評価モデルとそこから推定される「見易い表」
の検証
本章では,第 3 章で構築した表の見易さ評価モデル(以下,評価モデル)と,そこから 推定される「見易い表」に対しての検証方法,そしてその結果について説明し,考察する.
4.1 検証方法
本研究で構築した表の見易さ評価モデルを検証するため,アンケートを行った.
中央大学理工学部情報工学科内の学生14人を対象に行った検証アンケートについて,以 下に示す.
検証アンケートの回答者の属性を以下に示す.
z 回答者数:14人
z 性別:男性12人,女性2人 z 年齢:20代前半
検証アンケートにおいて,提示した内容を以下に示す.
z 表から読み取りたいこと
z 評価項目ごとに変化させた表の一覧
「表から読み取りたいこと」とは,被験者が表を見たときの目的である.本アンケートで は,モデル構築アンケートで使用した表とは異なる表を3種類用意し,それら3種類の表 に対して,以下の様な目的数を設定する.これは,表から読み取りたいことが必ずしも 1 つではなく,複数存在する場合が考えられるためである.
① 目的を1つ設定した表
② 目的を複数設定した表
③ 目的を設定しなかった表
「目的を1つ設定した表」に関しては,同じ表に対して2種類の目的を設定する.これは,
目的の違いが表の見易さに与える影響を調べるために行う.
「評価項目ごとに変化させた表の一覧」とは,用意した3種類の表を,本研究の第 3章に 示した表の見易さ評価モデルに基づいて変化させた表の一覧である.本アンケートでは,
全部で17個の表を用意した.これらの表の詳細を,付録に記載する.また,本研究で構築 した評価モデルによって求めた,検証アンケートで使用した全ての表に対する評価値を,
図4.1から図4.3に示す.
5.5 5.5
16.5 16.5
5.5 5.5
16.5 16.5
6 6
6 6
2 2
2 2
0 5 10 15 20 25
1 2 3 4 5 6 7 8
表番号 評
価 値
表から読み取りたい部分が一列に並べられているかどうか 表を複数に分けるかどうか
11.5 11.5
22.5 22.5
7.5 7.5
18.5 18.5
図4.1 検証アンケートに使用した表1群の評価モデルによる評価値
16.5
5.5
16.5 16.5
5.5
16.5 6
6
2 2
2
2
0 5 10 15 20 25
1 2 3 4 5 6
表番号 評
価 値
表から読み取りたい部分が1列に並べられているかどうか 表を複数に分けるかどうか
11.5
18.5 18.5 18.5
7.5 22.5
図4.2 検証アンケートに使用した表2群の評価モデルによる評価値
5.5
16.5 16.5
6
6
2
0 5 10 15 20 25
1 2 3
表番号 評
価 値
表から読み取りたい部分が1列に並べられているかどうか 表を複数に分けるかどうか 18.5
22.5
11.5
図4.3 検証アンケートに使用した表3群の評価モデルによる評価値
上記の3つの図において,縦軸は評価モデルによる評価値を,横軸は表番号を表している.
前述した通り,検証アンケートで使用した表は,全部で 3 種類であり,それらを評価モデ ルの方針に従って変化させた表は全部で17個である.表1を基に評価モデルの方針により 変化させた表は全部で8個あり,それらを表1群とした.同様に,表2と表3を基に評価 モデルの方針により変化させた表は,表2に対しては全部で6個,表3に対しては全部で3 個であり,それぞれ表2群,表3群とした.
さらに,各表価値に対する表の特徴を表4.1に示す.
表4.1 評価モデルによる評価値に対する各表の特徴
表の特徴
表から読み取りたい部分が一列に並べられているかどうか 表が複数に分けられているかどうか
評価モデルによる評価値
並べられている 分けられていない 22.5
並べられている 分けられている 18.5
並べられていない 分けられていない 11.5
並べられていない 分けられている 7.5
表1群と表2群に関して,同じ評価値の異なる2つの表が存在する.その理由として,次 の2つが挙げられる.
z 同じ評価値の 2 つの表に関して,例えば,それぞれの表の分け方の方針が異なる場合 や,表内における全ての項目数の和が異なる場合等,基となった表が同じでも変化さ せた方針によって,表の見易さに対する違いが生じる.
z 検証アンケートの目的は,本研究で構築した評価モデルの検証である.そのため,同 じ評価値でも異なる 2 つの表をそれぞれ使用することで,より詳細に評価モデルを検 証できると判断したため,アンケートに掲載した.
検証アンケートにおいて,被験者が回答する項目を以下に示す.
z 設問
z 被験者の意見
「設問」は以下の通りである.
(ⅰ)1番見易い表はどれか
(ⅱ)2番目に見易い表はどれか
(ⅲ)1番見辛い表はどれか
(ⅳ)設問(ⅰ)から(ⅲ)に対して,それぞれを選んだ理由,もしくは選んだ方針につ いて考えたこと
これらの設問の内,設問(ⅰ)から(ⅲ)までは選択式であり,設問(ⅳ)は記述式であ る.「被験者の意見」では,表の見易さについて,アンケートでは調査しきれなかった部分 に対する意見を記述させた.なお,検証アンケートで使用した表の詳細は付録に記載する.
4.2 検証結果と考察
4.2.1 検証アンケートの結果と考察
本項では,学内アンケートによる検証結果について説明し,考察する.
まず,検証アンケートの結果を図 4.4から図4.7 に示す.但し,(ⅲ)1番見づらいと感 じた表に関しては,アンケートの回答数を負の値にする.これは,アンケート結果から見 易いと判断された表と,見づらいと判断された表の傾向を掴みやすくするためである.ま た,表1群については同じ表群を使用し,異なった2つの目的を設定したため設問1−1,
設問1−2のように分けて表記する.
1
4 4
2
1 1 1
0 4
0
4
2
0
1
3
0
-1
-2
-3
-2
0
-3
-1
-2
-4 -3 -2 -1 0 1 2 3 4 5
1 2 3 4 5 6 7 8
表番号 ア
ン ケー ト 結 果
アンケート結果:1番見易いと感じた表 アンケート結果:2番目に見易いと感じた表 アンケート結果:1番見づらいと感じた表
1 2 3 4 5 6 7 8
図4.4 検証アンケート結果:設問1−1
1 1
3
0
1
2 2
4 3
0
5
0 0
3
2
1
-1
-3
-1
-7
-1
0 0
-1
-8 -6 -4 -2 0 2 4 6
1 2 3 4 5 6 7 8
表番号 ア
ン ケー ト 結 果
アンケート結果:1番見易いと感じた表 アンケート結果:2番目に見易いと感じた表 アンケート結果:1番見づらいと感じた表
1 2 3 4 5 6 7 8
図4.5 検証アンケート結果:設問1−2
4
0 0
1
4
5
0 0
3
2
6
3
-2
-5
-2
-3
-2
0
-6 -4 -2 0 2 4 6 8
1 2 3 4 5 6
表番号 ア
ン ケー ト 結 果
アンケート結果:1番見易いと感じた表 アンケート結果:2番目に見易いと感じた表 アンケート結果:1番見づらいと感じた表
1 2 3 4 5 6
図4.6 検証アンケート結果:設問2
0
6
8
2
7
5
-12
-1 -1
-15 -10 -5 0 5 10
1 2 3
表番号 ア
ン ケー ト 結 果
アンケート結果:1番見易いと感じた表 アンケート結果:2番目に見易いと感じた表 アンケート結果:1番見づらいと感じた表
1 2 3
図4.7 検証アンケート結果:設問3
上記の4つの図において,縦軸はアンケートの回答数を,横軸は表番号を表している.
なお,図4.4から図4.7において,見易いと判断できる表と見づらいと判断できる表の傾 向が掴みづらいものがある.その事例と,理由として考えられることを以下に示す.
z サンプル数が十分ではない.例えば,表 3 群のように,選択する表の全体数が比較的 少ない場合,見易いと判断できる表と見づらいと判断できる表を明確に区別すること ができる.しかし,表 1 群のように選択する表の全体数が比較的多い場合,偶然ある 表に回答数が集まったのか,それとも回答数が集まった明確な理由が存在するのか,
それらを区別することが難しい.同様に,サンプル数が少ないことから,例えば表 1 群の表番号1と表番号 7のように,(ⅰ),(ⅱ),(ⅲ)それぞれの回答数の違いから,
表の見易さに関する優劣をつけるのは難しい.
z アンケート結果より,(ⅰ)1番見易いと感じた表,(ⅱ)2番目に見易いと感じた表に 対する回答数が多く,さらに(ⅲ)1番見づらいと感じた表に対する回答数が少ない場 合,その表は比較的見易い表であると推測できる.しかし,例えば表 1 群の表番号 3 のように,それぞれの回答数が多い表は,見易い表なのか,見づらい表なのかの区別 が難しい.
以上のことから,図4.4から図4.7からは「見易い表」,もしくは「見づらい表」の傾向は 掴めても,その要因を把握することは難しいと考えられる.
次に,各設問に対する結果と考察を以下に示す.
(1) 設問1−1に対するアンケート結果と考察
[アンケート結果]
z (ⅰ)「1番見易いと感じた表」に対して,最も回答数が多かったのは表番号2と表番 号3であり,回答数は4であった.
z (ⅱ)「2番目に見易いと感じた表」に対して,最も回答数が多かったのは表番号1と 表番号3であり,回答数は4であった.次いで,表番号7が回答数3であった.
z (ⅲ)「1番見づらいと感じた表」に対して,最も回答数が多かったのは表番号3と表 番号6であり,回答数は3であった.
z (ⅳ)「被験者の意見」を表4.2に示す.
表4.2 設問1−1に関する被験者の意見
設問1-1
z 文字数が多い項目は上段にあると見易い.上も下も,選ぶ項目が多いと見 比べ難い.
z 項目はなるべく小さいほうが見易い.
z 左→右に徐々に項目が枝分かれするほうが見易い.
z カテゴリーの規模の大きさ順にまとまっていると見易い.
z できるだけ目を動かさずに,読み取りたい部分が分かると見易い.
z 表から読み取りたい部分が見渡せる位置にあること,更にそれらが縦に並 ぶと見易い.
z 表は 1 つのほうが見易い.表から読み取りたい部分は並んだほうが良い.
2 つの項目の関係性が読み取りやすいと見易い.
z 表から読み取りたい部分が縦に並んでいると見易く,バラバラだと見づら い.
以上のことから,表番号1,表番号2,表番号3が比較的,見易い表と判断できる.逆に,
表番号6,表番号8が比較的,見づらい表と判断できる.
[考察]
z 図4.1と図4.4から,表自体が1つにまとめられたもののほうが,比較的見易いという ことが分かる.これは,表を複数に分けることで「表から読み取りたい対象」が複数 に分けられてしまったため,見づらくなったと推測できる.
z 評価モデルでは最も評価値が高かった表番号3と表番号4だが,表番号4には見易い という回答が集まらなかった.これは,表から読み取りたい部分である項目と,それ を指し示す要素の位置が離れていたためと推測できる.
z 表番号 1と表番号2 に関して,どちらも表から読み取りたい部分がバラバラであるに も関わらず,アンケート結果では比較的見易いという回答を集めた.但し,表番号 3 や表番号 7 のように,表から読み取りたい部分が一列に並んでいる場合も見易いとい う回答を集めていることや,被験者の意見等から,表から読み取りたい部分が一列に 並んでいると見易いが,表の中での位置関係によっては,表の見易さに対してそれほ ど大きな要因とはならない場合もあると考えられる.逆に,表番号4や表番号 8のよ うに,表から読み取りたい部分である項目と,それを指し示す要素の位置が離れてい る場合,見づらい表になることが推測できる.
(2) 設問1−2に対するアンケート結果
[アンケート結果]
z (ⅰ)「1番見易いと感じた表」に対して,最も回答数が多かったのは表番号8であり,
回答数は4であった.次いで,表番号3が回答数3であった.
z (ⅱ)「2番目に見易いと感じた表」に対して,最も回答数が多かったのは表番号3で あり,回答数は5であった.次いで,表番号1と表番号6が回答数3であった.
z (ⅲ)「1番見づらいと感じた表」に対して,最も回答数が多かったのは表番号4であ り,回答数は7であった.次いで,表番号2が回答数3であった.
z (ⅳ)「被験者の意見」を表4.3に示す.
表4.3 設問1−2に関する被験者の意見
設問1-2
z 項目の反復が多いと見づらい.
z 大きなカテゴリー順に分かれていると見易い.見比べたい項目が遠いと 見づらい.
z 大きいカテゴリー順だと見易い.
z 2 項目の比較ならば,表を分けたほうが頭の切り替えが楽なので見易い.
z 表が 2 つのほうが見易い.
z 表を複数に分けても,読み取りたい部分が読み取れるのであれば,分け たほうが見易い.
z 着目するものが縦並びのほうが見易い.
z 表から読み取りたい部分が縦に並んでいると見やすく,バラバラだと見 づらい.
以上のことから,表番号3,表番号6,表番号8が比較的,見易い表と判断できる.逆に,
表番号2,表番号4が比較的,見づらい表と判断できる.
[考察]
z 表を複数に分けた場合でも,比較的見易いという回答を集めた.これは,表から読み 取りたい対象を「系統別に見たい場合」とし,さらに表の分け方も系統別に分けてい たためだと推測できる.
z 表自体が1つである表番号 1と表番号3も,見易いという回答を集めた.これは,ど ちらの表も,表の構造が系統別に大きく分けられているためだと推測できる.逆に,
一見して系統別に見ることが困難だと考えられる表番号 4 に,見づらいという回答が 集まったことからも,一見して系統別に見ることが比較的簡単な表は見易いと推測で きる.
(3) 設問2に対するアンケート結果
[アンケート結果]
z (ⅰ)「1番見易いと感じた表」に対して,最も回答数が多かったのは表番号6であり,
回答数は5であった.次いで,表番号1と表番号5が回答数4であった.
z (ⅱ)「2番目に見易いと感じた表」に対して,最も回答数が多かったのは表番号5で あり,回答数は6であった.続いて,表番号3と表番号6が回答数3であった.
z (ⅲ)「1番見づらいと感じた表」に対して,最も回答数が多かったのは表番号2であ り,回答数は5であった.次いで,表番号4が回答数3であった.
z (ⅳ)被験者の意見を表4.4に示す.
表4.4 設問2に関する被験者の意見
設問2
z 見比べたい項目が近いと見易い.逆に,見比べたい項が遠いと見づらい.
z 比較対象が分かれていると読むのに少し時間がかかる.
z 表を分けても,読み取りたい情報が読み取れるので分けたほうが見易い.
z いらない情報を除きやすいほうが良い.読み取りたい部分を別々にする と見づらい.
z 見たい項目が離れていると見づらい.
z 表が複雑だと見づらい.
以上のことから,表番号 5,表番号 6 が比較的,見易い表と判断できる.逆に,表番号 2 が比較的,見づらい表と判断できる.
[考察]
z 表番号1と表番号6に見易いという回答が集まったことから,表の中で2つ以上の異 なる単位が使われている場合,それらを明確に区別できるように配置されていると見 易いと推測できる.表番号 2 に見づらいという回答が集まっていることからも,この ことは推測できる.
z 表を複数に分けた場合,その分け方で見易さの違いが見られた.例えば,表番号 3 と 表番号 4 は表を複数に分けることで,読み取りたい対象も複数に分けられているが,
表番号 5と表番号6 は表を複数に分けても,読み取りたい情報は複数に分けられてい ない.アンケートの結果より,前者のような分け方は比較的見づらい表であるのに対 して,後者のような分け方は比較的見易い表であることが分かる.
z 表番号 6 以外は項目内に別の項目(例えば,内訳等)を表記している.アンケート結 果から,このように項目内に別の項目を表記した場合,見づらくなると推測できる.
(4) 設問3に対するアンケート結果
[アンケート結果]
z (ⅰ)「1番見易いと感じた表」に対して,最も回答数が多かったのは表番号3であり,
回答数は8であった.次いで,表番号2が回答数6であった.
z (ⅱ)「2番目に見易いと感じた表」に対して,最も回答数が多かったのは表番号2で あり,回答数は7であった.次いで,表番号3が回答数5であった.
z (ⅲ)「1番見づらいと感じた表」に対して,最も回答数が多かったのは表番号1であ り,回答数は12であった.
z (ⅳ)被験者の意見を表4.5に示す.
表4.5 設問3に関する被験者の意見
設問3
z 大きいカテゴリーで分かれている表が見易い.複雑な表は見づらい.余 計な情報が入っていると見づらくなる.
z 読み取りたい情報とそうでない情報がはっきりと分かれている表が見易 い.読み取りたい情報とそうでない情報が混在すると見づらい.
z 項目による要素の分割が多いと見づらい.
z 全体数が出ているが,それを無視すれば項目が分かれて見易い.
z アンケートに対しての全体意見として,求める項目が一列(一行)に並 べる,2 つの項目が隣同士など,「目を余り動かさずに求めるものが得 られる」と見易い.
以上のことから,表番号 2,表番号 3 が比較的,見易い表と判断できる.逆に,表番号 1 が比較的,見づらい表と判断できる.
[考察]
z 表3群には読み取りたい対象を設定しなかったが,表の中では大きく分けて 2つの情 報がまとめられていた.これらを明確に区別しやすい表番号 2と表番号3 が比較的見 易いという回答を集めたことから,表から読み取りたい対象が決められていない場合,
表の中でまとめられている各々の情報が区別しやすい場合,見易いと推測できる.
z アンケート結果から,表の中で明確に区別できる 2 つ以上の情報が存在する場合,そ れらを区別できたほうが見易いと考えられる.また,区別の仕方として表を複数に分 けることも有効な手段だと推測できる.
以上のことから,以下のことが考察できる.
z 全ての表に対して,表から読み取りたい要素とそれを指し示す項目がなるべく近い位 置にあると,表は見易い.逆に,それら2つが遠いと表は見づらい.
z 全ての表に対して,表から読み取りたい部分が一列に並べられているように,読み取 りたい部分とそうでない部分が明確に区別されていると表は見易い.逆に,表から読 み取りたい部分とそうでない部分が交互に並んでいる等,明確に区別することが難し い場合に,表は見づらくなると考えられる.
z 表 2 群において,同単位の要素をできるだけ隣接させたほうが,表は見易いと推測で きる.逆に,例えば 2 つ以上の別々の単位の要素を交互に配置する等,同単位の要素 が離れている場合,表は見づらいと推測できる.
z 表を複数に分けている場合でも,表から読み取りたい情報が欠落しなければ,表を複 数に分けたほうが表は見易い.しかし,表から読み取りたい情報が欠落する場合,表 を分けずに1つにまとめたほうが,表は見易いと考えられる.
z 項目数に関して,項目数の違いと表の見易さに対する関係性は掴めなかった.しかし,
「いらない情報を除きやすいほうが良い」,「項目による要素の分割が多いと見づらい」
等の意見から,1つの項目で複数の要素を示すと,表は見づらくなると推測できる.
4.2.2 評価モデルと検証結果との相違点
評価モデルと検証アンケートの相違点を以下に示す.
z 評価モデルでは,表を 1 つにまとめたほうが表を複数に分けるよりも見易いと評価し ていたが,検証結果では,表を複数に分けても読み取りたい情報が欠落しなければ複 数に分けたほうが見易いという結果になった.
z 項目の位置関係として,なるべく読み取りたい要素とそれを指し示す項目,もしくは 読み取りたい 2 つ以上の要素とそれを指し示す項目が,できるだけ近い位置にあるほ うが見易いという結果になった.
逆に,評価モデルと検証結果の一致した点として,以下のことが挙げられる.
z 表から読み取りたい部分がなるべく一列に並べられていたほうが,表は見易い.
評価モデルと検証結果の相違点の要因として,評価項目の場合分けに対する細分化が考 えられる.本研究で構築した評価モデルでは,評価項目は2つで,各場合分けは2つずつ である.しかし,検証結果では,評価モデルにおいて想定していない場合分けが存在した.
例えば,「複数の表に分けても読み取りたい情報が欠如しない場合」等は,評価モデルでは 考えられなかった場合分けである.このことから,評価モデルにおける各場合分けの細分 化が必要であることが分かる.
また,「読み取りたい要素とそれを指し示す項目ができるだけ近いほうが見易い」や,「同 じ表において2つ以上の単位を扱う場合,同単位の要素を隣接させたほうが見易い」等は,
今後,検証していく必要がある.
以上により,第 3 章で構築した評価モデルによる評価値と,アンケート結果の関係性が 得られないため,評価モデルとそこから推定される「見易い表」が妥当でないと考えられ る.また,検証結果により発生した新たな場合分けに関しては,今後検証する必要がある.
第5章 おわりに
5.1 まとめ
本研究では,「表の見易さ」に対する分析を行った.まず,中央大学理工学部情報工学科 田口研究室内の学生 8 人を対象にアンケート調査を行い,それを基に表の見易さ評価モデ ルを構築した.次に,中央大学理工学部情報工学科内の学生14人を対象に行ったアンケー ト調査により,評価モデルとそこから推定される「見易い表」の検証を行った.また,本 研究の結果,「表の見易さ」に対する方針を以下のように推測できる.
z 表から読み取りたい部分が,一列に並べられているほうが見易い.
z 表から読み取りたい部分を複数に分けることなく,表自体を複数に分けることができ る場合,表を複数に分けたほうが見易くなる.但し,表を複数に分けることで,表か ら読み取りたい部分も複数に分けられてしまう場合は1つにまとめたほうが見易い.
z 表から読み取りたい要素と,それを指し示す項目はできるだけ近くに配置する.
z 表内で 2 つ以上の単位を扱っている場合,同単位を表す要素はできるだけ近くに配置 する.
5.2 今後の課題
今後の課題を以下に示す.
z 本研究では 2 度のアンケート調査を行ったが,アンケートの内容が,被験者に見易い 表を選んで頂く選択式だったので,「表から何を読み取れるのか?」といった,逆のア プローチも必要だと考えられる.
z 検証アンケートより得た結果を検証し,実証する必要がある.
z 評価モデルの構築方法の検討と改善を行う必要がある.
z それぞれの評価項目に対して,場合分けに対する見易さは示せたが,それらを混在さ せたときの最終的な表の見易さに対する定量化を行うことができなかった.今後,そ れが可能なのかどうかを検討し,実証する必要がある.
本研究では,表の見易さに対する傾向を示すことはできたが,表の見易さを定量化する ことはできなかった.表の見易さの定量化には,更に多くのデータが必要であると考えら れる.また,集計したデータを適切に処理できる評価モデルの構築も必要である.これら の検証結果から,本研究で構築した評価モデルは,まだ改善の余地があることが分かった.
よって今後,評価モデルの改善と集計データの適切な処理方法の検討が必要である.
謝辞
本研究を進めるにあたり,多くのご指導ご助言をいただいた中央大学理工学部情報工学 科の田口東教授,鳥海重喜助教に心から感謝いたします.また,アンケートにご協力して 下さった中央大学理工学部情報工学科の学生,及び多くのご助言,ご協力をして下さった 田口研究室の皆様に心から感謝いたします.
参考文献
[1] 清川英男,“リーダビリティ研究の概念”,淑徳大学研究紀要,1978.
[2] 近藤陽介,松吉俊,佐藤理史,“教科書コーパスを用いた日本語テキストの難易度推定”,
言語処理学会第14回年次大会発表論文集,2008.
付録