6.1 5 章の心理実験で得られた知見の楽曲検索への応用
6.5 プリミティブワード
式(6.3)によって楽曲色彩ベクトルを求めるためには,色彩と結びつきのある単 語(例えば, 太陽(赤) や 山(緑) のように典型的な色彩を持つ単語)をあら
かじめ特定し,それらの単語に関する歌詞中の頻度,影響度および色彩ベクトルが 必要となる.本研究では,5章において,80曲に関して歌詞のみの提示から想起さ れる色彩,および,その際に影響を受けた歌詞中の箇所を,心理実験によって調査 している.このとき,被験者が色彩の想起に影響を受けた箇所に関しては,句や文 のように複数の単語で構成されるものよりも,単独の単語が頻出していることを確 認している.さらに,5章における心理実験で使用した楽曲に関しては,様々な歌 詞に高頻度で出現する単語を多く含む楽曲であるほど,一般的な知見が得られる可 能性が高いということを考慮して,様々な歌詞に高頻度で出現する単語をできるだ け多く含む楽曲を使用している.
以上から,式(6.3)によって楽曲色彩ベクトルを求めるために必要な,色彩と結び つきのある単語は,5章の心理実験で得られた結果を用いることにする.5章で行っ た心理実験では,被験者が色彩の想起に影響を受けたと回答した歌詞中の箇所に対 して表記ゆれ除去処理を施した後,回答箇所の回答率を求めている.そこで,本章 では,5章で行った心理実験の結果,歌詞を提示された被験者全員の回答が有効回 答であった場合に,30名中5名以上となる回答率(i.e., 1/6以上の回答率)を持つ 単独の単語を,式(6.3)における色彩と結びつきのある単語として使用する.以降 では,これらの単語のことをプリミティブワードと呼ぶ.5.3.3節の表5.9から分か るように,5章で行った心理実験から得られたプリミティブワードは283語である.
ここで,式(6.3)における色彩と結びつきのある単語を,5章で使用した楽曲の 歌詞に出現する全ての単語とせず,特定の単語(i.e., プリミティブワード)に限定 した理由は,以下の通りである.第1に,全ての単語を対象とした場合,それらの 単語には機能語(e.g.,助詞,助動詞など)と内容語(e.g.,名詞,動詞,形容詞など)
が含まれる.しかし,機能語から色彩を想起するのは困難であり,少なくとも,色彩 と結びつきのある単語としては,内容語のみに限定することが妥当であると考えら れる.第2に,対象を全ての内容語に限定した場合でも,無駄な情報となる内容語 が多数存在する.例えば, これ や それ などの代名詞から,色彩を想起するの は困難であると考えられる.第3に,対象を代名詞を除いた内容語に限定した場合 でも,色彩を想起するのが困難な内容語は多数存在する.例えば, 世界 や 駅 のように,典型的で特徴的な色彩に対応していない単語から色彩を想起するのは困 難であると考えられる.仮に,これらの単語に関する何らかの色彩ベクトルを得た としても,これらの単語は,元々,色彩を想起するのが困難な単語であるため,式
(6.3)においてノイズとして働いてしまう可能性が考えられる.第4に,全ての単 語に関して,後述の手法(i.e., 6.5.1節および6.5.2節)によって,影響度および色 彩ベクトルを取得するためには,非常に大規模な心理実験を実施しなければならず,
非現実的である.第5に,あらゆる単語に関する影響度と色彩ベクトルを得たとし ても,色彩を想起するのが困難な単語の影響度は非常に小さい値となることが予想 される.式(6.3)を考慮すれば,影響度の小さい単語は,楽曲の色彩ベクトルを推 定する際に誤差程度として機能するだけである.このことは,そのような単語の情
報(i.e., 影響度と色彩ベクトル)が楽曲の色彩ベクトルの推定において使用されな
い情報であることと等価であると言える.すなわち,そのような単語の情報を取得
するために要する労力は無駄な労力となる.第6に,以上を考慮すれば,5章で使 用した楽曲の歌詞に出現する単語のうち,複数の被験者が共通して影響を受けたと 回答した有限個の単語を,色彩と結びつきのある単語として用いるのが効率的であ ると言える.
6.5.1 プリミティブワードの影響度
本研究では,5.3.3節において得られた,各プリミティブワードに関する回答率
(i.e.,歌詞のみの提示から色彩を想起するときに,被験者がそのプリミティブワード に影響を受けたと回答した率)を,各プリミティブワードの影響度とする.すなわ ち,プリミティブワードαの影響度I(α)は,式(6.4)によって与えられる.
I(α) =
∑
mi∈M(α)I(mi, α)
|M(α)| (6.4)
I(mi, α) = x(mi, α) x(mi)
ただし,M(α)はプリミティブワードαを含む楽曲の集合,x(mi)は楽曲mi ∈M(α) の歌詞を提示された被験者のうち,有効回答である被験者数,x(mi, α)はmiの歌詞 を提示された有効回答である被験者のうち,miにおいてαを回答した被験者数とす る.したがって,5.2.1節の説明から,miの歌詞を提示された被験者の回答が全て 有効回答である場合,x(mi) = 30となる.
例えば,本研究で得られたプリミティブワードの1つに 雪 がある.このプリミ ティブワード 雪 を含む楽曲が80曲中3曲あり,これら3曲に関する被験者の回 答が全て有効回答であり,それぞれの楽曲において 雪 を回答した被験者が27人,
25人,29人である場合, 雪 の影響度I(雪)の値は(27/30 + 25/30 + 29/30)/3 = 0.9 となる.
本研究では,5章の心理実験の結果において,5/30以上の回答率である単語をプ リミティブワードと定義しているため,プリミティブワードの影響度は5/30以上で ある.
6.5.2 プリミティブワードの色彩ベクトル
本研究では,プリミティブワードに関する色彩ベクトルを得るために,5章で行っ た心理実験とは別の心理実験を実施した.
被験者
実験に参加した被験者は,21名の大学生および大学院生(男性17名,女性4名,
平均年齢23.14歳)である.
1 2 3 4 5 6 7
8 9 10 11 12 13 14
15 16 17 18 19 20 21
22 23 24 25 26 27 28
29 30 31 32 33 34 35
図6.3: 実験で使用したカラーパレット(再掲)
表6.1: 色彩の回答方法(再掲)
想起される色彩数 回答方法
1色 想起される色彩を3回回答する
2色 より強く想起される色彩を2回回答し,他方を1回回答する 3色 想起される色彩を1回ずつ回答する
実験刺激
被験者に提示する刺激は,5.3.3節の表5.9に示すプリミティブワード283語であ る.被験者には,283語全てのプリミティブワードを割り当てた.
実験手続き
プリミティブワードを1語ずつ提示し,提示されたプリミティブワードから想起 される色彩を回答するよう求める.実験に使用した色彩は,5章で行った心理実験 に用いた35色である.実際に被験者に提示した35色のカラーパレットを図6.3に 再掲する.図6.3に示す各色彩に付与された番号に関しては,5.2.3節で述べた通り である.プリミティブワードの提示順序に関しては,被験者毎に,実験開始時に計 算機を用いて無作為に決定した.実験は静かな部屋で行い,余計な音によって影響 を受けないように配慮した.
色彩の回答に関しては,5章で行った心理実験と同様の手法を採用した.すなわ ち,被験者に対して,表6.1に示すように,想起される色彩数に関わらず,一律に3 回回答するよう求めた.
例えば,赤のみが想起される場合は,赤を3回回答し,赤と青が想起され,より 強く想起したのが赤である場合は,赤を2回と青を1回回答する.そして,赤と青 と緑が想起されれば赤と青と緑を1回ずつ回答する.
色彩ベクトルの算出
以上の心理実験により得られた回答を用いて,プリミティブワードの色彩ベクト ルを求める.6.3節で述べたように,色彩ベクトルの各要素の値はその要素に対応す る色彩の想起確率であるから,プリミティブワードαの色彩ベクトルv(α)は,式
(6.5)によって与えられる.
v(α) = (t(α, c1)
3x(α) , ...,t(α, c35)
3x(α) ) (6.5)
ただし,x(α)は本節の心理実験においてαを提示された被験者数,t(α, ci)はαに 関する全ての回答のうち色彩ci(i= 1, ...,35)の延べ回答数とする.なお,本節の心 理実験の説明から,x(α) = 21である.
6.6 未知語
6.5節で述べたプリミティブワードは,5章で行った心理実験によって得られたも のである.5章の心理実験で使用した楽曲が有限個である以上,6.5節のプリミティ ブワードが色彩と結びつきのある単語を全て網羅している保証はない.したがって,
プリミティブワード以外にも,式(6.3)によって楽曲色彩ベクトルを求めるために 必要な,色彩と結びつきのある単語,および,それらの単語に関する情報(i.e., 影 響度と色彩ベクトル)を,何らかの方法によって推定することができれば,上述の 問題を少しでも解消できる可能性がある.
そこで,本節では,コーパスとプリミティブワードの情報(i.e., 影響度と色彩ベ クトル)を用いて,プリミティブワード以外の単語に関する情報(i.e., 影響度と色 彩ベクトル)を推定する方法を提案する.以降では,コーパスに出現する単語のう ち,プリミティブワード以外の単語のことを未知語と呼ぶ.
本研究では,未知語に関する影響度と色彩ベクトルを,プリミティブワードと未 知語の類似度,および,プリミティブワードの影響度と色彩ベクトルに基づいて推 定する.プリミティブワードと未知語の類似度に関しては,潜在的意味解析(LSA) [33]によって求める.
以下では,まず,LSAについて説明する.次いで,LSAによって得られたプリミ ティブワードと未知語の類似度に基づいて,未知語の影響度と色彩ベクトルを推定 する手法について述べる.
6.6.1 潜在的意味解析(LSA)
潜在的意味解析(LSA:Latent Semantic Analysis)とは,コーパスを用いて,コー パス中に出現する索引語同士の意味的な類似度を求める手法である.LSAでは,コー パス中に出現する索引語に関する,コーパス中の各文書における出現回数からなる,
索引語・文書行列を用いて,索引語同士の類似度を求める.ただし,索引語・文書 行列をそのまま用いると,コーパスが大規模になるほど,索引語数や文書数が膨大