• 検索結果がありません。

顔文字の科学 Web 上の非言語表現 行動に関する新研究分野の誕生 工学的 心理学的側面から見た顔文字の分析に関する研究動向 Research Trends of Kaomoji Analytics from Engineering and Psychological

N/A
N/A
Protected

Academic year: 2021

シェア "顔文字の科学 Web 上の非言語表現 行動に関する新研究分野の誕生 工学的 心理学的側面から見た顔文字の分析に関する研究動向 Research Trends of Kaomoji Analytics from Engineering and Psychological"

Copied!
8
0
0

読み込み中.... (全文を見る)

全文

(1)

1.は じ め に

blogや Twitter の分析など,インターネットに大量に 存在しているテキストから種々の情報(評判,感情,など) を抽出しようという研究は増加の一途を辿っている.そ の一方で,顔文字や絵文字,アスキーアートなどの非言 語情報に関しては,前処理の段階でノイズとして除去さ れてしまうなど,積極的に活用されていない場合もある. しかしながら,顔文字などの非言語情報がもつ情報量は 大きく,無視できないことも事実としてある. 例えば,「あの人カッコいいよね!」という文だけ を見れば,おそらく発話者はポジティブな意味合いを 込めて発言していると考えられる.この例文に対して, という顔文字が付与されればポジティブな印象 を受けると思うが, という顔文字が付与されれ ば,文も顔文字もポジティブな印象を受けるにもかかわ らず,どこかネガティブな印象(皮肉を込めたような印 象)を受けないだろうか. 顔文字は,テキストベースのコミュニケーションに おいて,書き手の伝えたい補足的な情報を伝達するため の手段として活用される.顔文字のもつ非言語情報を適 切に活用するためには,アプリケーションとして応用す るための多角的な分析が必須となる.本稿では,顔文字 を構成している記号列を分析したり,顔文字そのものが もつ印象や感情表現などを分析している研究を取り上げ る.特に,顔文字の分析として,工学的応用のための分析, 心理学的応用のための分析について解説し,顔文字のも つ多様な情報を抽出し,活用するための手法について紹 介する. 以下,2 章では分析の対象となる顔文字を定義し,3 章では工学的応用のための顔文字の分析,4 章では心理 学的応用のための顔文字の分析についてそれぞれ解説 し,5 章では今後の顔文字の分析結果の活用について述 べる.

2.分析の対象となる顔文字

顔文字は,主として掲示板や blog,SNS などで活用 されているが,何をもって顔文字とするかは研究者だけ ではなく使用者の間でも議論の余地がある.一見して顔 とわかる領域のみを顔文字と捉える場合もあれば,それ に付随するあらゆる記号列を含めたものを顔文字とする 場合もある.なお,(笑)や orz などの記号列も顔文字 とする向きもあるが,これらの記号列を対象としている 研究者は少ない. そのため,一例として我々は,1)一見して顔に見え る記号列の並び(例えば『 』のようなタイプのも の),2)その並びに付属する文字列(台詞なども含めた ような『 あはは』タイプのもの)を顔 文字として定義し分析を進めている. 顔文字には,日本語圏内で特に使用頻度の高い や のようなものや,:-)や XD といった,アメ リカなどで活用されている 90 度回転したものがある. 以降の節で紹介する論文では,これらの顔文字を個別に あるいはまとめて研究対象としている.

工学的・心理学的側面から見た顔文字の

分析に関する研究動向

Research Trends of Kaomoji Analytics from Engineering and

Psychological Points of View

奥村 紀之

明石工業高等専門学校電気情報工学科

Noriyuki Okumura Electrical and Computer Engineering, National Institute of Technology, Akashi College. okumura@akashi.ac.jp

プタシンスキ ミハウ

北見工業大学

Michal Ptaszynski Kitami Institute of Technology. ptaszynski@cs.kitami-it.ac.jp

ジェプカ ラファウ

北海道大学大学院情報科学研究科

Rafal Rzepka Graduate School of Information Science and Technology, Hokkaido University. rzepka@ist.hokudai.ac.jp

Keywords:

kaomoji, lexicon, analysis, morpheme, extraction.

(2)

現在までに確認されている顔文字の種類数は膨大であ り,表 1 に示すように,我々が保持しているだけでもす でに 10 万種類以上もの顔文字を観測している.

2012年に Google が Official blog に掲載した情報によ ると,2006 年頃から UTF-8 の普及が進み,2012 年の 段階で普及率が 60%を超えているという*1.これに伴い, 顔文字の構成要素として利用可能な記号列が爆発的に拡 大しており,現在では図 1 に示すような多彩な表現の顔 文字が広く普及してきている. このような顔文字は,Unicode の合成により表現され ており,個々の構成要素へ分解すると図 2 のような記号 列で構成されていることがわかる.これらの顔文字は, 環境によっては正しく表示されないという問題がある が,スマートフォンの IME(Input Method Editor)の 辞書に基本の顔文字として登録されるなど,特に SNS などのコミュニケーションサイトにおいて活用されてい る. また,Unicode の合成による顔文字が普及し始めたこ とにより,その数はますます増大していくものと予想さ れる.一方で,図 2 に示したように,合成された顔文字 であっても個々のパーツに分類してしまえば,記号列と しての解釈は十分に可能であることもわかる.なお,記 号列としての解釈のみならず,顔文字を画像として解釈 し活用することも可能ではあるが,本稿では画像解析 による顔文字の分析は対象としていない.2016 年以降, 絵文字(Emoji)に関する分析が盛んになされているが, 複数の記号列で表現された顔文字のような形態のもので はなく単一の文字であることから,本稿での分析対象に は含めていない. 以降の章では,辞書構築のための顔文字の分析をはじ めとした,工学的・心理学的観点からの顔文字の分析に ついて述べていく.

3.工学的応用に向けた顔文字の分析に関する

研究動向

顔文字を工学的に応用するための手段として,顔文字 のもつさまざまな傾向を分析する研究がなされている. 本章では,顔文字の分析に関するテーマの中でも,辞書 構築のための顔文字の分析,顔文字を抽出し感情解析に つなげるための顔文字の分析について述べる. 3・1 辞書構築のための分析 顔文字は,表 1 に示したとおりすでに 10 万種類を超 えており,先述の Unicode の合成による顔文字の台頭に より,今後もますますその数は増していくものと考えら れる.一方で,顔文字に含まれる個々の記号列に関して 大規模に分析しているような研究は少なく,大規模デー タからの顔文字抽出などの,トップダウン的な視点での 分析が主流である.我々は,顔文字を構成する個々の要 素に着目し,その一つ一つの要素がもつ役割を明らかに することを目的とした大規模辞書構築を進めている [奥 村 16a]. 現在までに広く流通している顔文字は,すでに IME へ登録されているなど,一般に浸透してきている.その ため,新たな顔文字の基本的な生成過程は,既存の顔文 字に新しい記号列を付与する,または削除することに よって行われている.したがって,トップダウン的な視 点からの分析によって抽出される顔文字は,同種の顔文 字であったとしても記号列の細かな違いを含んでいる可 能性が高い. 例えば, という顔文字と という顔文字は, セミコロンの有無のみの違いではあるため,「括弧で囲 まれた特殊記号列」といったルールで双方とも抽出され る.しかしながら,これらの顔文字がどういった役割を 果たすかまでは明確にならない.我々は,このような細 かな表現の違いを適切に解析するため,顔文字を個々の 記号列に分解し,それぞれの記号列がもつ傾向を調査し ている. 大規模な辞書を構築し各構成要素の傾向を調査する と,;(セミコロン)を構成要素としてもつ顔文字は,焦 りや恐れを表す可能性が高い,#(シャープ,井桁)を 構成要素としてもつ顔文字はほとんどすべてのものが怒 りの感情を含んでいる,といった傾向が顕著に表れる. こういった特徴を組み合わせることによって,顔文字に は多彩な表現が付与されている. 表 1 著者らの環境において確認されている顔文字の総数 図 1 Unicode の合成による従来の ASCII 文字列などでは表現で きないような顔文字 図 2 Unicode の合成による目が文章の上のほうへ飛び出したよ うな顔文字(上段)も,個々の構成要素の列(下段)の集 合で表現されている *1 https://googleblog.blogspot.jp/2012/02/ unicode-over-60-percent-of-web.html

(3)

では,具体的にどのような顔文字に構成要素が付与さ れることで,新しい顔文字が生成されているのだろうか. それを明らかにするためには,顔文字の基本構成要素を 把握する必要がある.先ほどの と の例では, にセミコロンが付与されることで顔文字に変化が 生まれている.同様に,シャープ(井桁)が付与されると, のような顔文字が生成される.つまり,顔文字の 基本構成要素を定義することができれば,付与された新 しい構成要素から,顔文字の表現していることの意味を 適切に解釈できるようになると考えられる. 我々は,このような顔文字の基本構成要素を顔文字の 原形として定義し大規模辞書の構築を進めている.日本 語の動詞には語幹と語尾があるように,顔文字にも語幹 と語尾に相当する構成要素が存在するという仮定に基づ いた定義である.表 2 に,顔文字の原形を抽出するため のルールを示す. このようにして定義した顔文字の原形を中心に,我々 は,原形に含まれる構成要素以外の要素を付属要素とし てアノテーションしている.アノテーションの対象とな る構成要素は,「目,鼻,口,頬,額,耳,輪郭,腕,台詞, それ以外の要素」としており,現在約 40 000 種類の顔 文字に対するアノテーションが完了している. また,顔文字を構成する記号列とは無関係に,顔文 字そのものがもつ印象から顔文字の表現している感情 成分を,Plutchik の感情の環に基づいて付与している [Plutchik 80].これにより,例えば,*(アスタリスク) が付与されると,元となった顔文字がもつ感情成分を強 調する役割があるといった構成要素ごとの分析を可能と している. 顔文字を多角的に分析し大規模な辞書を構築するにあ たって,顔文字そのもののもつ構成要素の分析のほかに, 実用段階での特徴的な情報を抽出することも必要とな る.我々は,対象となる顔文字が使用される時間帯に着 目した分析も進めている [大西 13, Onishi 14]. 例 え ば, の よ う な 手 を あ げ た 顔 文 字 は Twitterなどの時系列情報をもつテキストデータを解析 すると午前中(特に 7 ∼ 9 時頃)に使用頻度が高まると いった傾向を抽出することができる(図 3).この顔文字 は,「行ってきます!」や「今日も 1 日頑張るぞ!」といっ た文章と共起することが多く,早朝に使用頻度が高まる 一つの根拠となるだろう. このように,顔文字には顔文字そのものを構成する 要素に加えて,使用される状況に応じた種々の情報が含 まれている.本稿執筆時点においては,先述のとおり約 40 000種類の顔文字に対するアノテーションが完了し ているが,対象としている顔文字は主として ASCII 文 字や Shift-JIS で表現される文字を構成要素としており, Unicodeで表現される多彩な顔文字への対応が進んでい ない.今後は,Unicode の合成によって構成された顔文 字の構成要素に関しても同様のアノテーションを行うこ とで詳細な分析が必要となるだろう.また,表 2 で定義 している顔文字の原形を任意の顔文字から自動抽出する システムを構築することによって,未知の顔文字に対し ても原形と付属する構成要素に分けて解析する手法の開 発が求められる.これにより,顔文字のもつ種々の情報 を動的に抽出する技術の開発が期待される [奥村 16b]. 3・2 顔文字の抽出のための分析 顔文字は任意の文章とともに出現したり,また,それ 単独で出現したり,さまざまな使用傾向が観測できる. 一方で,任意の文章と顔文字が共出現した場合,どこま でが文章でどこまでが顔文字であるのかの境界が定かで はない. 顔文字の分析には,任意の文字列から顔文字を抽出す るための分析がある.古くは,顔文字などの記号列が言 語処理において形態素解析のミスを誘発したり,統計情 報を狂わせてしまったり,最悪の場合には文字化けを引 表 2 原形抽出のルール 図 3 顔文字の時間帯別使用頻度の例(横軸は 1 日における時刻, 縦軸は使用頻度)

(4)

き起こしてしまったりするなど,「ノイズ」としての認 識が強く,簡単な正規表現による前処理で除去されてし まうことが一般的であった.しかしながら,顔文字のも つ多彩な情報を欠落させることは,発話者の意図を正し く解釈するうえで大きな問題となることも事実である. そのため,任意の文字列から顔文字と思われる領域を抽 出するための手法が必要となる. Bedrickらは,PCFG モデル(確率文脈自由文法)に 基づいた頑健な顔文字抽出手法を提案している.このモ デルで抽出の対象とされている顔文字は,Unicode の合 成による顔文字まで含めたすべての顔文字である.なお, Bedrickらは抽出された顔文字をレキシコンとして半自 動構築しているが,それを主目的とするものではない. Bedrickらが PCFG を構築するためのルールを表 3 に示 す. Bedrickらは,顔文字のもつ対称性を考慮したモデル を構築している.3・1 節で述べたように,我々が着目し ている顔文字の原形抽出でも対称性は重要視している部 分である.特に,Unicode のグリフ(字形)に着目した 類似性や,鏡像として出現する左右対称の構成要素を Bedrickらは重要視している. 表 3 の PCFG による顔文字の抽出に際して,Bedrick ら は 非 終 端 記 号 を 拡 張 し て い る. 非 終 端 記 号 を, ITEM,OUT,FACE,EYES,NM に分類することでスキー マを構成する.ITEM は何らかの記号列,OUT は顔領 域の外側の構成要素,EYES は目,NM は鼻と口をそれ ぞれ表している.表 4 に拡張された非終端記号に関する ルール(抜粋)を示す. Bedrickらの手法の評価として,8 000 万の Twitter に投稿された Tweet の中から抽出した 160 万の顔文字 れた顔文字すべてを評価することは現実的ではないとし て,160 のサブセットに分割し,それぞれスコア順にソー トしたトップ 1 000 の顔文字を目視により評価している. Bedrickらの実験では,全数評価ではないにせよおよ そ 95%以上の正確さをもって顔文字の抽出に成功して いる.しかしその一方で,対称性(鏡像)を考慮したモ デルであることから,((((; ゜Д゜)))))))のように輪郭 が複数組み合わされて構成されるような顔文字について は無数の対象関係の組合せがあるため,抽出が困難で あったことが述べられている. 3・3 感情解析のための顔文字の分析 感情解析のための顔文字の分析に関しては特に 2 種類 の研究を紹介したい.一つ目は Ptaszynski らが開発し た CAO システムで採用されている手法 [Ptaszynski 10] について,二つ目は風間らの開発した顔文字の抽出・分 類手法 [風間 16] についてである.Ptaszynski らの手法 は顔文字の構成要素に着目した分析に基づいた顔文字抽 出手法であり,風間らの手法は顔文字そのものの構成に は着目せず,顔文字を構成する文字種のみを基準とした 顔文字抽出手法である.これらのシステムが感情抽出に どのように使用されているかを合わせて紹介していく. § 1 CAO システム Ptaszynskiらは,顔文字を含む任意の文章から,その 文章に含まれている感情成分を抽出する CAO システム を構築している(図 4).図 4 は,Ptaszynski らが開発 した CAO システムの中で,顔文字の処理に関係してい る部分を抽出したものである. CAOシステムでは,顔文字を抽出するためにキネシ クス理論を採用している [Birdwhistell 52].キネシクス 理論は動作学と呼ばれ,Ptaszynski らは普遍性の高い 動作要素(Kinemes)を顔文字の中から選定している. 図 4 にも示す triplets, eyes, mouths のデータベースが Kinemesに該当し,中でも Ptaszynski らが提案した顔 文字を構成する基本の動作素は,(目─口─目)のトリプ レットであるとしている.なお,顔文字には口を含まな いものも存在しており,(目─目)の組合せも基本動作素 として抽出し,別途口のデータベースを構築している. 表 3 Bedrick らが使用している PCFG 構築のための ルールの一覧([Bedrick 12, Table 1] より) 表 4 拡張された非終端記号に関するルール ([Bedrick 12, Table 2] より一部を抜粋)

(5)

CAOシステムの流れは,基本となる顔文字のリスト と照合し,マッチすれば顔文字が検出されるところから 開始する.すなわち,辞書として保有している顔文字に ついては優先的に抽出するプロセスを経る.その後,ト リプレットや目の照合を行い,マッチしたものを顔文字 として抽出し,感情解析を行う. 顔文字検出においては,基本的に辞書と照合を行うが, 目のみのデータベース,口のみのデータベースとの直積 を考慮すると,たとえ辞書に未定義であったとしても, CAOシステム全体では 300 万以上もの表情に対応可能 であるとしている.すなわち,表 1 で記した顔文字のう ち,日本式のものに関してはすべての表情が網羅できて いる可能性が高いといえる.以上が CAO システムが顔 文字を検出する手法の概略である. CAOシステムが保持している顔文字は,顔文字を大 量に収集したサイトによるものが多い*2.このような顔 文字収集サイトでは,顔文字のリストのほかに,顔文字 に対する読みが付与されている.そこで,Ptaszynski ら は,感情抽出システムである ML-Ask [Ptaszynski 08] を利用し,顔文字に付与されている読みに対する感情を 顔文字のもつ感情成分として付与している.したがって, 読みをもたない顔文字については感情成分を正しく付与 できない問題がある. ML-Askを用いる Ptaszynski らの手法は,感情推定 に基づいた顔文字への感情成分を付与するシステムとし ては大規模なものである.しかし,顔文字の読みをどの ように付与すべきかという問題は未解決であり,顔文字 を収集したサイトを構築した管理人の判断に委ねられて いることも大きな問題である.また,単一の読みにのみ 着目していては,顔文字がもつ微細な情報を取りこぼし てしまう恐れもある.今後は我々が構築している大規模 顔文字辞書と連携させるなど,より細やかな感情推定が 行えるシステムの構築を目指したい. § 2 文字種に着目した顔文字の自動抽出手法と感情推 定への応用 次に紹介したい顔文字の抽出および感情抽出に関する 研究は,風間らの手法である [風間 16].風間らは大量 に収集したコーパスから自動的に顔文字を抽出し,同種 の顔文字を類似度評価によりクラスタリングすることで トップダウン的な視点による顔文字の集合を形成してい る. 風間らのシステムでは,以下の手順に従って顔文字を 抽出する([風間 16, 2・2 節] より). 顔文字探索 テキストの前方から顔文字主要文字を探 す.終端に到達したら終了. 領域拡張 見つかった場合は,顔文字主要文字の間に 最大 G 個の任意の文字を許容しながら,領域を前 後に拡大する. 領域縮小 先端・終端の括弧・句読点または顔文字主 要文字以外の削除を繰り返し,領域を縮小する. 領域補完 小規模な顔文字リストから事前に抽出した 部分文字列を用いて欠落部分を判定・補完する. 顔文字判定 領域が L 文字以上の場合は,それが顔文 字かどうかを判定する. 繰返し 判定済み領域の次の文字に移動し,顔文字探 索に戻る. 顔文字を構成する個々の要素は,文中に現れやすい文 字列とは異なる傾向を示すということを前提に,風間ら のシステムでは顔文字を抽出している.表 5 は,顔文字 を形成しやすく記号列と判定する Unicode 文字のプロパ ティを示している. 風間らの手法は特に,Unicode Standard の文字の機 能を定義する Unicode 文字プロパティと文字の種類を定 義する Unicode ブロックを用いていることに特徴があ る.我々が注目している個々の要素の役割であったり, Ptaszynskiらが着目しているトリプレットであったり, 顔文字の特徴的な表現から抽出するのではなく,顔文字 を構成しやすい文字の種類そのものを利用していること が大きな特徴であるといえる.また,人手による処理を 全く必要としていない点も大きく評価すべきポイントで ある.このようにして抽出された顔文字の総数などの詳 細については,[風間 16] の第 3 著者である榊が blog に て解説しているため,興味がある方は参照願いたい*3 風間らの手法で抽出された顔文字は,2 種類の観点に よって分類される.一つは表層的観点,もう一つは意味 的観点である. 表層的特徴による分類では,顔文字を N-gram モデル (n=1, 2)によって表現し,低次元空間へ射影すること で同義の顔文字であるかどうかを判定する.意味的特徴 表 5 記号類と判定する Unicode 文字プロパティ ([ 風間 16, 表 1] より抜粋)

(6)

による分類では,分布仮説に基づき Word2Vec [Mikolov 13]によって顔文字の分散表現を取得することによって 行う.基準は示されていないが,1 000 種の基準となる 顔文字に対して類義顔文字クラスタを形成している.こ れらの手法によって,同じ感情ラベルをもつ顔文字をク ラスタ化することに成功しており,感情解析に顔文字を 利用する基盤を構築している. しかしながら,風間らの手法は形成されたクラスタ の定性的評価が不十分である点が問題点として考えられ る. さらに,顔文字に付与される台詞やオノマトペなどの 付加情報も欠落しており,表現力が低下しているという 問題もあげられる.今後の研究として,これらの部分の 拡張にぜひ期待したい. 3・4 ま  と  め 本章では,顔文字の工学的側面から見た分析について 述べた.我々の手がける大規模な顔文字のアノテーショ ン済み辞書や,半自動的に顔文字を抽出可能な CAO シ ステム,顔文字に含まれる文字種のみに着目して自動的 に顔文字を抽出する風間らのシステムを中心に,顔文字 の抽出について紹介した.顔文字の抽出,分類に関して は,k-NN,SVM に基づいた Tanaka らの手法 [Tanaka 05]や,渡邉らの系列ラベリングによる顔文字抽出手法 [渡邉 13],目として採用されている記号と対称性に着目 した Yokoi の手法 [Yokoi 15] などもある. また,顔文字に含まれている感情成分に関する分析 やその利用に関しては,先に紹介したもの以外にも多数 存在している.例えば,評判分析のための Read の手法 [Read 05]や,顔文字を表情ごとに分類した Yamada ら のシステム [Yamada 07] などが比較的引用数も多く,参 考になるだろう. なお,本稿では陽に取り上げてはいないが,Eisner ら の Emoji2Vec [Eisner 16] が発表されるなど,海外にお いても絵文字(Emoji)が着目され始めており,今後の 研究動向がますます気になるところである.

4.心理学的応用に向けた顔文字の分析に関する

研究動向

さて,前章までは主として顔文字の工学的側面から見 た分析について述べてきた.本章では,心理学的側面か ら見た分析について触れてみたい. 我々が工学的に顔文字を応用しようとする際,考え られる応用先は顔文字の自動推薦や自動生成があげられ る.しかし,大規模コーパスから抽出した統計的な情報 だけを基準とした手法では,顔文字の活用には制約がか かる可能性がある.特に,いまだ実用レベルの文脈解析 が存在しない現状においては,どのような文脈で顔文字 ない. そこで,工学的な視点からの分析ではなく,心理学的 な側面から見た顔文字の利用形態についての論文を紹介 したい.まず,メールでの使用状況について活発に研究 を進めている荒川らの一連の研究に関して紹介する.そ の後に,対人感情に及ぼす影響を調査した木村の研究, 誤解を招く表現に関する岩原の研究を紹介する. 4・1 メールで使用される顔文字に関する分析 荒川らは,主にメールで利用される顔文字に関して 種々の分析を進めている [荒川 04a, 荒川 04b, 荒川 06, 荒川 07, 荒川 15].近年の研究では,Twitter などのマイ クロブログや Facebook などのソーシャルメディアを分 析対象としているものが多く,1 対 1 のコミュニケーショ ンであるメールでのやり取りにおける顔文字の使用傾向 の分析は大いに参考になる. [荒川 06] では,ある想定された状況下(スクリプト) において,もし自分がその状況であればどのような返信 をするかという事項について,質問紙検査を実施してい る.特に,特定の条件下でどのような顔文字を使用する かということについて検証している.女性 27 名,男性 15名から有効回答が得られ,例えば悲しんでいる相手 に対してはクシャッとした顔や泣いている顔を送信する 傾向などが抽出されている. また,[荒川 04b] では,メールで謝罪文を送付する際に, 顔文字を付与した場合どのような感情を喚起するかにつ いて検証している.仲が悪くなってしまった友人を想像 し,仲の良い友人から謝罪のメールで顔文字付きのもの を受け取った場合と怒りの度合いがどの程度異なるか検 証している.この実験は女子短期大学生のみを対象とし たものであり,限定的な結果であるとの断りはあるもの の,顔文字が付与されることにより怒りが緩和される傾 向にあることが示されている. 荒川らの実験により,想定された条件のもとで顔文字 を利用する場合,選択すべき顔文字のジャンルが決まっ てきていたり,それによって受け手に与える影響が変化 することからも,顔文字の自動推薦,生成においては考 慮すべき指摘だと考えられる. 4・2 顔文字が対人感情に及ぼす影響 木村らは,メールにおける顔文字のやり取りが対人感 情に及ぼす影響を調査している [木村 14].我々も度々 指摘している点として,日本語でのコミュニケーション とオンラインでの文字だけでのコミュニケーションとの 間には大きなギャップがある.日本語は,多くを語らず 周囲の状況から察して対話を成立させる傾向にあるいわ ゆるハイコンテクストな文化に属する.そのため,文字 だけでのやり取りでは少なからず齟齬が生じ,トラブル に発展することも少なくない.

(7)

おいて顔文字を付与する場合としない場合では差異が生 まれるか,急用で予定をキャンセルする場合に顔文字を 使用する場合としない場合で差異が生まれるかを検証し ている.検証結果により,顔文字を付与した場合,ポジ ティブな感情が喚起され,ネガティブな感情が抑制され る傾向にあることが示唆されている. その一方で重要な指摘がなされており,返報性の期待 に反した場合にのみ,ポジティブな感情が抑制され,ネ ガティブな感情が喚起されているという.このことは, 前章と同様に,顔文字の推薦,自動生成において,相手 の期待する顔文字を適切に提示できなければ,コミュニ ケーションが失敗してしまうという危険性を指摘してお り,システム開発における留意点となろう. 4・3 誤解を招く表現 岩原らは,文字ベースのやり取りにおいて誤解を招く 表現について検証している [岩原 05].岩原らの指摘は, 誤解を生まないためにはまず表現に気をつけるべきであ るという点にある.これは,被験者実験によっても,表 現の工夫によって誤解は回避可能であるとの結果が出て いることからも結論付けられている.また,絵文字は誤 解を回避するために有効ではないとの結果が出ている. 岩原らは絵文字としているが,顔文字と言い換えても差 し支えないであろう. しかし,絵文字の使用がミスコミュニケーション(誤 解)を回避するために相対的に有効な手段ではないとさ れていたにもかかわらず,実際の場面においては,頻繁 に絵文字が使用されている実態を明らかにしている.ミ スコミュニケーションの回避に対する意識と行動の乖離 があり,このことが,ミスコミュニケーションを誘発し ているのではと指摘している. 顔文字を工学的に応用する,推薦する,生成するといっ た視点から見た場合,顔文字はコミュニケーションの補助 的役割を果たし,コミュニケーションを円滑にし,感情 や状況を的確に伝えるための補助手段という認識をもっ ていることが多い.しかしながら,岩原らのような指摘 があるように,本来適切に意図を伝達すべきは言語情報 であり,適切な表現を用いさえすれば誤解は生じない可 能性が高いといった指摘も考慮していく必要があろう. 4・4 ま  と  め 心理学的な側面から見た顔文字の分析においては,荒 川らのメールのやり取りにおける顔文字の使用傾向につ いて,木村らの対人感情に及ぼす影響について,岩原ら の誤解を招く表現について紹介した.大規模コーパスか ら統計的に機械的に処理を施し,顔文字を使用していく ことを想定すると,心理学的な側面から見た分析結果を 反映させることが難しくなり,結果としてオンラインコ ミュニケーションを困難なものにしてしまう可能性が垣 間見える. 心理学的な側面から見た顔文字の分析は,例えば,山 口らの分析などブロードバンド普及期から盛んになされ ている [山口 00].今後はますます,工学的な応用のみ ならず,心理学的な側面,あるいは社会学的な側面など, 多方面からの分析に基づいたシステム開発を行うべきで あると考えられる.

5.今後の顔文字の分析とその活用

顔文字を工学的,心理学的側面から分析することによ り,その応用範囲は飛躍的に拡大する.例えば,口コミ サイトなどに投稿された内容を解析することによって商 品の満足度を予測したり,自動応答対話システムに表情 をもたせることも可能となる.以下,評判分析や感情解 析への応用,文脈に合わせた顔文字の自動生成に関する 展望について述べる. 5・1 評判分析,感情解析への応用 評判分析に関する研究は古くからなされており,すで に多数のアプリケーションが存在している.一方で,顔 文字を考慮したシステムはあまり例がなく,実用化に はまだ課題が残されていると考えられる.本稿で述べて きたように,顔文字自体を文章中から適切に抽出するこ と自体難しく,顔文字がもつ細かなニュアンスを定義 できていないことがその理由である.Watson を開発し た IBM でも顔文字を考慮した評判分析を試みているが, 90度倒置した顔文字に限定されているなど,まだまだ 積極的に活用されているとはいえない [Wang 15]. コスメサイト*4や子育て支援サイト*5などでは比較 的顔文字が使用されやすく,顔文字を考慮した分析を進 めることでより適切な評判を抽出できるようになると期 待される. 5・2 文脈に合わせた顔文字の自動生成に関する応用 顔文字の分析において最もチャレンジングなテーマが 顔文字の自動生成である.これまでに顔文字を自動生成 しようとした研究はほとんど存在せず,中村らがニュー ラルネットワークを利用して副次的に試みている程度で ある [中村 03].しかし,中村らの研究から状況は大き く変化しており,Unicode による合成顔文字が席巻して きている.そのため,単純な手法では顔文字を自動生成 すること自体が困難な状況となってきている. また,任意の顔文字を任意の構成要素からルールを利 用して生成することは可能ではあるが,文脈に応じた適 切な顔文字を提示することは現状の文脈解析技術では極 めて困難である.そのため,顔文字などの補足情報も含 めたうえでの高度な文脈解析技術の構築とともに,顔文 *4 @cosme:http://www.cosme.net *5 WOMEN’S PARK:http://women.benesse.ne.jp

(8)

字の自動生成技術を検討していく必要があるだろう.

6.お わ り に

本稿では,顔文字を工学的・心理学的側面から分析 している論文を紹介した.顔文字という補足的な非言語 情報がもつ多大なる情報を適宜解釈し,有効活用するこ との必要性をわずかでも感じていただけたなら幸いであ る.我々が構築している大規模な顔文字の辞書をはじめ として,顔文字を活用したいとお考えの方がいらっしゃ れば,ご遠慮なくお問い合わせいただければこの上ない 喜びである. 謝 辞 本稿は科研費(15K21592)の助成を受け,その研究 過程で行われた調査に基づいたものである.また,半年 間にわたる地道なアノテーション作業に協力してくれた 研究室の学生達にこの場を借りて感謝申し上げる.

◇ 参 考 文 献 ◇

[荒川 04a] 荒川 歩:顔文字をいつ使用するかについての語りとそ の質的分析,同志社心理,No. 51, pp. 17-26(2004) [荒川 04b] 荒川 歩,鈴木直人:謝罪文に付与された顔文字が受け 手の感情に与える効果,対人社会心理学研究,No. 4, pp. 135-140(2004) [荒川 06] 荒川 歩,竹原卓真,鈴木直人:受信者が感じている感情 が送信者の顔文字使用に与える影響,感情心理学研究,Vol. 13, No. 2, pp. 49-55(2006) [荒川 07] 荒川 歩:顔文字研究の現状と可能性─非言語コミュニ ケーション研究の視点から,心理学評論,Vol. 50, No. 4, pp. 361-370(2007) [荒川 15] 荒川 歩:「顔的な表現」の使用:顔文字研究からみた「顔」, 基礎心理学研究,Vol. 34, No. 1, pp. 127-133(2015)

[Bedrick 12] Bedrick, S., Beckley, R., Roark, B. and Sproat, R.: Robust kaomoji detection in twitter, Proc. 2nd Workshop on

Language in Social Media, LSM’12, pp. 56-64, Stroudsburg, PA, USA(2012),Association for Computational Linguistics [Birdwhistell 52] Birdwhistell, R.: Introduction to Kinesics, An

Annotation System for Analysis of Body Motion and Gesture,

University of Louisville, Louisville(1952)

[Eisner 16] Eisner, B., Rocktäschel, T., Augenstein, I., Bosnjak, M. and Riedel, S.: emoji2vec: Learning emoji representations from their description, Proc. 4th Int. Workshop on Natural

Language Processing for Social Media, pp. 48-54(2016) [岩原 05] 岩原昭彦,猿橋 昌,八田武志:CMC 上での誤解を招く 表現形式について,日本認知心理学会発表論文集,Vol. 2005, pp. 173-173(2005) [風間 16] 風間一洋,水木 栄,榊 剛史:Twitter における顔文字 を用いた感情分析の検討,人工知能学会第 30 回全国大会,pp. 3H3-OS-17a-4(2016) [木村 14] 木村昌紀,山本恭子:メール・コミュニケーションにお ける顔文字の交換過程が対人感情に及ぼす影響,感情心理学研 究,Vol. 22, No. Supplement, pp. 17-17(2014)

[Mikolov 13] Mikolov, T., Sutskever, I., Chen, K., Corrado, G. and Dean, J.: Distributed representations of words and phrases and their compositionality, Proc. 26th Int. Conf. on Neural

Information Processing Systems, NIPS’13, pp. 3111-3119, USA, Curran Associates Inc.(2013)

[中村 03] 中村純平,池田 剛,乾 伸雄,小谷善行:対話システム における顔文字の学習,情処学研報,自然言語処理(NL), Vol. 2003, No. 23, pp. 169-176(2003) [奥村 16a] 奥村紀之:言語解析のための大規模顔文字辞書,人工 知能学会第 30 回全国大会,3H3-OS-17a-1(2016) [奥村 16b] 奥村紀之:分類器による顔文字の原形推定,信学技報, Vol. 116, No. 379, pp. 93-96(2016) [大西 13] 大西智佳,奥村紀之:テキストマイニングを用いた時間 帯別の顔文字の使用傾向に関する調査,信学技報,Vol. 113, No. 213, pp. 43-49(2013)

[Onishi 14] Onishi, C. and Okumura, N.: An investigation of the usage of kaomoji for emotions judgment and kaomoji recommendation, Software Engineering / 811: Parallel

and Distributed Computing and Networks / 816: Artificial Intelligence and Applications, No. Aia, pp. 334-341(2014) [Plutchik 80] Plutchik, R.: Chapter 1-A General

Psycho-evolutionary Theory of Emotion, in Plutchik, R. and Kellerman, H., eds., Theories of Emotion, pp. 3-33, Academic Press(1980)

[Ptaszynski 08] Ptaszynski, M., Maciejewski, J., Dybala, P., Rzepka, R. and Araki, K.: Effective analysis of emotiveness in utterances based on features of lexical and non-lexical layer of speech, Proc. 14th Annual Meeting of the Association for

Natural Language Processing, pp. 171-174(2008)

[Ptaszynski 10] Ptaszynski, M., Maciejewski, J., Dybala, P., Rzepka, R. and Araki, K.: CAO: A fully automatic emoticon analysis system based on theory of kinesics, IEEE Trans. on

Affective Computing, Vol. 1, No. 1, pp. 46-59(2010)

[Read 05] Read, J.: Using emoticons to reduce dependency in machine learning techniques for sentiment classification,

Proc. ACL Student Research Workshop, ACL Student’05, pp. 43-48, Stroudsburg, PA, USA, Association for Computational Linguistics(2005)

[Tanaka 05] Tanaka, Y., Takamura, H. and Okumura, M.: Extraction and classification of facemarks, Proc. 10th Int. Conf.

on Intelligent User Interfaces, IUI’05, pp. 28-34, New York, NY, USA, ACM(2005)

[Wang 15] Wang, H. and Castanon, J. A.: Sentiment expression via Emoticons on social media, Proc. 2015 IEEE Int. Conf. on

Big Data, BIG DATA15, pp. 2404-2408, Washington, DC, USA,

IEEE Computer Society(2015)

[渡邉 13] 渡邉謙一,高橋寛幸,但馬康宏,菊井玄一郎:系列ラベ リングによる顔文字の自動抽出と顔文字辞書の構築,言語処理 学会第 19 回年次大会(NLP2013),pp. 866-869(2013) [Yamada 07] Yamada, T., Tsuchiya, S., Kuroiwa, S. and Ren, F.:

classification of facemarks using N-gram, 2007 Int. Conf. on

Natural Language Processing and Knowledge Engineering, pp.

322-327(2007)

[山口 00] 山口英彦,城 仁士:電子コミュニティにおけるエモティ コンの役割,神戸大学発達科学部研究紀要,Vol. 8, No. 1, pp. 131-145(2000)

[Yokoi 15] Yokoi, T., Kobayashi, M. and Ibrahim, R.: Emoticon extraction method based on eye characters and symmetric string, 2015 IEEE Int. Conf. on Systems, Man, and Cybernetics, pp. 2979-2984(2015) 2017年 2 月 27 日 受理

著 者 紹 介

奥村 紀之 (正会員)は,前掲(Vol. 32, No. 3, p. 341)参照. プタシンスキ ミハウ(正会員)は,前掲(Vol. 32, No. 3, p. 341)参照. ジェプカ ラファウ (正会員)は,前掲(Vol. 32, No. 3, p. 341)参照.

図 4 CAO システムの一部([Ptaszynski 10, Fig.5] より抜粋)

参照

関連したドキュメント

行列の標準形に関する研究は、既に多数発表されているが、行列の標準形と標準形への変 換行列の構成的算法に関しては、 Jordan

文字を読むことに慣れていない小学校低学年 の学習者にとって,文字情報のみから物語世界

この 文書 はコンピューターによって 英語 から 自動的 に 翻訳 されているため、 言語 が 不明瞭 になる 可能性 があります。.. このドキュメントは、 元 のドキュメントに 比 べて

作品研究についてであるが、小林の死後の一時期、特に彼が文筆活動の主な拠点としていた雑誌『新

明治33年8月,小学校令が改正され,それま で,国語科関係では,読書,作文,習字の三教

これらの定義でも分かるように, Impairment に関しては解剖学的または生理学的な異常 としてほぼ続一されているが, disability と

手動のレバーを押して津波がどのようにして起きるかを観察 することができます。シミュレーターの前には、 「地図で見る日本

本論文での分析は、叙述関係の Subject であれば、 Predicate に対して分配される ことが可能というものである。そして o