PDFファイル 2I5OS08b オーガナイズドセッション「OS8 意味と理解のコンピューティング」

(1)

The 28th Annual Conference of the Japanese Society for Artificial Intelligence, 2014

- 1 -

幼児

学習

用い

意味

確率的表現

Probabilistic Representation of Word Senses using Learning Bias of Infant Children

高田

朋貴

*1

高木

友博

*1

Tomoki Takada Tomohiro Takagi

*1

明治大学理工学研究科基礎理工学専攻

Computer Science Course, Graduate School of Science and Technology, Meiji University

These days computers are needed to deal with human language more exactly because the language analysis by computers is growing important. In this paper, we aim to enable computers to deal with the ambiguous word sense by proposing the combination method of the learning bias of infant children and the previous machine learning method. First, we obtain the surround information for identifying the target word sense by using LS model. Next, we input these information into LDA and generate the target word sense distribution. We use the learning bias initialization instead of the random initialization. This enables estimating the number of topics automatically and the efficient learning.

1. 序論

近年 WEB 発ー呼ばう大

ー増加続けい例えばソー発展

ー能動的 WEB ー生成こ容易

うこうー用い推薦や

予測等研究盛行わい単語意味

考慮言語処理精度関わ非常要問題

あー生成 web

け単語や記号表現幅大幅広こ

日々創出さ単語辞書追加計算機処理さ

け十分あ今後計算機動

的言語処理能動的単語意味推論

自然言語い計算機理解さい方法論

検討こ必要可あこ実現従来

機械学習加え知言語学や脳科学発心理学等観

人間学習本質的何考え

知見積極的入こ要あ考えい

本稿幼児学習あ LDA

組合わこ人間う単語意味定い過

程抽象的単語意味確率的表現方

法論模索

2. 幼児の学習バイアス

幼児言語獲得いワ提起ー問

題[Quine 1960] あこ問題簡単言えばあ象

対発言葉象部分指示い

わいいうあ幼児こ問題様

状況置いいう例えば母親子あ

言葉発時子いう言葉意味

白い動物耳長いこ赤い目こ等う無数

意味候補推測こうこ問題解決

幼児言葉意味推論際全意味

ぶ検証一種思い込う意

味可能性制限いいいう考えあ

考え方一制約理論 [今 2007][今 2003] あ

以代表的制約示

2.1 形状類似性バイアス

形似通物士ベ持可能性高い

解釈仮あ幼児未知物対新奇言葉

使わ聞言葉特定個体指固有詞

ー指示普通詞あ判断形

類似性注目形似他物言葉適用

ここ注目幼児あ物ー

あう判定際形類似度従判定

いいうあ

2.2 相互排他性バイアス

相異ベ対象物関連けこ

い解釈仮あ幼児既知い物対

未知言葉聴い言葉指示既

前知い異あ解釈傾向あ

3. Loosely Symmetric model

こ人間因果帰納等在対称性

び前節述相互排他性いう 2 非

論理的知緩や持確信度あ

[篠原2007]

い原因象 p 結果象 q 時対称

性 → いう情報 → 相互排他

性 → ̅ → ̅ こ示こ論

理学い逆裏関係あ論理的誤あ人

間因果帰納い度々こう推論行う知

いこ柔軟扱うこ人間感覚

近い結果得こ示さい

表1 う a b c d 象共起頻度

ば LS 式(1) う示こ出来

� | = + +

+ + ₊ + ₊

連絡先：高田朋貴, 明治大学理工学研究科基礎理工学専攻

214-0034 川崎多摩区東田1-1-1

Tel: 044-934-7483 [email protected]

2I5-OS-08b-3

表1 各事象の共起情報

̅

(2)

- 2 -

図1 提案概要図

4. 言葉の意味の確率的表現

近年言葉意味確率的潜在意味分析確率的扱

ういう研究[持橋 2002][阿部 2007] さ良い精度

示い本稿こ先行研究い言葉意味

確率的表現こ目指既手法 Probabilistic

Latent Semantic Indexing pLSI ベー用いい

本稿近年注目集い一あ

Latent Dirichlet Allocation(LDA)[Blei 2003] 用いこ

手法大利単語意味各潜在所属

確率分表現言葉意味確率いう抽象

的表現計算機表現可能あ

5. 提案シス

ム

図1 提案概要図あ学習い単語

周辺情報得ー渡各単語周辺情報

得各単語文書得さ周辺情報

文書特徴語 LDA 入力こ時通常 LDA

う初期用い恣意的初

期行う LDA 得文書所属分

各単語意味抽象的表確率的表現扱う

5.1 LSモルを用いた周辺情報取得

本稿単語意味定周辺情報入力さ

単語一文書出現語定義こ考え方

情報検索一般的分仮踏襲幼児あ未

知語聞い時状況類似判断こ周

辺情報今回 1-gram 文言語い

1-gram 文最さい断情報あ幼児得周

辺情報一一断的情報あこ想定さ

あ但こ非常多情報得い

情報意味定要あ判断こ

いこ LS 用い LS 得

閾以文入力さ単語因果性高い情報

捨選択こ処理加えこ知

単語意味定情報有益情報

得考え

特徴問題あ一般的 LDA 文書対象

あ特徴整数扱う特徴語付

け行うこ LDA 実行方法[Wilson 2010] あ LS

分散非常さい付け

効果い考え本稿 2種類特徴

方法論検討一目単純文在有無

特徴 0 1 扱う方法あ先述う

LDA 文書対あ文書特徴

冪乗う則従うこ知いこ目

：用い初期

0. 初期 1 けあ一番初学習入力

語所属さ

1. 入力語込数 1 時類似度閾

�以あば初期振分け

�未満あば新い生成新規

振分け数 2以時手順 2 移行

うけば手順1 繰返

2. 入力語初期済全語類似度計算

3. 初期済語分 A 入力語類似度変

換公式代入得結果分 B 生成分

A 時所属確率最大あ注目

分 B 得

4. 全初期済単語対手順 3 終わ各

最大得

5. 各総和 1 う正規分 C

生成

6. 分 C 一様分否以う分岐

a) 一様分あば新生成入力語

新割当

b) 一様分けば分 C 基初期

行う

7. 全入力語初期終わば終了うけば

手順2 戻

冪乗分う特徴変換 LS

求 Zipf 法則当方法考え LS

あ映さ順序着目式(2) Zipf 法

則当こ冪乗ういうあ単

純 Zipf 法則当う 1-gram 文関連

単語さあ場合順付け文さ

あ場合特徴非常大う

ー s 各文書 LS 最大代入こ

大こ抑えこ冪乗

際少数うあ場合四捨

入こ整数行

�; �, � =_∑_� ⁄�_⁄

�= (s: ー N:全要素数 k：順 )

5.2 バイアスによるLDAの初期化

一般 LDA 2 問題在一目

設計者数設定あ目初期

精度依問題あ前者あ設計者

数前設定けば数経験的設定

けばい解決策 HDP-LDA[Teh 2006] う

確率的数求手法提案さい

数大さ生こや出力中人間解釈

い出力得うこあ等問題あ後

者最初初期局所解容易抜け出

精度影響えういう問題あ記 2

問題解決提案手法記示

う学習考慮初期手法提案

手順2 類似度式(3) cosine尺度用い但特徴

語使わ在有無ベ扱う従

(3)

- 3 -

cos( ⃗, ⃗⃗) = ⃗ ∙ ⃗⃗

| ⃗||⃗⃗|

手順 3 用い変換公式式(4) あこ式類似度

高けば高い現在注目い初期済単語

分う分い異分

幼児形状類似性類似い物対

ベ適用いう仮形類似度合

一ーう判断い考え

本稿形類似度合周辺情報士類似度見

類似度高けば一あ可能性高類似度

けば物所属異所

属確率高い解釈こ式(6)

関数あ域 [0,1] う調整あ

� , �� =_{∑ (� , �� )}� , ��

�, �� = �� ∗ � + ( − �� ) ∗ − �

�� =

+ −�� − .5 (�： i 所属確率 sim:類似度)

手順6 一様分否新規生成

判定一様分各所属確率等確

率あ裏返ば明確所属いいうこ

新所属いう仮基い

い一様分あう判定分 C 一様分

Jensen-Shannon Divergence 用いここ類似度

う 1 最類似い計算式(7) う変

形用いいこ閾以あ分 C

一様分あ判定

� � , = −�� ||

�� || = (� || + � || )

� || = ∑ � = � lo� � = �_{� = �} �

6. 実験

6.1 実験設定

実験ー売新聞 1989,1990,1994 用い

1989 1990 年学習ー 1994 年ー

Perplexity 測定用い各閾 =0.5 �=0.5 =0.999

式(6) 関数ー gain=10

LDA 推論 Collapsed Gibbs Sampler 用いー

ー =1 =1 ー回数 100回

学習ー中出現普通詞52,703単語今回学習

さ単語

6.2 実験結果

初 LS 用い得周辺情報い述

表2 3 国会ソ連関周辺情報示

変換 Zipf 法則当変換時示

い 5.1節述う LS 分散非常さい

見変換冪乗分従う変換さい

各単語関連い文一文あ

7. 結論

LS 用い単語意味定周辺情報

得 LDA 初期幼児基手法入

周辺情報対特徴けい文在

有無表ベ用い方法 Zipf 法則

基変換さ用い手法方生成さ意味

確率分曖昧性少い分幼児学習

考慮初期手法 LDA 数確率的

手法依自動的決定こ学習初期効

率効果こ出来初期最終的意

味確率分精度向優性示こ

こい幼児学習考慮手法検

討い必要性あ考えい

本手法単語曖昧意味確率的表現こ

ば細い単語間類似度測定更

一意的単語意味捉えけ文脈考慮意味

確率分変さ単語間類似度評価

推察いこ文脈依単語集合生成

こ人間う概念表現可能

期待い最終的人間概念生成計算機実現

(4)

- 4 -

図２ピック数の推移

参考文献

[Blei 2003] David M. Blei, Andrew. Y. Ng and Michael I. Jordan: Latent Dirichlet Allocation, Journal of Machine Learning Research, Vol. 3, pp.993-1022, 2003.

[Quine 1960] W. V. Quine: Word and Object, Cambridge, MA. : MIT Press, 1960.

[Teh 2006] Y. W. Teh, M. I. Jordan, M. J. Beal, and D. M. Blei: Hierarchical Dirichlet processes. Journal of the American Statistical Association, Vol. 101, No. 476, pp.1566-1581, 2006.

[Wilson 2010] Andrew T. Wilson and Peter A. Chew: Term weighting schemes for Latent Dirichlet Allocation, In Human Language Technologies: The 2010 Annual Conference of the North American Chapter of the Association for Computational Linguistics, vol. 10, pp. 465–473, 2010.

[阿部 2007] 阿部慶賀中川正宣：言語統計解析用い確

率的言語知識構築心理学的妥当性検証知

科学 Vol.14 No.1 pp.91-117 2007.

[今 2007] 今針生悦子：構築子

う語概念学い岩波書店 2007.

[今 2003] 今島久雄：人学ぶいうこ

知学習論観樹出 2003.

[ 林 1999] 林郁夫川庸一今尾崎知伸:

機能論理幼児詞語彙獲得

電子情報通信学会技術研究報告言語理解

ー研究会 NLC Vol. 99 No. 387 pp.29-36

1999.

[篠原 2007] 篠原修田亮桂田浩一新田垣雄：因果

性基信念形成 N本腕問題

応用人工知能学会論文 22巻1号G pp.58-68 2007.

[持橋 2002] 持橋大地松本裕治：意味確率的表現情報

処理学会研究報告自然言語処理研究会 2002-NL-147

77-84.

表2 LSモルか取得さた周辺情報

国会ソ連

LS 変換 LS 変換

党 0.555 19 ソ 0.628 29

議 0.537 13 連 0.561 19

民 0.531 10 ワ 0.530 15

政 0.529 9 領 0.528 12

衆 0.529 8 0.527 11

国 0.527 7 国 0.527 9

案 0.525 7 0.525 9

会 0.524 6 0.523 8

院 0.522 6 0.522 7

員 0.520 5 0.521 7

1400 1600 1800

0 5 0 1 0 0

P E R P LE X IT Y ITERATION Bias Random 0 20 40 60 80 100

0 20000 40000 60000

ピ

ッ

ク

数

学習単語数

ZIPF ALL1 0 0.5 1.0 P ro b a b il it y Topic Bias Random 1300 1400 1500 1600 1700

0 5 0 1 0 0

P E R P LE X IT Y ITERATION Bias Random 0 0.5 1.0 P ro b a b li ty Topic Bias Random 0 0.5 1.0 P ro p a b il it y Topic Bias Random 0 0.5 1.0 P ro b a b il it y Topic Bias Random

表3 バイアス初期化に単語類似度

国会ソ連

類似度類似度

国会 1.000 ソ連 1.000

自民党 0.985 東 0.931

懇談 0.975 ワ 0.928

参院 0.970 西独 0.916

審議 0.968 0.916

可決 0.966 共和 0.915

辞任 0.964 ネー 0.914

党首 0.962 ワ 0.909

議員 0.960 日越 0.893

会派 0.951 東独 0.892

表4 ランダム初期化に単語類似度

国会ソ連

類似度類似度

国会 1.000 ソ連 1.000

会派 0.960 共和 0.939

否決 0.954 東 0.912

両氏 0.942 ー 0.911

両院 0.939 0.911

議決 0.937 施 0.903

党首 0.933 0.903

党 0.927 0.900

各党 0.926 ワ 0.899

会期 0.925 0.895

図3 特徴量：ZIPF

図5 国会：ZIPF

図4 特徴量：ALL1

図6 国会：ALL1

図2 ピック数の推移

PDFファイル 2I5OS08b オーガナイズドセッション「OS8 意味と理解のコンピューティング 」

幼児

学習

用い

意味

確率的表現

Probabilistic Representation of Word Senses using Learning Bias of Infant Children

高田

朋貴

高木

友博

明治大学理工学研究科基礎理工学専攻

1.

序論

2.

幼児の学習バイアス

3. Loosely Symmetric model

2I5-OS-08b-3

4.

言葉の意味の確率的表現

5.

提案シス

ム

6.

実験

7.

結論

PDFファイル 2I5OS08b オーガナイズドセッション「OS8 意味と理解のコンピューティング」