PDFファイル 2I5OS08b オーガナイズドセッション「OS8 意味と理解のコンピューティング」

(1)

The 28th Annual Conference of the Japanese Society for Artificial Intelligence, 2014

- 1 -

ン

知識

推論

用い

幼児教材

仲間外

概念探

問題

取組

評価

An evaluation of commonsense knowledge-based reasoning approach to the problem of recognizing the

dissimilar concept from the concepts sets taken from the educational materials for human child

中原

和洋

*1

内

咲

*1

林

実央

*1

山

茂雄

*1

Kazuhiro Nakahara Saki Uchida Mio Kobayashi Shigeo Yamada

*1

日本

株式会社

総合技術研究所

Technology Research & Innovation, Nihon Unisys, Ltd.

With the development of the knowledge base, ConceptNet, and its reasoning algorithm AnalogySpace, the basis of the commonsense AI is now ready for the further research to be carried out. The authors had been involving in the acquisitions of Japanese commonsense knowledge and the development of the knowledge base. This paper proposes a method to assess the commonsense reasoning techniques that use our knowledge base and inference algorithms, and reports the results of the assessment. The assessed task was to make inference in solving the problem of identifying the most dissimilar concept from the sets of concepts taken from the educational materials for human child aged 3-4. In the evaluation, a comparison was made with the results brought by the method of Latent Semantic Analysis using Wikipedia and the method of similarity calculation using WordNet, demonstrating the superiority of our commonsense AI approach over those existing methods.

1.

人工知能研究い，ンン対象知識ベー

や推論古重要課題認識さ．

2000 年代入，ンン知識ベー ConceptNet[Havasi

07]や推論手法 AnalogySpace[Speer 08] 開さ，

ンン AI 研究基整備さあ．筆者日本

ンン知識獲得進．一方，あ時

点ンン知識ベー使推論性能客観

的，定量的評価，研究方向性や課題抽出，応用

先検討等様々観点重要あ．本論，筆者日

本収集ンン知識 AnalogySpace 利用概

念間類似度推定客観的，定量的性能評価評価手

法確立目的．販さい幼児向教材仲間

外概念探問題利用，正答率評価．

本論構成以通あ．2章 ConceptNet AnalogySpace ンン推論，日本知識獲得研究

い，3章評価方法い，4章評価結果，5章

考察，6章述．

2. コ

ンセン

知識ベー

と推論

本章，評価実験利用 ConceptNet

AnalogySpace，筆者行日本ンン

知識収集い記述．

2.1 ConceptNet

ConceptNet ，マー工科大学ボ(MIT

ボ) 開中ンン知識ベーあ．

ConceptNet ，概念 Concept ー，概念間関係 Relation ー表明 Assertion 集合意味ワ

ーンン知識表現．概念表単語

や短いー表現，関係 IsA，HasProperty，PartOf， Desire あ規定さ用い．ConceptNet

，意味表現(Assertion) 表層表現(Sentence) 対応

ー保持い 1 ．

2.2 AnalogySpaceと概念間類似度計算

AnalogySpace ， MIT ボ開 ConceptNet

基いンン推論手法あ． AnalogySpace ，

ConceptNet ンン知識ベー対主成析

SVD 次元削減適用手法あ．ConceptNet

Assertion Concept-Feature マ A 変換 . Feature Concept Relation 組あ．マ A 対 SVD

次元数 k 次元削減行う得 A 近似

Ak=UkSkVk ，A 0成あ ConceptNet 含

いConcept-Feature 組(未知 Assertion) 類推値得．，Concept間類似度計算 U_kS_k·(U_kS_k)

T

算出．AnalogySpace 提案論文[Speer 08] 限

定的ンプン推論正確性評価，

人間持ンン比推論性能いう観点，客

観的，定量的評価さいい．

連絡先：中原和洋，日本 (株) 総合技術研究所，東京

都江東区豊洲1-1-1，[email protected]

2I5-OS-08b-4

人飯を食べとを望

人飯食べ

Desire

Sentence

Concept Relation Assertion

Concept

(2)

- 2 -

2.3 日本おけコンセン知識収集

ンン知識当前 Web 文書等表明さ

い傾向あ，人手知識ベー化方

法取．Cyc[Lenat 95] 知識専門家手， OMCS[Singh 02] ンーボン，

近年 Game With A Purpose(GWAP) ンー

ー知識ベー化ーさ方法行

わい [Lieberman 07][Kuo 09]．筆者，日本

ンン知識獲得目的ンーー

立ち知識ベー化進．

(1) ナーと

2010 年開始ンーーー [中原 11] ，ーいうキーンー

プー間行わ連想ー，ー出

５ン彼女頭思い浮ばプ

ー当ーあ．プー回答ンン知

識収集さ．2013年7 時点，24万件ンン

知識(Sentence数) 獲得い．

(2) 日本人検定

2012 年開始 Facebook プ日本人検定 [中原 13] ，自日本人ベ調一回 20問

形式ーあ．回答者全員回答日本人

さ出，得点 Facebook 友人ち互い

ェ競い合う．ー回答内容ンン知識

収集さ．2013年7 時点，約61万件ンン

知識(Sentence数) 獲得い．

3. 評価実験方法

本論目的ンン推論一あ概念間類似

度推定性能い客観的，定量的評価評価手

法確立あ．販 3 4歳児向幼児教材[ 編集

室 12] [ 会] 仲間外概念探問題取組正

答率等評価．

3.1 評価実験手順

(1) 教材問題テキト化

幼児教材仲間外概念探問題，4 い 5 概念

示提示さ，中仲間外概念

1 回答問題あ．例えば，出題概念集合C=｛犬，猫，

うさ，鳥各え，最仲間外概念あ

鳥回答問題あ．様々理付異概念

仲間外見可能あ，幼児教材 1 正

解常識的断最典型的自然仲間外割当

，正解見客観的定量的評価

可能考え．，本評価画像認識対象外，

著者人手出題概念正解概念キ化

行い，問題入力，評価回答，正解キ

．人手キ化，教材書い題意

正解従う客観性担保キ表現

際多様性対以方針定人手対応

 題意変わい範 ConceptNet 含 Concept

キ表現用い

 ConceptNet 複数 Concept 対応場合， Concept Feature数最多いConcept キ表現

用い

実際作成問題総数 4択問題 130 問,5択問題

38問合計168問あ．

(2) 前処理

ConceptNet4.0 複数表現 1 Concept 見出語

統一 lemmatizer 組込い日本語 lemmatizer 貧弱あ，例えば漢統合さ

い．筆者途統合処理行．

(3) 回答処理

n択仲間外探問題概念集合 C={c₁,c₂,…,c_n}

仲間外概念c_out 以式出．

(1)

C 含 Concept うち3 以 Concept 既知あ (Concept-Featureマ行成 )場合，問

題対回答可能，既知 Concept集合内 c_out 計算回答．既知 Concept 3未満あ

場合，問題対回答能．

(4) 回答採点と評価指標導出

全問題総数 N=168，N うち回答可能あ問題数

効回答数 N_a,正答問題数 N_c 時，性能評価指

標，効回答率RR=N_a/N，効回答正答率RCR=N_c/N_a，

正答率CR=N_c /N 出．

3.2 評価実験テ

評価実験，ンン知識ベー

ConceptNet4.01 用い，概念間類似度計算 AnalogySpace

実装あ Divisi2 1

用い．仲間外概念回答式

(1) 用い．以降本手法ンン手法呼ぶ．

(1) コンセン知識セット

知識量や，知識収集手法毎異知識作成，評

価行．All 2013年 7 時点知識，

Mid All 50% ,Small All 10% Sentence ン

ンプン生成知識あ．Default ConceptNet4.0 配提供さい日本語知識， Nadya ー，Kentei 日本人検定収集

知識生成知識あ．知識

Sentence数，Assertion数, Concept数表示．

表 1: 評価実験利用したコモンセンス知識セット

知識 Sentence数 Assertion数 Concept数 All 868,228 181,820 65,295 Mid 434,114 110,558 43,847 Small 86,823 32,160 17,590 Default 14,368 12,825 11,100 Nadya 243,010 102,424 15,462 Kentei 610,850 73,083 52,126

(2) テトパラータ

結果影響えー，SVD 縮次元

数 K={100,200,300,400}，Concept-Featureマ A 効ー行列方向最非0成数Cutoff={1,3,5}，

A 正規化(各成行列ベ割 )

1

(3)

- 3 - 無 Prenorm={1,0}，類似度計算 U_kS_k 正規化(各成

行ベ割 ) 無 Postnorm={1,0} 4

ー組合わい実施．

3.3 比較手法

ンン手法特長， Web 等文書表明さ

い当前ンン知識人間直接獲得

利用あ．，本評価比較手法

，Web 大規模文書あ Wikipedia 用い潜意

味解析(LSA)手法選定．う比較手法，概

念間類似度計算広用いい WordNet 利用

手法選定．比較手法，概念間類似度

sim(c1,c2) 計算，式(1) 用い仲間外概念回答．

(1) 日本語Wikipedia記事を利用 LSA よ概念間類

似度計算

日本語 Wikipedia 記事 Concept，記事内場単語 Feature 捉え， Concept-Featureマ作成，ンン手法様利用，Concept 記事間類似度計算．成値 tf-idf ．出題概念キ日本語Wikipedia記事対応付筆者人手行．

形態素解析 Mecab 用い，辞書新語対応独

自辞書利用．対象単語詞，動詞，形容詞，

，あ一般語除外．，マ行ベ

列ベ非0成数 5未満ー除外

．さ，Wikipedia 記事，常識的概念言いい

記事大量，対象記事絞行．絞

込方法，Wikipedia 記事ンー

利用，全出題概念対応記事

距 L以属記事対

象記事．表 2 示距 L={0,2,4,全 } 4 種類記事作成，評価 . 記事

，ンン手法様ー，SVD 次元数

K={100,200,300,400}, Prenorm={1,0},Postnorm={1,0}

組合わ実験行． LSA 実装 Divisi2 用い．述手法以降Wikipedia手法呼ぶ．

表 2: 日本語WikipediaのLSAによる比較手法

記事距数記事数単語数

WLSA_A 全 116,162 884,583 390,761 WLSA_4 4 4,902 150,823 224,932 WLSA_2 2 2,416 84,029 157,190 WLSA_0 0 566 34,607 78,764

(2) WordNetを用い概念間類似度計算

WordNet 概念間類似度計算手法い提案さ

，nltk 1

関数実装さい 6種類概念間類似

度計算手法(Path Distance, Leacock Chodorow[Leacock 98], Wu-Palmer[Wu 94], Resnik[Resnik 95], Jiang-Conrath[Jiang 97], Lin[Lin 98]) 比較手法用い．日本語 WordNet1.1 [Isahara 08] 英語 WordNet ン用い英

語 WordNet synset マン行後，nltk 用い英語 WordNet synset間類似度計算

．出題概念対複数 synset ン

場合，筆者人手題意適 synset 対応付

1

http://www.nltk.org/

行．概念情報量必要類似度手法い，

Brown ー用い算出情報量利用．述手

法以降WordNet手法呼ぶ．

4. 評価実験結果

本章評価実験結果い記述．

4.1 最大性能比較

ンン手法比較手法実験結果い，

最大正答率出ー結果表 3 示．

ンン手法，知識ソー =All，Cutoff=3，K=400， Prenorm=0，Postnorm=1 あ．Wikipedia 手法記事 =WLSA_0，K=300，Prenorm=1，Postnorm=0 あ．WordNet

手法 Resnik Similarity 結果あ．表 3 p値，

ンン手法側検定 p値あ．

表 3 手法毎の結果

手法ンン Wikipedia WordNet

効回答数 159 160 153

正答数 103 91 83

効回答率 0.95 0.95 0.91

効回答正答率 0.65 0.57 0.54

正答率 0.61 0.54 0.49

効回答正答率p値 0.09153 0.03755

正答率p値 0.1122 0.01853

4.2 知識量別結果

ンン手法知識量結果表 4 示．

2 知識量(Assertion数) 効回答正答率関係示．

表 4 知識量別の結果

知識ソー Small Mid All

効回答数 111 154 159

正答数 60 90 103

効回答率 0.66 0.92 0.95

効回答正答率 0.54 0.58 0.65

正答率 0.36 0.54 0.61

All

Mid Sma ll

Defa ult Na dya

Kentei

y = 0.1095ln(x) - 0.6799

0.2 0.4 0.6 0.8 1.0

1.0E+04 1.0E+05 1.0E+06 1.0E+07

有

効

回

答

正

答

率

Assertion数

(4)

- 4 -

4.3 知識収集手法別結果

ンン手法知識収集手法結果表 5

示．

表 5 知識収集手法別の結果

知識ソー Default Nadya Kentei

効回答数 25 148 86

正答数 8 90 41

効回答率 0.15 0.88 0.51

効回答正答率 0.32 0.61 0.48

正答率 0.05 0.54 0.24

5. 考察

本章，4章評価実験結果基考察述．

5.1 性能評価

本評価 3 4歳児身概念間類似性

評価能力対，現時点ンン手法程度

性能あ客観的，定量的把握可能．表 3

示う，ンン手法，Wikipedia 手法や WordNet

手法比効回答正答率や正答率い良好結果

得．効回答率い差異少い．ンン

手法効回答率 0.95 あ，3 4歳児問わ概念

大部ーい言え．一方回答能あ

5% い今後知識ベー化進必要あ．5% 含

概念例，年寄席譲，年玉

う複数文節表現必要概念あ．う概

念扱え知識収集手法や知識表現検討必要あ．

各手法回答傾向い考察．出題問題，種類

違い問う問題用途違い問う問題多含．

WordNet 手法や Wikipedia手法，種類違い問う問題

ンン手法近いベ正答率示傾向見

，用途違い問う問題ンン手法比

低い正答率示傾向見．，Wikipedia 手法

い対象記事数増やほ性能悪化傾向あ

，今回う常識的定問題対記事

多い推測．従，良い性能出

記事除去必要，ンン手法比

安定性能出ーンい言え．

5.2 知識量と性能関係

本評価，知識量推論性能関係把握う

． 2 示通，知識量対数ーー増加合わ

効回答正答率線形的向い傾向見．

本評価，知識収集手法妥当性や効性断

可能．表 5 結果，筆者行ー

や日本人検定利用収集知識，Default

効回答正答率回，効知識収集手法あ

断．ー日本人検定比，

ー方指標い回，

良い知識収集手法あ断．

6. おわ

幼児教材仲間外概念探問題利用，ン

ン推論定量的，客観的評価可能．Wikipedia

や WordNet 利用手法比ンン推論利用

手法良好結果得．ンン知識量増加

伴う性能向見．

参考文献

[Havasi 07] Havasi, C., Speer, R., Alonso, J.: ConceptNet 3:a flexible, multilingual semantic network for common sense knowledge, In Recent Advances in Natural Language Processing , 2007．

[Isahara 08] Isahara, H., Bond, F., Uchimoto, K., Utiyama, M., Kanzaki, K.: Development of the Japanese WordNet, in LREC-2008, 2008．

[Jiang 97] Jiang, J. J., Conrath, D. W.: Semantic similarity based on corpus statistics and lexical taxonomy, in 10th Intl. Conf. Research on Computational Linguistics (ROCLING), 1997．

[Kuo 09] Kuo, Y. L., Lee, J.C., Chiang, K., Wang, R., Shen, E. Chan C., Hsu, J.: Community-based game design: experiments on social games for commonsense data collection, Proceeding KDD-HCOMP’09, ACM, Inc., 2009． [Leacock 98] Leacock, C., Chodorow, M.: Combining local

context and WordNet similarity for word sense disambiguation, WordNet: An Electronic Lexical Database, MIT Press, 1998．

[Lenat 95] Lenat, D.: CYC: a large-scale investment in knowledge infrastructure, Communications of the ACM, ACM, Inc., 1995．

[Lieberman 07] Lieberman, H., Smith, D., Teeters, A.: Common Consensus: A Web-based Game for Collecting Commonsense Goals, Intelligent User Interfaces, ACM, Inc., 2007．

[Lin 98] Lin, D.: An Information-Theoretic Definition of Similarity, In Proc. of Conf. on Machine Learning , 1998． [Resnik 95] Resnik, P.: Using Information Content to Evaluate

Semantic Similarity in a Taxonomy, in IJCAI’95,1995． [Singh 02] Singh, P., Lin, T., Mueller, E., Lim, G. Perkins,

T.,Zhu, W.: Open Mind Common Sense: Knowledge acquisition from the general public, Proceedings of the First International Conference on Ontologies, Databases, and Applications of Semantics for Large Scale Information Systems, Springer Verlag , 2002．

[Speer 08] Speer, R., Havasi, C., Lieberman, H.: AnalogySpace: Reducing the dimensionality of common sense knowledge, AAAI, AAAI Press, 2008．

[Wu 94] Wu, Z., Palmer, M.: Verb Semantics and Lexical Selection, in ACL’94, 1994．

[ 会] 会教材開室: 29 仲間

，株式会社幼児教育実践研究所会 .

[中原 11] 中原和洋，山茂雄: 日本ンン知識

獲得目的 Web ー開評価，技報

通巻107号，日本， 2011．

[中原 13] 中原和洋: ンン知識獲得目的ソー

ー日本人検定，技報通巻 115 号，日

本，2013．

[ 編集室 12] 編集室，伊藤恭修: 能力育成問題

PDFファイル 2I5OS08b オーガナイズドセッション「OS8 意味と理解のコンピューティング 」

ン

ン

知識

推論

用い