• 検索結果がありません。

PDFファイル 1H5NFC01b 近未来チャレンジセッション「NFC (サバイバル) Total Environment for Text Data Mining 」

N/A
N/A
Protected

Academic year: 2018

シェア "PDFファイル 1H5NFC01b 近未来チャレンジセッション「NFC (サバイバル) Total Environment for Text Data Mining 」"

Copied!
4
0
0

読み込み中.... (全文を見る)

全文

(1)

The 28th Annual Conference of the Japanese Society for Artificial Intelligence, 2014

- 1 -

統合環境

TETDM

用い

ニン

初心者

獲得支援

Acquisition of Text-Mining Skills for Beginners Using TETDM

中垣内

李菜

川本

佳代

砂山

Rina Nakagochi Kayo Kawamoto Wataru Sunayama

広島市立大学大学院情報科学研究科

Graduate School of Information Sciences, Hiroshima City University

Only the very limited people with text mining skill can acquire significant knowledge using text mining tools effectively. TETDM assume not only experts of text mining or this software but also the beginners as users. However, beginners had to master how to use it by trial and error repeatedly until now. Hence, in this paper, we defined the skill to operate text mining tools smoothly and to analyze results appropriately as text-mining skill. Then we proposed a system which assists for beginners to use TETDM and showed the effect of the system by experiment.

1.

じめに

近 ,安価 大容 記憶装置や,高性能 演算処理装

置 普及,ネ ワ 環境 整備さ こ ,膨

大 タ 取 扱わ う , タ

ニン 注目さ う . キ 対象 し

タ ニン 行う 一 統合環境

TETDM[砂山 13] あ .統合環境 あ TETDM ,

キ ニン 技術 提供し い 複数 処理

,画面へ 出力 行う複数 可視化 柔軟 組

合わせ ,ひ ソ 内 動作させ こ 可

能 統合環境 あ .TETDM 想定し い 利用者 ,

キ ニン やソ 利用 熟練者゙け

初心者 含 .こ TETDM 対面し 初

心者 ゙こ ゙ う 学゙゙ い わ い ,解

, 試行錯誤 繰 返し 使い方 習得し い

.本論文 , キ ニン や TETDM 初心

者 無理 導入 初級 ゙ 習得 う

チ 実装し, 効果 評価実験

示す 確 し,さ ,使用者 特性

効果 い 改善ず 点 明 す こ 目的

す . ,初級 ゙ 一通 処理 可視化

使い方 関す 知識 習得し, 生 し

各自 目的 応゙ キ ニン 試 こ

゙ す . ,本研究 け 初心者

TETDM 0 数回使 こ あ 特定

使用し こ あ 人 す .

2.

関連研究

2.1 統合環境TETDM

TETDM ,複 数 キ ニン 技術 柔 軟 組 合

わ 使用 能 統合環境 構築 ,社会的創造的活動 支

援 環境 提供 目指 い .TETDM , 学生 や 主

婦 ,PC 利用 キ ニン いう言葉 知

い 想定 , 純 直感的 用い ,利用価値

あ 環境 構築 目指 い .TETDM 関 ,

処 理 や 視 化 開 発 関 様 々 研 究[砂 山

01] [山 手 12][梶 並 12] 行 わ , 本 研 究 , TETDM 初 使 う人 ,TETDM 機能 容 易 ,

有効 使え う ,TETDM 使 キ ニ

ン 学習 新 い ンタ 提案 .

2.2 既存 テキス マ ニン ツー

タ ニ ン 数 多 存 在 す . 例 え

゙, 生物学 分 ,PolySearch[Cheng 08] や

GeneWizard[Faro 11]や@Note[Lourenço 09] 開発さ

い . こ , 研 究 者 膨 大 学 技

術 医学雑 需要 生物医学情報 取得す こ

研究 促進 目指し い .こ ゙ し 既

存 タ ニン 研究 ほ ゙ ,対象

特定分 専門家 あ こ 前提 し い .

日本 ,公開さ い キ ニン ,

DIAMining[DIAMining] , Text Mining Studio[Text

Mining Studio],TRUE TELLER[TRUE TELLER],

LanguageWare [LanguageWare] ゙ あ .こ ソ

使用 明書や 具体例 提示

゙ 用意さ い ,主 ネ 現場 い 人

し 想定し い ,利用す 高い

モヂ ン 維持し各自 キ ニン 知識

得 ,経験 積 こ 求 い .本研究 ,

キ ニン 実際 行い 自然 知識 技

術 得 う ンタ 作成 .

連絡先:中垣内李菜,川本佳代,砂山渡,広島市立大学大学院情

報科学研究科 学専攻,広島市安佐 区大塚東

目4番1号,{nakago,kayo,sunayama}@sys.info. hiroshima-cu.ac.jp

(2)

The 28th Annual Conference of the Japanese Society for Artificial Intelligence, 2014

- 2 -

3.

チュー

システム

3.1 チュー システム 概要

本チ ンタ チ

ン (図1),課題 詳細 ン (図2 ),

課題解答 ン (図2右) 3種類 ン 構

成さ .本チ あ ゙ 作成し

課題 タ 記述し 課題 各課題 詳

細 内容 記述し 複数 各課題 キ 入力

し,各課題 一覧 チ ン 作成

す . チ ン 任意 課題

選択す こ ,チ 挑戦す .

,現在初級 ゙ 課題 実装し い , 課題

や 各課題 キ 追加 変更す こ 簡

単 中級 級者用 チ 課題 追加 修正

可能 い .

3.2 チュー システム ンタフ ース

(1) チュー ン

チ ン , 部 学習者 や経験

値,使用者 カ ソ 合わ い 課題 タ

表 示 , 部 複 数 宝 箱 表 示 . チ 内 容

応 8種類(MISSION0 MISSION7) 46課題 用意

, 各 宝 箱 各 課 題 対 応 い . 最 初 3 種 類

MISSION , キ ニン や TETDM 関 基礎 知

識 得 ,TETDM 基本操作 通 学゙ .

残 5 種類 MISSION ,提供 い 処理

視化 使い方,処理 視化 組 合わ

使 い 方 い 学゙ . 各 課 題 宝 箱

,課題 詳細 ン 課題解答 ン 表

示 .

(2) 課題 詳細 ン と課題解答 ン

課題 詳細 ン 部 課題 詳細 表示 , 部

送 ボタン(back <,next >),画像表示ボタン(figure),

ン 閉 ボタン(close) 配置 .各課題 以 い

対応 行動 行う .

 課題 詳細 ン 課 題解答 ン 表示

場合,課題 詳細 ン 記述 い 明

後 , 必 要 探 出 答 え 探

,解答 ン 答え 記入 正解 .

 課題 詳細 ン 内 文章中 [ 条件] いう記述

あ 場合, [ 条件] 書 い 操作 行う.

[ 条件] 内容 指定 指定

ボタン 押 あ .

 以 2 条件 い 当 場合,

課題 詳細 ン 記述 い 明 最後

3.3 モチベーション維持 ため ーム的要素

チ ン 内 表示 各課題 示 宝箱 ,

カ ソ 合わ 開く う , 課

題 宝箱 中 宝 表示 う . ,

各MISSION 達成 び 次 MISSION 宝箱 選択

能 . ,各課題 経験値 入 ,獲得

経験値 学習者 SKILL LEVEL 表示

. 的要素 学習者 チ ン 維持

多く 知識や キ 獲得 実装 .

図1: チ ン 表示例

図2: 課題 詳細 ン ( ) 課題解答 ン ( ) 表示例

4.

チュー

システム

評価実験

4.1 実験目的

提案 チ TETDM 使用 支援 有

効 あ , , 使 い や い物 あ , う 特

性 利用者 効果的 明確 目的 .

4.2 実験方法

被験者 成人 男女20 あ .被験者 表1 示 手

従 チ 使用 . 評 価 , 手 3

チ 前後 行わ ,制限時間各 30

得 点 比 較 行 . ,TETDM 内

利用 解答 キ ニン 初歩的

問題 構成 い . , チ 内容

使 い 方 明 あ , 解 答 適

選 択 操 作 必 要 ,チ 内 容

解答 直結 わけ い.

, 被 験 者 特 性 正 答 率 や 課 題 解 答 時 間

関 係 調 特 性調査 ン , 使

いや い 主観 的 評 価 得 後 ン

(3)

The 28th Annual Conference of the Japanese Society for Artificial Intelligence, 2014

- 3 -

表1: チ 評価実験 手

実験手順詳細 想定所要時間(分)

1. MISSION0,1,2全21課題 遂行

課題:一通 操作方法 修得

30

2. 事前 へ 解答

キ ニン 初級問題へ 解答

30

3. MISSION3 7全25課題 遂行

課題:一通 使い方 習得

40−60

4. 事後 へ 解答

事前 同 ゙ 問題へ 解答

30

4.3 実験結果と考察

(1) 事前/事後テス 得点

前 後 平均得点( 前 後

20点満点) い t検定 結果 表2 ,各被験者

平均得点 図3 示 .表 2 , 前 後

平均得点 比較 , 後 方 有意 高く .

,図3 ,20人中19人 被験者 前 後

方 良い点 . 後 前 方 良

い点 取 被験者α 詳細情報 表 3 示

.表3 ,被験者α 不正解数 3減 ,無記入数 4増

え い ,チ 得 知識 く

取 組 時間 足 ,正解 数 減

考 え . , 本チ 通 処 理

視化 使い方 関 知識 習得 ,

生 各 自 目的 応 キ ニン 試

キ 身 け , 定 効果 あ いえ .

方 , 後 点 数 十 高 い 言 え 点数

. , チ 使用 指定

, 処理 試 内容 い 対 ,

30 以 処理 30 以 視化 中 ,

適 選゙必要 あ 影響 考え .

,目的 応 選択 支援 方法 整備

,今後 要 課題 あ .

表2: 前/ 後 平均得点

事前 事後

被験者数 (人) 20 20

均(点) 9.15 13.45

検定結果 t(19)=6.28 p<.001

図3: 各被験者 平均得点 推移

表3: 被験者α 前/ 後 詳細

事前 事後

正解数 14 13

不正解数 4 1

無記入数 2 6

所要時間(sec.) 1800 1800

(2) チュー よび事前/事後テス 平均所要時間

チ 平均所要時間 表 4 , 前/ 後

平均所要時間 表5 示 .表4 ,被験者 MISSION0

7 全46 チ 課題 ,平均約62 標準偏差 =約23 ,予 設定 所要時間90 以

内 ,18 全課題 ,2 42 課題

. ,初心者向け 用意 チ 難易度 適

,TETDM 使 用方 法 学習 効果 期待 . ,

表5 , 前 後 平均所要時間 有意差

く,制限時間30 以内 問題 解け 被験者 い

. 前 や 後 い , 中

開始 前 達成 チ 再挑戦 許

い , 解答 チ 再挑戦

被験者 多く見 . 制限時間内

問題 解答 考 え ,チ

何 度 慣 いく 短 時 間 解 答

う 考え .

表4: チ (全46課題) 平均所要時間

被験者数 (人) 20

均(sec.) 3729.68

表5: 前/ 後 平均所要時間

事前 事後

被験者数 (人) 20 20

均(sec.) 1795.50 1762.55

検定結果 t(19)=1.40 p = n.s.

(3) 学習者特性と事前/事後テス 得点 関係

表 6 信頼度 高 学習者特性 前/ 後 得

点 関係 示 .表6 , TETDM 使 あ 学習

者 8人 後 正解数10問以 学習者 8人,

以外 0人 , 検定 行 結果有意 あ (両側

検定: p=0.0078,p<.01).TETDM 実験実施前 使

あ 学習者 後 10点以 獲得

,TETDM 使用 経験 あ ,チ 学

習 効 果 出や い わ . ,試 行 錯誤

TETDM キ ニン 学習 ,

チ 学習 明確 学習 成果

考え . TETDM 使い あ

程度経験 必要 あ 考え , TETDM 使

い学習者 対 代わ 十 チ

課題 提示 効果的 あ 考え .

表6: 学習者特性 後 得点 関係

出現 度

特性 出現 度

成果 出現 度

信 度 (%)

特性 学習成果

TETDM

使 こ

事後 10点以

8 8 16 100

(4) 学習者特性とチュー に った時間 関係

表7,表8 信頼度 高 学習者特性 チ

時間 関係 示 .表 7,8中 目 い

直 接 確 率 計 算 行 こ 有 意 傾 向 見 (

両 側 検 定: p=0.0194,p<.05,p=0.0623,.05<p<.10).

(4)

The 28th Annual Conference of the Japanese Society for Artificial Intelligence, 2014

- 4 -

長過 い う 注意す 人 チ 比較的

短時間 こ すこ こ わ .単純 コン

タ使用 慣 い 人 短時間 チ

こ すこ 可能 考え ,コン タ使用

慣 い い学習者向け 専門用語 し 解 す こ

や,わ やすい ンタ 設計 徹底 要 あ

考え . ,論理的 考え方 す 人,日頃

文 書 やすさ ごわ 人 文章

慣 い 思わ ,チ 効率

学習 考え .現時点 ,本論文 作成し

チ ,一 課題 内容 詰 込 す

い,長過 い文章 心 け 作成し い ,画像

い 文章 慣 い人 理解し い. チ

明 難しい 思わ 箇所 画像 提

示 う す ゙ 夫 必要 あ 考え .

表7: プ ン 関 学習者特性 チ 時間 関係

出現 度

特性 出現 度

成果 出現 度

信 度 (%)

特性 学習成果

ン 得意

3000 以

6 8 8 75.0

ン 苦手

3000 以

10 12 12 83.3

表8: 文章 記述 関 学習者特性 チ 時間 関係

出現 度

特性 出現 度

成果 出現 度

信 度 (%)

特性 学習成果

文章 書

一文

長さ 注

意す

3000 以

5 7 8 71.4

文章 書

一文

長さ 注

意し い

3000 以

10 13 12 76.9

(5) 事後 ン ー

実験終了後 ,被験者 チ 使う ,

TETDM 使い方 理解 ? いう ン 行

, 理解 回答 人 数 , 理 解

回答 人数 ,18 :2 あ . 結果 い , 検

定 行 結 果 有 意 傾 向 . , 前/ 後

簡 ? いう ン 行 , 前

後 い 簡 回 答 人 数 ,

難 回答 人数 ,5:15 11:9 あ . 結

果 い , 検 定 行 結果, 前

有意 傾向 . , 前 難 い 感 被

験者 明 多 対 ,チ 行う

前 あ 後 難 い 感 被験

者 少 く わ . , 各 MISSION チ TETDM自体 操作方法や

使い方 無理 く習得 あ 考え .

方 後 難 い 感 被 験 者 多 チ

内 容 多 く, 実 験 用 い 数 時 間 け 習 得

考え .

5.

結論

キ ニン や TETDM 初心者 無理 く導入

初級 習得 う チ

実装 . ,評価実験 行う 効果 検証 .

結果,本チ ,限 時間内 通

処理 視化 使い方 関 知識 習得

, 生 各自 目 的 応 キ ニン

試 キ 身 け 有効 あ 明

今後 , TETDMや ン タ 使用 い い

び 文 章 書 経 験 少 い使 用 者 効 果 出

う チ 提 案 , 高 度

中級 級課題 実装 本 実用化 目指 い.

参考文献

[砂山 13] 砂山渡,高間康 ,西原陽子,徳永秀和,串間宗夫,

阿部秀尚,梶並知記: キ タ ニン 統

合環境TETDM 開発,人 知能学会論文誌,28(1),1-12, (2013)

[砂山 01] 砂山渡,谷内田正彦: 展望 複数文書

要約 Web 集合 適用, 般社団法人情報処

理学会,2001(86), 57-62,(2001)

[山手 12] 山手砂都美,砂山渡: 文章 話 組 立 展開速

度 段落間関係 評価,第26回人 知能学会全国大

会, 3K2-NFC-3-4,(2012)

[梶並 12] 梶並知記: TETDM 用い 関連Tweet探索 手

法,第26回人 知能学会全国大会, 3K2-NFC-3-7,(2012)

[Cheng 08] D. Cheng, C. Knox, N. Young, P. Stothard, S. Damaraju, DS. Wishart, PolySearch: a web-based text mining system forextracting relationships between human diseases,genes, mutations, drugs and metabolites, Nucleic Acids Research, Vol. 36, Web Server issue W399–W405, (2008)

[Faro 11] A. Faro, D. Giordano, C. Spampinato, Combining literature textmining with microarray data: advances for system biology modeling, Briefings In Bioinformatics. Vol. 13. No. 1. pp.61-82, (2011)

[Lourenço 09] A. Lourenço, R. Carreira, S. Carneiro, P. Maia, D. Glez-Peña, F. Fdez- Riverola, EC. Ferreira, I. Rocha, M. Rocha, @Note: A workbench for Biomedical Text Mining, Journal of Biomedical Informatics,Vol. 42. pp.710–720, (2009)

[DIAMining] 菱電機 ン ォ ン 株式会社, DIAMining , http://www.mdis.co.jp/products/diamining/, (2014-03-10 )

[Text Mining Studio] NTT DATA Mathematical Systems, Inc., Text Mining Studio , http://www.msi.co.jp/tmstudio/, (2014 -03-10 )

[TRUE TELLER] 村 総 合 研 究 所, TRUE TELLER , http://www.trueteller.net/, (2014–03-10 )

参照

関連したドキュメント

The reasons associated with feelings of burden were the following 14 items: “Breastfeeding requires care about what mothers can eat and drink”, “Breastfeeding alone does not

In particular, we consider a certain natural “environment” for the study of the ´ etale theta function, which we refer to as a “mono-theta environment” — essen- tially

We consider a parametric Neumann problem driven by a nonlinear nonhomogeneous differential operator plus an indefinite potential term.. The reaction term is superlinear but does

In this paper we analyze some problems related to quadratic transformations in the variable of a given system of monic orthogonal polynomials (MOPS).. The first problem to be

In order to present a coherent picture of polytopal linear algebra and to ease references throughout the text, we recall some of the results from [3] and [4] in Section 3; they

Oscillatory Integrals, Weighted and Mixed Norm Inequalities, Global Smoothing and Decay, Time-dependent Schr¨ odinger Equation, Bessel functions, Weighted inter- polation

[9] DiBenedetto, E.; Gianazza, U.; Vespri, V.; Harnack’s inequality for degenerate and singular parabolic equations, Springer Monographs in Mathematics, Springer, New York (2012),

Thus, we use the results both to prove existence and uniqueness of exponentially asymptotically stable periodic orbits and to determine a part of their basin of attraction.. Let