九州大学学術情報リポジトリ Kyushu University Institutional Repository [2019] 九州大学情報統括本部年報 : 2019 年度 出版情報 : 九州大学情報統括本部年報. 2019, p

全文

(1)

[2019]九州大学情報統括本部年報 : 2019年度

http://hdl.handle.net/2324/4123611

出版情報:九州大学情報統括本部年報. 2019, pp.1-, 2020-12-01. 九州大学情報統括本部 バージョン:

権利関係:

(2)

1.1 スタッフ一覧

職名 氏名 研究キーワード

教授 廣川 佐千男 機械学習、検索エンジン、テキストマイニング、推論システム、証明論 准教授 鈴木 孝彦 演繹データベース、論理プログラミング、機能論理プログラミング、CA

Dデータベース、認証、PKI、属性認証

准教授 伊東 栄典 Webマイニング、Webサービス、情報検索、情報統合、XML、分散 システム、ネットワーク、協調システム、ソフトウェア工学

1.2 研究事例紹介

「単語の分散表現を用いた文書クラスタのラベル推定」

伊東栄典 1.2.1はじめに

教師なし機械学習手法であるクラスタリング手法として階層化手法のWard法や、非階層化手法のK−

means法などが検討されてきた。クラスタリングの問題として、生成されたクラスタの解釈がある。従来

は計算結果として生成されたクラスタを人の手で分析し、そのクラスタの意味を持たせていた。たとえば 顧客分析では、クラスタリングされた顧客の集合に分析者が意味を与え、それを企業でのニーズ分析や売 り上げ向上などのマーケティングに役立てていた。また、楽曲・映像・漫画小説などのコンテンツ集合の クラスタリングでは、コンテンツ集合の意味を与えることでコンテンツ推薦に役立てることが出来る。

クラスタリング適用より得られるクラスタは、何らかの属性を持つ集合と考えられる。しかし、機械 的抽出で偉えるクラスタの属性把握手法は確立されていない。分割されたクラスタに対して、クラスタ属 性を示すラベルを機械的に付与できれば、人手によるクラスタ属性の確認作業無しに、クラスタが目的に 沿って正しくクラスタリングされているかを評価できる。

既存の研究としてクラスタリングされたニコニコ動画の動画メタデータ文書群へのラベル付けや、

Naive Bayesモデルを用いた手法などがある。本研究ではその前段階として、正解ラベル付き文書データ

群に対し、文書の内容からのラベル推定を行う。正解ラベル付き文書データとして1995年にKen Langに より公開されたThe 20 Newsgroups data setと、NHN Japan株式会社が運営するlivedoor ニュースを収集 したものであるライブドアニュースコーパスを用いた。本研究では文書集合のラベル推定のために、

Facebook AIが提案・公開している単語の分散表現手法であるfastTextを用いた。Facebook AIは手法と

ツールを公開するだけでなく、英語版Wikipediaを文書コーパスとする単語ベクトル(wiki.en.vec)を公開し ている。The 20 Newsgroups data setを用いた実験ではこの英語版Wikipediaから生成された単語ベクトル を用いた。また、ライブドアニュースコーパスを用いた実験では、fastTextが使用するモデルの内、文章 中に含まれる単語の並びから単語の出現確率を利用するSkip-gram モデルを用いて分散表現を獲得した。

本研究では、文書集合のラベル推定方法として単語分散表現を用いた手法を提案する。SVMを用いた 文書分類で算出された単語の重みを用いて文書群の重要語を定義し、その重要語と関連する語を文書群 のラベルとする方法である。

(3)

1.2.2 用いたデータ

本研究では文書群に対し、文書の内容からのラベル推定を行う。そのため予め正解ラベルが付与された 文書群を用いる。分析対象とする正解ラベル付き文書集合として、 The 20 Newsgroups データセットと ライブドアニュースコーパスを用いる。

The 20 Newsgroups

The 20 Newsgroupsデータセットは、1995年にKen Langにより公開されたものである。表1に示す20 個のニュースグループに投稿されたUsenetのニュース記事を集めたものである。Usenetとは、インター ネット上に提供された分野別のニュース記事投稿提示サービスである。表1に各文書数を示す。

1 The 20 Newsgroups内の各文書数

グループ グループ

alt.atheism 480 rec.sport.hockey 598

comp.graphics 581 sci.crypt 594

comp.os.ms-windows.misc 572 sci.electronics 591 comp.sys.ibm.pc.hardware 587 sci.med 594 comp.sys.mac.hardware 575 sci.space 593 comp.windows.x 592 soc.religion.christian 599 misc.forsale 582 talk.politics.guns 545 rec.autos 592 talk.politics.mideast 564 rec.motorcycles 596 talk.politics.misc 464 rec.sport.baseball 594 talk.religion.misc 376

ライブドアニュースコーパス

ライブドアニュースコーパスは、NHN Japan株式会社が運営する livedoor ニュースの記事を収集した もので、表2に示す9つのカテゴリに分かれている。各記事はURL、作成日時、タイトル、本文から構 成される。

2 ライブドアニュースコーパス内の各文書数

カテゴリ 数

独女通信 870 Sports Watch 900 家電チャンネル 864 MOVIE ENTER 870 トピックニュース 770 ITライフハック 870 エスマックス 870 livedoor HOMME 511

Peachy 842

(4)

1.2.3 ラベル推定手法

ラベル推定問題を2つの部分問題に分割する。1つ目は文書クラスの重要語抽出問題である。2つ目は、

クラスの重要語からのラベル語推定問題である。手法2では、SVMで文書クラスの重要語抽出を行い、

その後に重要語からラベル語を推定する。

SVMを用いた重要語抽出

SVM (Support Vector Machine) を用いた文書クラスの重要語抽出について説明する。SVMは1995年頃

にAT&TのV. Vapnikが発表したパターン識別用の教師あり機械学習方法であり、局所解収束に関する問

題が無い。マージン最大化で汎化能力を高めており、現在知られている分類器として高速かつ高性能な識 別能力を持つ。線形でない非線形カーネルも利用可能であるため、線形分離不可能な分類問題にも適用可 能で応用範囲が広い。データを2つに分類する2クラス分類には優れている。多クラス分類は、2クラス 分類を複数回適用することで対応できる。

線形SVMによる2クラス文書分類

重要語抽出のために用いた線形 SVM による2クラス文書分類を説明する。N個の文書から成る文書集 合Dがある。文書d (d∈D )が属するクラスも与えられる。各文書d の中に出現する単語を抽出し、文書

dをBag of Words で表現する。更に各単語の出現頻度を数え上げることで、dを単語の頻度ベクトルで表

現できる。これにより全文書を文書単語行列(document word matrix)で表現する。ここまでの手順を図1に 示す

1 文書集合とBag of Words, 文書単語行列

次に、文書単語行列を学習データに用いて線形SVMの文書分類器を作る。文書分類器は、あるクラス C に属する文書か否かを判定する。本研究では2クラス分類の線形 SVM を用いるため、文書クラス数と 同数の SVM分類器を作成する。学習データである文書単語行列を SVM で学習させることで、クラスC に対する単語への重みが算出される。

文書クラスに対する重要語選出

クラスCのSVM文書分類器作成により、クラスCに関する単語の重みが算出される。正の重みを持つ

(5)

単語は正例に影響が大きいため、クラスC と関連が大きい。逆に負の重みを持つ単語は負例に影響が大 きいため、クラス C と関連が小さい。重みの絶対値が大きいほど影響が大きい。そこで、正の重みの大 きな単語をクラスCに対する重要語とする。本実験において重要語は正の重み上位のK = 10個とした。

重要語からのラベル候補選出

次にクラスCに対する重要語から、本研究の目的であるクラスのラベル推定手法を述べる。SVMが算 出した単語の重みを用いて、重みが上位K個の単語をクラスCに対する重要語とする。この重要語集合 をVcとする。クラス Cの重要語を用いてクラスCのベクトルを算出する。クラスCのベクトルは、K 個の重要語の単語ベクトルの平均値とする。各単語のベクトルは、コーパスからの学習で得た単語ベクト ルを用いる。式にクラスCのベクトル算出を示す。

最後に、算出したクラスCのベクトル vec(C) から、文書クラスCのラベル候補を選出する。コーパ スからの学習で得た単語ベクトルを用いて、クラスC のベクトルvec(C)と単語x のベクトルvec(x)との 類似度を計算する。類似度には以下の式で計算できるコサイン類似度を用いる。

cos(𝐶𝐶,𝑥𝑥) = 𝑣𝑣𝑣𝑣𝑣𝑣(𝐶𝐶)∗ 𝑣𝑣𝑣𝑣𝑣𝑣(𝑥𝑥)

|𝑣𝑣𝑣𝑣𝑣𝑣(𝐶𝐶)||𝑣𝑣𝑣𝑣𝑣𝑣(𝑥𝑥)|

類似度の大きな順に単語を並べ、類似度の上位個を文書クラスCのラベル候補とする。図2にSVMで の単語の重み算出と分類器作成とを示す。

2 クラスCの重要語からのベクトル算出

1.2.4 実験

The 20 Newsgroups

The 20 Newsgroupsの文書集合に、推定手法を適用した。SVMにより算出された各クラスの重要語上位

10単語と、クラスごとの上位10単語の一部を示す。紙面では都合上4グループに絞って示す。ただし、

各クラスの重要語に含まれる単語のうちwiki.en.vecに含まれないものは上位語から除外して11番目以降 の単語を繰り上げて示している。

(6)

ライブドアニュースコーパス

ライブドアニュースコーパスを用いた研究では、文書に含まれる抽出対象の単語を名詞のみにし、全文 書中に 3 文書以上かつ全文書の半分の文書以下に登場する単語に限定した。また、ニュースカテゴリそ れぞれをクラスとし、独女通信・Sports Watch・家電チャンネル・MOVIE ENTERの4クラス分の文書分 類器を作成した。こちらも SVMにより算出された各クラスの重要語上位 10 単語と各クラスのラベル候 補を表に示す。ただし、独女通信の重要語である「独女」・「オフィスエムツー」は単語ベクトルが存在し なかったため、こちらも11番目以降の単語を繰り上げて示している。

3 SVMによる重要語上位10単語 (The 20 Newsgroup)

alt.atheism comp.windows.x misc.forsale rec.sport.baseball

1 keith motif sale baseball

2 benedict xterm offer phillies

3 mathew widget shipping sox

4 atheists server sell cubs

5 atheism xlib obo career

6 gregg window pay pitcher

7 atheist widgets summer mattingly

8 believing openwindows asking ball

9 islamic clients offers stadium

10 tammy consortium camera mets

4 ラベル候補 (The 20 Newsgroups)

alt.atheism comp.windows.x misc.forsale rec.sport.baseball

1 atheist openwindows buy phillies

2 atheism widgets offer yankees

3 atheisty sqlwindows purchase astros

4 atheistrabbi wxwidgets sell shortstop

5 atheists xpwindows sale baseman

6 atheistic wxwindows purchases mets

7 atheistical qdesktopwidget buying sox

8 apatheist decwindows purchasing outfielder

9 theist openwindow reselling diamondbacks

10 atheistically windowing pay dodgers

5 SVMによる重要語上位10単語 (ライブドアニュースコーパス)

独女通信 Sports Watch 家電チャンネル MOVIE ENTER

1 独女 Sports 話題 映画

2 オフィスエムツー Watch 本日 征服

3 オトナ女子 インターネット上 売れ筋 スカイライン

4 境界線 選手 関連 DVD

5 Style ファン ネット 本作

6 BIGLOBE 家電 MOVIE

7 平気 ロンドン五輪 パナソニック ENTER

8 69 美女 亜紀子 特集

9 MIWA 牧田 公開

10 HARD サッカーファン 和製

(7)

6 ラベル候補 (ライブドアニュースコーパス)

独女通信 Sports Watch 家電チャンネル MOVIE ENTER

1 EXHiBiTiON US サッカーアスリー

トオブザイヤー

ス マ イ る No.1 ショップ

MOVIE輝きの向こう側

へ!

2 DEYEGIRL マ ッ チ デ ー ハイ ラ イ

パナソニックセー ルスマンカタログ

オリジナルムービー

3 SHOWNEN オ フ ィ シ ャ ルツ イ ッ

ター

テレビシャカイ実 験あすなろラボ

MOVIE-

4 ChageLiveTour サッカーファン 家電 銀魂 2 掟は破るために

こそある

5 THEウラBEST!私だけのド

リカム

SHERDOG カスタムインイヤ

モニター

MOVIES

6 HIXNADE Goal.com 住商ホームショッ

ピング

Hi☆sCoool!セハガール

7 高見沢俊彦のロックばん FIFPro パ ナ ソ ニ ッ ク ショップ

劇場版弱虫ペダル 8 たまゆら~もあぐれっしぶ SportFight 新型テレビ スピンオフネットムー

ビー

9 しおりごと-BEST- NBCスポーツ パソコンサンデー 劇 場 版 仮 面 ラ イ ダ ー ゴースト 100 の眼魂と ゴースト運命の瞬間

10 SHOWGATE SportsCenter ハイエンドテレビ 劇場版七つの大罪天空

の囚われ人

1.2.5 考察

The 20 newsgroups を用いた実験では、ニュースグループ名と関連する単語が多く出現した。例えば

alt.atheismグループでは、ラベル候補に近い単語が多く上位10単語に存在している。またmisc.forsaleグ

ループでは重要語に存在しなかったbuyやpurchaseといった単語が上位に選出されている。このことは、

SVM で抽出された語句内にふさわしい語が抽出されていなかったとしても、ラベル推定にふさわしい語 句が出現する可能性があるといえる。一方、comp.windows.xグループのラベル候補には、重要語に存在し たwindowsが存在しなくなり、windowsを含む周辺語が多く選出されている。またrec.sport.baseballグルー プも、重要語最上位であった baseball がなくなり、MLB のチーム名など固有名詞が上位に選出された。

これらのことから、ラベル候補はラベルの語句の抽象度に左右されることが推測できる。抽象度の低いも のほど、上位概念よりも、固有名詞を含む下位概念を多く抽出する傾向にある。

ライブドアニュースコーパスを用いた実験では、独女通信では話題が広いためか、ラベル候補も広い ジャンルのものになった。一方他の3 クラスでは、The 20 newsgroupsと同様にそれぞれのクラスに関連 する固有名詞が多くなっている。これはクラス内の文書の話題が特定分野の話題に限定されているため であるためと考えられる。

1.2.6 おわりに

本研究では単語の分散表現を用いて文書群のラベルを推定した。Wikipediaに含まれる名詞という膨大 な候補の中からラベル候補を見つけることで各クラスの上位概念を探そうとした。しかし、得られた結果 の多くは上位概念とはいえない。今後の課題として、単語ベクトルを学習するための文書集合を別の物に 変えることを考えている。また、SVMが導出した重みの上位Kの値を変化させた場合や負の重みを持っ た語句を計算に含めて比較を行うなど、適切なパラメータの導出の分析も行いたい。そして、ラベル候補

(8)

がどれほどふさわしいか定量的な評価の確立を行うことを検討している。

発表論文

[1] 淀川翼, 加登一成, 伊東栄典: 単語の分散表現を用いた文書クラスタのラベル推定, 人工知能学会 SIG-SWO, vol.49, no.3, 2019.

[2] 加登一成, 伊東栄典: 単語の分散表現を用いた文書群のラベル推定, 2019年度 電気情報関係学会 九州支部連合大会, 10-2P-04, pp.580-581, 2019.

(9)

1.3 研究内容紹介

1.3.1 廣川 佐千男

研究内容

研究のスローガンは、「データ*目的*技術」と体力です。文書群を「データ」として、具体的な

「目的」に応じて、意味のある情報を抽出する「テキストマイニング技術」の研究を行っています。

例えば、これまで、診療記録から長期入院患者の特徴抽出、営業日報から営業マンの売上推定、学 生の授業コメントから成績予測、万葉集と古今集の自動識別、Web 健康情報の信頼性評価、有価証 券報告書から企業の比較、倒産情報から倒産理由抽出、特許情報から研究組織の構造推定などの研 究を行い、国際会議やジャーナルあるいは特許として発表してきました。研究の手順としては、ま ず、対象の文書群についての専用検索エンジンを作り、分析観点を色々切り換え、数万回の検索を 自動的に繰り返します。結果は統計的に集計したり、機械学習で分類したり、特徴語の関連を可視 化したりします。計算機の力を借りて、人手では容易に実現できない、文書データの深い理解を目 指しています。

所属学会名

人工知能学会, 情報処理学会, 電子情報通信学会

主な研究テーマ

• データマップ法と概念グラフによる次世代検索エンジンの研究開発

キーワード:検索エンジン, マトリックス検索, 概念グラフ, 大学発ベンチャー, 2006.08 ~ .

• リンク情報と Web データの半構造性を融合した高品質コンテンツ・マイニング

キーワード:Web マイニング, データマイニング, WWW, XML, 文書検索, 検索エンジン, 特許検索, データベース, 2001.04 ~ .

• 専門検索サイトの動的統合による次世代検索システムの研究開発 キーワード:検索エンジン, メタサーチ, 1993.04 ~ .

• 構成的論理の推論構造の研究

キーワード:証明論, 型理論, ラムダ計算, 線形論理, 適切さの論理, 直観主義論理, 1997.01~.

(10)

研究プロジェクト

• テキストマイニングによる医療プロセスのキーファクター抽出 2015.04~, 代表者:廣川佐千男

研究業績

 原著論文

1. Jun Zeng, Xin He, Yingbo Wu, Sachio Hirokawa, User Behavior Analysis of Location-Based Social Network, 7th International Congress on Advanced Applied Informatics, IIAI-AAI 2018

Proceedings - 2018 7th International Congress on Advanced Applied Informatics, IIAI-AAI 2018, 10.1109/IIAI-AAI.2018.00015, 21-25, 2019.04.

2. Sachio Hirokawa, Kiyota Hashimoto, Simplicity of Positive Reviews and Diversity of Negative Reviews in Hotel Reputation, 2018 International Joint Symposium on Artificial Intelligence and Natural Language Processing, iSAI-NLP 2018

2018 International Joint Symposium on Artificial Intelligence and Natural Language Processing, iSAI- NLP 2018 - Proceedings, 10.1109/iSAI-NLP.2018.8692973, 2019.04.

3. Kahori Ogashiwa, Toru Sugihara, Kumiko Kanekawa, Yuki Kitanaka, Kazuhisa Noguchi, Soichiro Aihara, Masao Mori, Sachio Hirokawa, Quality Assurance in Education through the Diploma Policy and President's Message - An Analysis Focused on Local Community, 7th International Congress on Advanced Applied Informatics, IIAI-AAI 2018

Proceedings - 2018 7th International Congress on Advanced Applied Informatics, IIAI-AAI 2018, 10.1109/IIAI-AAI.2018.00203, 964-965, 2019.04.

4. Sachio Hirokawa, Message from General Chair, 7th International Congress on Advanced Applied Informatics, IIAI-AAI 2018

Proceedings - 2018 7th International Congress on Advanced Applied Informatics, IIAI-AAI 2018, 10.1109/IIAI-AAI.2018.00005, XXIV, 2019.04.

5. Takahiko Suzuki, Tssukasa Kamimasu, Tetsuya Nakatoh, Sachio Hirokawa, Identification of Unnatural Subsets in Statistical Data, 7th International Congress on Advanced Applied Informatics, IIAI-AAI 2018 Proceedings - 2018 7th International Congress on Advanced Applied Informatics, IIAI-AAI 2018, 10.1109/IIAI-AAI.2018.00024, 74-80, 2019.04.

6. Masaru Taga, Toshihiro Onishi, Sachio Hirokawa, Automated Evaluation of Students Comments Regarding Correct Concepts and Misconceptions of Convex Lenses, 7th International Congress on Advanced Applied Informatics, IIAI-AAI 2018

Proceedings - 2018 7th International Congress on Advanced Applied Informatics, IIAI-AAI 2018, 10.1109/IIAI-AAI.2018.00059, 273-277, 2019.04.

7. Naoto Kai, Kota Sakasegawa, Tsunenori Mine, Sachio Hirokawa,

Machine Learning of Ambiguous Sentence Factors in Technical Manuals for Tacit Knowledge,

Proceedings of The Twenty-Fifth International Symposium on Artificial Life and Robotics 2020 (AROB 25th 2020), p229-304

B-Con Plaza, Beppu, Japan, January 22-24, 2020.01.

8. Kahori Ogashiwa, Eiichi Takata, Tetsuya Oishi, Masao Mori, Sachio Hirokawa, Text Mining and Logic Model for University Midterm Plans,

2019 8th International Congress on Advanced Applied Informatics (IIAI-AAI), 2019.07.

(11)

9. Yusuke Tozaki, Takahiko Suzuki, Tsunenori Mine, Sachio Hirokawa,

Extracting Irregular Datasets in University Admission Statistics using Text Mining and Benford's Law, 2019 8th International Congress on Advanced Applied Informatics (IIAI-AAI),2019.07.

10. Hidekazu Iwamoto, Tokuro Matsuo, Yasushi Sugiyama, Sachio Hirokawa,

Quantitive Analysis of Important Attributes to Attract International Conventions, 2019 8th International Congress on Advanced Applied Informatics (IIAI-AAI),2019.07.

11. Takuya Kawatani, Eisuke Itoh, Sachio Hirokawa, Tsunenori Mine, Machine Learning and Visualization of Sudden Braking using Probe Data,

2019 8th International Congress on Advanced Applied Informatics (IIAI-AAI),2019.07.

12. Yuki Okumura, Sachio Hirokawa, Kazuhiro Takeuchi,

Significance of Low-Frequent Words in Concept Describing Document,

2019 8th International Congress on Advanced Applied Informatics (IIAI-AAI),2019.07.

13. Jun Zeng, Haoran Tang, Yingbo Wu, Ling Liu, Sachio Hirokawa,

Predict the Next Location From Trajectory Based on Spatiotemporal Sequence, 2019 8th International Congress on Advanced Applied Informatics (IIAI-AAI), 2019.07.

14. Naoto Kai, Kota Sakasegawa, Tsunenori Mine, Sachio Hirokawa,

Machine Learning of Ambiguous Sentences inTechnical Manual for Tacit Knowledge Acquisition, EEE/IIAI International Congress on Applied Information Technology (IEEE/IIAI AIT 2019), November, 2019.11.

 特許出願

1. Sachio Hirokawa, Yusuke Tozaki, Takahiko Suzuki, Method and Apparatus for Detecting Correction in a set of Number (62/86111), 2019.6(仮出願)、2020.6.10 出願

2. 廣川佐千男, 特願2019-21562, 2019年11月28日 アンケート分析装置、アンケート分析方法、及びア ンケート分析プログラム

3. 廣川佐千男, 特願2019-218063, 2019年12月 2日 データ分類装置、データ分類方法、及びデータ分 類プログラム

4. 廣川佐千男, 特願2019-217858, 2019年12月 2日 分析装置、分析方法、及び分析プログラム

教育活動

 教育活動概要

大学院システム情報科学府情報知能工学専攻の協力講座として広域分散データ特論・演習を担当し、

インターネット検索エンジンなどの基礎となる技術を教えています。大学院統合新領域ライブラリ ーサイエンス専攻博士課程も担当しています。また、学部の講義では工学部電子情報工学科におい て、プログラミング論Iを担当しています。同学科の学部学生についての卒業研究と、大学院シス テム情報科学府情報知能工学専攻ならびに大学院統合新領域学府ライブラリ専攻の修士、博士課程 の指導も行っています。

(12)

1.3.2 鈴木 孝彦

研究内容

• 九州大学教務事務システムの作成と運用支援

• 九州大学学務情報システムの計画支援

• 日本語 WordNet およびテキストマイニング

• 機械学習

• 異常検知

所属学会名 情報処理学会

主な研究テーマ

• Benford の法則を用いた異常検知

キーワード:Benfordの法則 異常検知, 2017.04~2019.05

教育活動

 教育活動概要

1. プログラミング言語特論 システム情報科学研究院 2. 情報処理概論 工学部エネルギー科学科

3. 情報処理概論 工学部物質科学科(材料コース)

(13)

1.3.3 伊東 栄典

研究内容

• 情報検索・情報統合・情報連携

Web 上や電子データとして蓄積されている膨大なデータから、意味のある知識抽出や、抽出した知 識を統合する研究を行っている。具体的には、Web データからの情報抽出、利用者コメントからの 知識発見、コメントやリンク構造を利用したコンテンツ推薦などを行っている。ソーシャルブック マークからの新規情報の発見や、「クチコミ」と呼ばれる情報サービスからの知識抽出について研 究している。

• 集合知を利用した高品質コンテンツ検索

情報検索および知識発見に関する研究の具体的な対象として、ネット上のコンテンツを対象とした 研究を行なっている。近年、ユーザ投稿型のコンテンツサービスが普及しており、動画・写真・静 止画・小説などが増大している。これらのサービスでは、投稿機能だけでなく、視聴者からのコメ ント・タグ付け・リンクなどのフィードバック機能もある。視聴者からのフィードバックは、

Folksonomyや集合知と呼ばれるもので、これを活用したコンテンツ検索を行なっている。

• 電子認証基盤および認証フェデレーション構築

特定メンバーへの情報提供サービスや、オンラインでの商取引および申請のように、利用者を正し く認証する電子認証が求められている。本研究では電子認証機構および認可機構の構築と、情報サ ービス連携のための認証連携機構の構築を目的としている。多様な組織が柔軟にサービスを提供し あうための、電子認証基盤の構築についての研究開発を行う。その実現のために、同じポリシー・

標準規格での認証基盤となるフェデレーションについての研究開発を行う。電子認証証基盤として、

認証のためのデータベース構築、アプリケーションとなる情報サービスでの認証・認可機構の実現 などが課題となる。組織内で使う、柔軟な利用者認証・認可システムの実現を目指す。

所属学会名

情報処理学会, 電子情報通信学会

主な研究テーマ

• 大規模データ解析

キーワード:大規模データ, 分散処理, 統計解析, クラウド・コンピューティング, 2012.06~.

(14)

• ネットコンテンツの傾向分析

キーワード:ネット, コンテンツ, 動画, 小説, つぶやき, 傾向分析, 感情分析 2018.04~.

• 情報検索・情報統合・情報連携

キーワード:情報検索, 情報統合, Webマイニング, 情報抽出, 推薦, 2000.04~.

研究業績

 原著論文

1. Takuya Kawatani, Eisuke Itoh, Sachio Hirokawa, Tsunenori Mine, Machine Learning and Visualization of Sudden Braking using Probe Data, 2019 8th International Congress on Advanced Applied Informatics (IIAI-AAI), 10.1109/IIAI-AAI.2019.00024, 67-72, 2019.07.

2. 柴田 知親, 伊東 栄典, 商品レビューの有用性ランキング推定, 人工知能学会 SIG-KBS, B5, 2, 25-30, 2019.11.

3. 佐嘉田 悠樹, 伊東 栄典, 不動産間取り図画像の特徴量による物件類似性の導出, 人工知能学会 SIG- KBS, B5, 2, 19-24, 2019.11.

4. 淀川 翼, 加藤 一成, 伊東 栄典, 単語の分散表現を用いた文書クラスタのラベル推定, 人工知能学会 SIG-SWO, 49, 3, 2019.11.

5. 弓場 邦哲, 伊東 栄典, 感情Tagを用いた感情学習及びLSTM,GRUの比較実験 ~デスクトップマスコ ットの AI エージェント化に向けて~, 電子情報通信学会 信学技報 AI2019-35, 119, 317, 31-36, 2019.11.

6. Takuya Kawatani, Eisuke Itoh, Sachio Hirokawa, Tsunenori Mine, Location does not always determine sudden braking, 2019 IEEE Intelligent Transportation Systems Conference (ITSC),

10.1109/ITSC.2019.8917480, 27-30, 2019.11.

7. 佐嘉田悠樹, 伊東栄典, 間取り図に基づく類似性抽出, 第12回データ工学と情報マネジメントに関す るフォーラム(DEIM2020), A6-2, 2020.03.

 学会発表

1. 堺 雄之介, 伊東 栄典, Yahoo!知恵袋データセットからの流行語抽出, 2019年度 電気情報関係 学会九州支部連合大会, 2019.09

2. 佐嘉田 悠樹, 伊東 栄典, 不動産間取り図画像を用いた類似物件抽出, 2019年度 電気情報関係 学会九州支部連合大会, 2019.09.

3. 加藤 一成, 伊東 栄典, 単語の分散表現を用いた文書群のラベル推定, 2019年度 電気情報関係学会 九州支部連合大会, 2019.09.

(15)

4. 淀川 翼, 伊東 栄典, 機械学習手法を用いたクイズ問題のジャンル推定, 情報処理学会 火の国情報シ ンポジウム2020, 2020.03.

5. 加登 一成, 伊東 栄典, 大規模文書コーパスから得た単語の分散表現を用いた 文書群のラベル推定, 情報処理学会 第82回全国大会, 2020.03.

6. 堺 雄之介, 伊東 栄典, オンライン小説の流行語抽出, 情報処理学会 第82回全国大会, 2020.03.

教育活動

 担当授業科目

1. 2019年度・夏学期, プログラミング演習Ⅰ(A) 2. 2019年度・前期, 情報知能工学演習第二 3. 2019年度・前期, 情報知能工学講究第二 4. 2019年度・後期, 情報知能工学演習第一 5. 2019年度・後期, 情報知能工学講究第一 6. 2019年度・後期, 情報知能工学演習第三 7. 2019年度・後期, 情報知能工学講究第三 8. 2019年度・後期, 人工知能

大学運営

 学内運営に関わる各種委員・役職等

1. 2012.06~, 情報統括本部・認証基盤事業室

2. 2011.04~, 情報統括本部・全学基本メール事業室

Updating...

参照

Updating...

関連した話題 :

Scan and read on 1LIB APP