• 検索結果がありません。

言語処理が社会に浸透するには(<特集>編集委員会企画-社会とAIの羅針盤2015-)

N/A
N/A
Protected

Academic year: 2021

シェア "言語処理が社会に浸透するには(<特集>編集委員会企画-社会とAIの羅針盤2015-)"

Copied!
1
0
0

読み込み中.... (全文を見る)

全文

(1)

20 人 工 知 能  30 巻 1 号(2015 年 1 月) 「編集委員会企画─社会と AI の羅針盤 2015 ─」 自然言語処理の実社会での応用事例を日常的に耳に するようになった.2011 年にクイズ番組において人間 のチャンピオンに勝利した米 IBM の人工知能型コン ピュータ「Watson」は,日本語対応版が開発され,日 本のメガバンクのコールセンタに導入予定との報道が あった.米アップルの「Siri」や NTT ドコモの「しゃべっ てコンシェル」は,誰もが知るアプリになり,音声対 話研究に憧れて研究室の門を叩く学生が増えた.東大に 合格するロボットを研究開発するプロジェクト「ロボッ トは東大に入れるか」は,大手予備校の大学入試セン ター模試において 476 大学で A 判定を出し,受験生か ら羨望の眼差しが注がれている.急成長を続けるスター トアップ企業である SmartNews や Gunosy のニュース キュレーションサービスでは,機械学習や自然言語処理 が活用されている. さて,我々の研究室では自然言語処理の実社会応用の 一環として,マスメディアと共同でデータジャーナリズ ムに取り組んだ.データジャーナリズムとは,データの 収集,マイニング,可視化を経てストーリーを起こし, 記事を執筆するというプロセスを指す.すなわち,報道 の現場にデータマイニング的なアプローチを取り入れた もので,ストーリーができる前にまずデータを分析し, 出てきた仮説を取材などで検証して記事化する.これま でに,「3 月 11 日の人々の思い」,「2013 年参議院総選 挙時の世論」,「福島の桃に対する風評」,「AKB の総選 挙」,「2014 年サッカー W 杯」など,さまざまな事例に 関してソーシャルメディアの投稿から世の中の意見や動 きを探った.記事や番組の締切りに追われながらデータ を分析するというのは,論文の締切りとは違った緊張感 であった.また,データ分析の進め方や見せ方など,我々 も学ぶことも多かった.本稿では,言語処理と社会とい う観点で一つエピソードを紹介したい. 報道では記事内容の正確さが求められ,誤報は決して 許されない.これはデータジャーナリズムでも同様で, 分析結果の正しさを保証する必要がある.残念ながら, 言語処理の解析精度は 100%ではないし,分析手法(例 えば「自由民主党」というキーワードを含む投稿数)は 調査したい事項(例えば「自由民主党の支持率は何%で あるか」)の近似でしかない.また,ソーシャルメディ アのユーザ層は有権者の分布とはかけ離れているので, データサンプルの偏りも考慮する必要がある.これらの 問題に対処するテクニックはいろいろあるが,突き詰め ると一つの大原則に行き当たる. それは分析手法と結果の透明性を確保することであ る.データの分析結果を記事にするときは,必ず分析手 順を一般の人にも伝わるように説明する.また,分析結 果として提示する数値も,一般の人が解釈できるような 統計量を使うことが望ましい.これらの配慮が欠けてい ると,どんなに高度な分析手法を使っても,出稿時の チェックが通らない.特定の個人・団体に利するような 分析という疑念を払拭できるように,備えておく必要も ある. 例えば,総選挙の情勢を占うために「アベノミクス」 に対する世論の反応をソーシャルメディアから分析す ることを考える.「アベノミクス」を含む投稿数を提示 することは問題ない.形態素解析の誤りを徹底的に修 正しておけば,投稿中に含まれるキーワードとその出 現頻度を提示することも可能である.キーワード抽出な ら TF*IDF や相互情報量を統計量として使いたくなる が,これらの手法や数値の意味が説明できないため,難 色が示される.世論の反応の分析というタスクを考えれ ば,機械学習に基づく評判分析が自然なアプローチであ るが,分析の正確性を担保するための相当な労力と度胸 がいる.メディアに掲載される言語処理の分析が単純な 手法・指標になりがちなのは,このような事情がある. 言語処理技術が社会に浸透していくには,社会からの 正しい理解と信頼を得ていく必要がある.短期的には, 言語処理技術の応用事例が増え,解析技術がブランド化 される流れが続くであろう.応用事例を積み重ねること で,技術そのものに対する理解や,解析誤りへの寛容度 が上がっていく.言語処理技術が足りない部分を人間が 補いながら,今後も世の中を驚かせるような応用事例が どんどん出てくるのではないかと思う. 一方で,「人間のように自然言語を操るコンピュータ」 を真に実現し,100%の解析精度を達成するには,残さ れた課題が山ほどある.未知語の問題,常識的な知識の 不足,表現の多様性,単語の意味に基づく句の意味の解 釈,文の境界を超えた言語理解,マルチメディア(画像, 動画,ソーシャルネットワーク)と言語のグランディン グ,言語理解と意図理解のギャップなどである.このよ うな言語処理の根源的な課題に,実社会の(非)言語デー タと向き合いながら取り組めるというのは,何とも贅沢 な時代である.2045 年,すなわち自分が 65 歳になるま でに,これらの問題の解決を目指しつつ,社会から正し く理解・信頼される言語処理を見据え,研究と実社会で の応用を継続していきたい.

言語処理が社会に浸透するには

岡﨑 直観

東北大学大学院情報科学研究科

参照

関連したドキュメント

会社法 22

オリコン年間ランキングからは『その年のヒット曲」を振り返ることができた。80年代も90年

昨年の2016年を代表する日本映画には、新海誠監督作品『君の名は。」と庵野秀明監督作品『シ

3 当社は、当社に登録された会員 ID 及びパスワードとの同一性を確認した場合、会員に

関係会社の投融資の評価の際には、会社は業績が悪化

原子力規制委員会(以下「当委員会」という。)は、平成24年10月16日に東京電力株式会社

二月八日に運営委員会と人権小委員会の会合にかけられたが︑両者の間に基本的な見解の対立がある

社会学研究科は、社会学および社会心理学の先端的研究を推進するとともに、博士課