1.は じ め に
人工知能技術は,これまで主に,インターネットサー ビスで収集される大規模なデータや知識を利活用するこ とで発展してきた.しかし,今後は,各種の IoT デバイ スやロボット技術とも連携して,実社会でのサービスや 生活行動を通じて収集されるビッグデータ(実社会ビッ グデータ)を活用した人工知能技術が,実社会でサービ スの高度化や新たな価値創造を実現していくことが期待 されている.しかしながら,実社会サービスを通じて収 集されるデータは非常に多様であり,その利活用には, これまでの機械学習のための静的なベンチマークデータ などとは異なり,プライバシーやセキュリティの問題, データの権利の問題,データの欠乏や欠損の問題,など の多くの課題が存在することが指摘されている. 本稿では,社会に新たに出現しつつある実社会ビッグ データの利活用という観点を中心に,そうしたデータを 活用するための次世代人工知能技術について,産業技術 総合研究所の人工知能研究センターおよび人工知能技術 コンソーシアムの取組みを中心として,現状と課題を解 説する.2. 実社会ビッグデータを活用する人工知能と
その課題
現在の人工知能技術の興隆の要因は,インターネット 上に大量のデータが蓄積され,機械学習技術によってそ れらの大量のデータからきめの細かい知識を獲得するこ とが可能になったことにある.すなわち,深層学習を始 めとした統計的な機械学習手法を基盤とする人工知能シ ステムの性能向上のためには,良質の学習用データが必 要である. これまで,大規模なデータの集積には,特に,情報検 索や e-Commerce,CRM,ソーシャルネットワークサー ビスなどのインターネット上のサービスが大きな役割を 果たしてきた.そうしたインターネットサービスを提供 する企業が,収集した大量のデータに機械学習技術を適 用し,自らのサービスをよりきめ細かい個人依存,状況 依存のものへと改善して収益を上げ,その収益を,機械 学習を中心とした人工知能技術に再投資し,企業買収な ども通じて研究開発人材を囲い込んで技術開発を進め る,というアプリケーションとデータをともに成長させ るスパイラル(図 1)を回すことによって,人工知能技 術は急速に発展してきたと考えられる. これに対して,今後は,機械学習や推論,プラニング などの人工知能のコア技術と,IoT やロボットの技術を 結び付けていくことにより,インターネット上のサービ スのみならず,自動運転,介護,医療,ヘルスケア,も のづくり,研究開発,などの実社会における多様な活 動・サービスについても,同様のスパイラルを回すこと で,機械学習,人工知能技術によってサービスの質や効 率を改善し,パーソナル化,コミュニティ化,状況依存 化されたきめ細かいものにしていくことが期待されてい る.そのために,どのようなデータを誰が収集し,どの ようにサービスの価値向上に生かすのか,そのためにど のような技術が必要になるのか,についての検討や試み が,さまざまな分野で行われ始めているが,そこにおい ては,情報技術以外の分野と連携する必要があることや, 分野ごとの個別性も大きいことなどに由来する困難があ る.以下この節では,データとの関係を中心に,その現 状と課題を概観する.実社会ビッグデータを活用する
次世代人工知能技術
Next Generation AI Technology Based on Big Data in the Real-World
麻生 英樹
産業技術総合研究所人工知能研究センターHideki Asoh Artificial Intelligence Research Center, AIST.
[email protected], http://www.airc.aist.go.jp/
本村 陽一
(同 上)Yoichi Motomura [email protected], http://staff.aist.go.jp/y.motomura/
Keywords:
big data, real-world, cyber-physical system, digital transformation, open inovation. 「AI とデータ─データに基づく意思決定と社会イノベーション創出─」2・1 実社会の現象の観測とデータの収集・管理・保護 サービス上でのユーザの行動に関するデータ(主には マウスのクリックやテキスト入力など)が,ほとんどコ ストなしに自動で記録され得るインターネット上のサー ビスとは異なり,多くの実社会でのサービスにおいては, その過程やそこで起こる現象を,センサや人手による入 力を通じて観測するところから始める必要がある.これ らの観測コストはクリックの記録に比べて高く,収集し 得る情報にも限りがあるため,何のために,どのような センサや入力を用いて,何を観測するべきか,が最初の 課題になる.多くの場合には必要なセンサやセンシング 手法の開発にまで立ち戻る必要も生じる. そうして観測したデータは,雑音,不要な情報,欠損 値を含んでいることが多く,データをクレンジングして, 形式を整えて機械学習が適用可能な形に加工することに もコストがかかるとともに,そのための標準的な手続き やデータの形式について,コンセンサスが得られている ことは少ない. また,収集したデータには,企業活動に関する機微な 情報や,個人情報,プライバシーに関わる情報が含まれ ることが多いため,データの管理に関する保護,取扱い のセキュリティへの要求も高いものになることが多い. 例えば個人の病歴や遺伝子情報といった配慮が必要な情 報を,どのように,どこまで保護するべきかについては, さまざまな検討が行われているが,現状では,それらの 情報を取得した機関で,外部のネットワークに接続され ていないシステム上で,特別な許可を得た者が処理しな くてはいけない,など,機械学習,人工知能技術の適用 が難しくなっていることも多い. さらに,多くのサービスにおいては,収集者が異なる 複数のデータを組み合わせて利用することで価値が生ま れることも多いが,上記のような制約のために,そうし た異業種連携やデータ共有,サービスの水平展開の取組 みが難しいという課題もある. 特に,プライバシーや個人情報の扱いに対しては,デー タの一部を削除する,粒度を粗くする,などさまざまな 匿名化の方法が検討されてきた.2017 年 5 月 30 日に 改正された個人情報保護法でも,匿名加工情報という 概念が導入されている.後でも述べるように,例えば 本村らは,顧客や商品,サービスを確率的潜在意味解析 (Probabilistic Latent Semantic Analysis:PLSA)によ り情報量をできるだけ落とさずにクラスタリングするこ とで非パーソナル化,匿名性を確保し,データやモデル の流通を促進することが有効であることを示している. 2・2 データに関する権利・流通の仕組み 現在の人工知能において「データが石油である」と いう状況に伴い,データに関する権利についての検討も 重要になっている.サービス利用規約の中で比較的簡単 にユーザのデータ提供に関する許諾を得られるインター ネット上のサービスとは異なり,実社会のデータにおい ては,データに関する権利についてもより複雑な状況が 生じやすい.その結果,データの流通の仕組みも確立さ れてはいない. これに対して,例えば,IoT コンソーシアムと経済産 業省による「データの利用権限に関する契約ガイドライ ン」[IoT 17] では,「データは無体物であって民法上の 所有権の対象ではない.非パーソナルデータについてい えば,著作権や営業秘密といった知的財産として保護さ れるものを除いて,契約など私的自治の下で利活用に供 されるものである」として,契約を適正かつ公平に行う ための考え方をまとめている. 一方,テキストや絵画のような著作物として扱われる データについては,すでによく知られているように,著 作権法 47 条の 7 の「電子計算機による情報解析(多数 の著作物その他の大量の情報から,当該情報を構成する 言語,音,影像その他の要素に係る情報を抽出し,比較, 分類その他の統計的な解析を行うことをいう.以下この 条において同じ)を行うことを目的とする場合には,必 要と認められる限度において,記録媒体への記録または 翻案(これにより創作した二次的著作物の記録を含む) を行うことができる」に照らして,機械学習のためのデー タとして著作物を利用しても,著作権侵害にはあたらな いと考えられているが,このような考え方が社会に十分 に浸透し,受容されているとは言い難い. 2・3 データの少数性・不完全性への対処 実社会のサービスから得られるデータには,観測のコ 図 1 データとサービスの成長スパイラル 図 2 実世界に埋め込まれる人工知能
ストの高さや困難さから,大量には収集できないことも 多い.また,機械学習に必要となる情報がすべて得られ ないことも多い.特に,教師あり学習の正解ラベルにあ たる情報は,通常,観測が困難な変数であるため簡単に は得られない.そこで,少数のデータを生かす技術や, 教師なしの学習を利用する技術がこれまで以上に重要に なる. この問題に対して,機械学習の分野では,半教師あり 学習のような,必要な学習用の正解ラベルの量を削減す る手法が提案されている.少数のデータをより収集が容 易な大規模データと結び付けることも検討されている. 例えば,持丸らは,少数でも,きちんと計測された品質 の高いデータを「ディープデータ」と呼び,それをビッ グデータと連係させることで利活用することを目指して いる [AIST 15a]. 新しい課題の学習の際に,関連する課題の学習結 果 を 利 用 す る 転 移 学 習(transfer learning) の 技 術 [Kamishima 10]や,それをさらに発展させたマルチ タスク学習(multi-task learning)やメタ学習(meta learning)の技術も,特に,学習用データが得にくいロ ボットのための機械学習などを中心に研究が盛んになっ ている [Abbeel 17, NIPS 17a].
物理法則などに基づくシミュレーションと機械学習を 組み合わせることによって,不足するデータを補うこと も検討されているが,第一原理に基づくシミュレーショ ンは計算コストが高いという問題がある.さらに,実社 会のサービス,特に,人間に対するサービスにおいては, 精密なシミュレーション自体が困難である.そこで,近 似的な確率モデルによるシミュレーション=エミュレー ションの利用可能性も検討されている. さらに,近年,VAE(Variational Auto-Encoder)[Kingma 15] や GAN(Generative Adversarial Networks) [Goodfellow 14]などのような,データを模倣生成する タイプの深層ニューラルネットワーク(深層生成モデル) を用いて学習用データを生成する,補完するといったこ とも検討されている.このような,人工知能によって生 成,創作されたデータについては,第一義的には著作物 には当たらないと考えられているが,その場合の権利の 保護などについても検討が必要であろう. 2・4 人間との相互理解・性能保証 人工知能技術が実社会のサービスに導入される場合, 従来よりもさらに,人間との相互理解を高めることが必 要と考えられる.典型的には,自動運転や医療支援のよ うな応用では,人工知能による予測や判断の導出過程や 根拠が説明可能であり,人間にとって理解可能であるこ とがより一層求められると考えられている.このことは また,人間に理解可能,評価可能な形での,人工知能シ ステムの性能保証,安全性検証という課題とも関連して いる. こうした問題は,例えば推薦システムにおいて,推薦 の説得性を高めることを目的として議論されてきたが, 特に,深層学習のような複雑なモデルを用いる機械学習 において深刻で,その学習結果のブラックボックス性, 解釈困難性についてはこれまでにも多くの指摘がなされ てきた. このうち,学習結果の説明可能性や解釈可能性に関し ては,後述するように,産業技術総合研究所の人工知能 研究センターにおいても,2015 年の設立当初より「人 間と相互理解可能な次世代人工知能技術」を研究の一 つの柱として取り上げてきている.また,DARPA が 2016年から Explainable Artificial Intelligence(XAI) というプロジェクトを開始している [DARPA 15] ほか, 2017年の NIPS においても,Interpretable Machine
Learningをテーマとしたシンポジウムが企画される [NIPS 17b]など,具体的な研究が盛んになりつつある. 研究のアプローチとしては,観測データや現象のモ デリングを行う時点で,スパースモデリングやベイジア ンネットワークのような比較的解釈しやすいモデルを用 いる方法(例えば [本村 14, SpM 14])や,複雑なモデ ルでの学習結果を,より解釈しやすいモデルで近似する 方法(例えば [Hara 16])が研究されてきた.後者は, Hintonらのモデル蒸留とも関係が深い [Hinton 15].さ らに,近年では,深層ニューラルネットワークの学習結 果を直接的に説明文章に変換するような試みも現れてい る [Kim 17]. 一方,機械学習を含む人工知能システムの性能評価, 性能保証,安全性の保証などについても,近年研究が盛 んになっている.例えば,自動運転や医療などの分野で は,機械学習したシステムの出力の信頼性をどのように 評価するか,システムの安全性をどのように評価,担保 するか,という課題が議論されているが,これに対して, Bayesian Deep Learningのような,ベイズ的推論と深 層学習を統合することで対処しようとする試みなどが始 まっている [NIPS 16-17, Teh 17].
3.産業技術総合研究所人工知能研究センターの
取組み
産業技術総合研究所では,国内の公的研究機関として は最も早く 2015 年の 5 月に情報・人間工学領域のもと に人工知能研究センターを設置した [AIRC 15].設立当 初は 70 名程度の規模であったが,2017 年 10 月には総 勢で 400 名を超える規模となり,国内最大の研究開発拠 点の一つとして,次世代の人工知能技術の研究開発と社 会実装の好循環を生み出すことを目指して活動を行って いる. センターでは,前章に述べたような実社会ビッグデー タを活用した次世代の人工知能を「実世界に埋め込まれ る人工知能」(図 2)と呼んで,2015 年 5 月のセンター設立当初から,そのための基盤技術の確立と社会実装に 向けた研究開発やコミュニティ,エコシステムの構築を 実施してきた.また,その実現のために必要な人工知能 の社会的受容性を向上させるためには,現在のブラック ボックス性が高い人工知能ではなく「人間と相互理解で きる人工知能」が重要であるとの考え方のもと,多くの 競争的公的資金による研究開発や民間企業との共同研究 を進めてきた. 特に,NEDO 委託事業「次世代人工知能・ロボット 中核技術開発」については,その次世代人工知能分野の 研究開発の中心部分を研究開発拠点として受託し,多く の大学への再委託や企業からの出向者の参画のもと,人 間と相互理解できる次世代人工知能技術の研究開発を推 進してきている [AIST 17, NEDO 17]. プロジェクトでの研究開発は,人間との相互理解を可 能にする次世代の人工知能に向けた①大規模目的基礎研 究・先端技術研究開発,人工知能の中核的な要素技術を 容易に組み合わせて利用できるようにするための②次世 代人工知能フレームワーク研究・先進中核モジュール研 究開発,そして,人工知能システムを評価するための手 法やベンチマークデータの構築を行う③次世代人工知能 共通基盤技術研究開発,という三つの層から成っている (図 3).こうした研究開発を通じて,基礎研究と社会実 装の間の谷を埋めて,研究開発と社会実装の好循環を実 現していくことを目指している. このうち,データと最も関係が深い③については,人 工知能技術戦略会議によって策定された人工知能技術の 産業化ロードマップを踏まえつつ,性質の異なるデータ を扱う代表的な課題として,1)日常生活支援とサービ ス業の生産性向上の基盤となる「生活現象モデリング」, 2)スマートな空間の移動の基盤となる「地理空間情報 プラットフォーム構築」,3)製造業やサービス業へのロ ボット導入による生産性向上の基盤となる「AI を基盤 としたロボット作業」,そして,4)科学技術イノベーショ ンに寄与する「科学技術研究加速のためのテキスト統合」 の四つのプロジェクト内共有タスクを設定して,実際の ユースケースを想定した研究開発を進めている.以下本 章では,それぞれのタスクにおけるデータ構築などの取 組みと,それを支える計算基盤やデータ構築基盤の整備 について,前章で示したような実社会ビッグデータ利活 用の課題との関係を中心に紹介する. 3・1 生活現象モデリング このタスクでは,人間の日常生活に関する現象を観測 しデータ化して,そうした現象の背景にある生活現象を モデル化,その現象を近似できる計算モデルを構築し, 生活の中のリスク・コスト・ベネフィットの予測や,き めの細かい制御・介入を可能にすることを目指している [本村 17]. 生活現象は,相互作用や状況依存性の高い現象であり, そこにおいては,人依存性の高い行動のように,単一の 解ではなく,多様な価値・仮説提示が求められる.また, 生活現象の計算モデル化のために必要な明示的な記号や 構造の体系が確立されていない.さらに,人工知能の本 質的な困難性であるフレーム問題の影響も大きい.そこ で,生活現象を観測し,表現する記述子・構造を構築して, 生活現象を確率的なモデリング技術で計算モデル化する とともに,計算モデルを適用しシミュレーションするこ とで,介入・効果評価を実施するというアプローチ,さ らに共通のフレームや評価関数を共有するためのコミュ ニティ参加型アプローチでの研究開発を進めている. 具体的には,人手不足や,リスク・コスト削減が必要 であるなど,人工知能技術に対するニーズが顕在化して いるサービス現場を主たる対象として,対話システム(イ ンタラクティブディジタルサイネージや次世代自動販売 機など)の開発に寄与する行動観測センサと RF-ID カー 図 3 研究開発と社会実装の好循環の実現
ドを併用した行動観測モジュールや収集したデータから 予測を行う確率モデリングモジュールの開発と応用を ユーザ参加型の体制の中で行った.そこでは,PLSA を 用いてユーザや展示・商品,状況記述などをクラスタリ ングした後に,ベイジアンネットワークでそれらの間の 関係をモデル化することにより,データから,人にとっ て可読性の高いグラフィカルモデルとして現象のモデル を得る.それによって,例えば,どのようなタイプの顧 客に,どのような商品を,どのような状況で推薦すると, どれほどの効果が得られるか,といった予測をし,さら に人が理解することも可能になる(図 4).今後,これ らを組み合わせて,イベントのマネジメントの支援シス テム,地域コミュニティの構築と運用の支援システムな どの AI 応用システムの開発効率が向上することを示し ていく. また,介護サービスの現場においては,介護プロセス を観測・推定するモジュール,健康状態を観測・推定す るモジュール,サービス利用者の支援システム,サービ ス提供側のスタッフ支援システムなどの開発,現場への 導入がすでに行われ,それらを用いた介護業務の現場知 識抽出とサービス改善効果の評価を目指している.同様 の試みは,保育園における保育者の支援についても実施 している.そこでは,子供の行動と感情の関係を捉える ためのデータを収集し,モデル化することで,子供の状 態の把握を助けて,保育業務を支援するための研究開発 を実施している. これらに共通の要素技術として,例えば,人間の日常 生活の認識の研究開発も進めている.バランス良く選ば れた 100 種類の日常動作のそれぞれについて,インター ネット上の動画 1 000 本を収集したデータセットを構築 するとともに,それを用いて,深層学習によって短い動 画中の日常動作を認識する機能モジュールを開発してい る. さらに,データ収集基盤としては,実社会の生活の中 でのさまざまな現象を捉えるための観測手法の研究開発 を行うために,産業技術総合研究所内に模擬環境である リビングラボを構築するとともに,そこで得られた観測 手法を,連携している病院や介護施設,個人住宅などに 実装し,データの収集を開始している.また,人間と人間, 人間とロボットのインタラクションデータを大量に収集 するための VR 環境の構築も進めている. 3・2 地理空間情報プラットフォーム構築 地上観測衛星,航空機,ドローン,自動運転車など により,大量の三次元の地理空間情報が得られるように なっている.このタスクでは,そうした,さまざまなス ケールでの大量の地理空間情報をシームレスにマネジメ ントするとともに,そうした地理空間情報から,物体認 識技術や変化検知・認識技術などによって人間にとって 意味のある情報を抽出して,地理空間情報とともに検索・ 利用・ダイナミックな更新を可能にする地理空間情報プ ラットフォームの実現を目指している. これまでに,衛星画像データを整備・公開 [ABCD 17, MUSIC 17]するとともに,深層学習を適用して地上の 物体や変化を検出するモジュールを構築している.また, 地理空間情報のユースケースとして,自律移動ロボット や自動運転車のための 3D 地図の構築,意味的情報の付 与と利用に関する研究開発や,地理空間情報と混雑した 環境で人流を計測するシステムと組み合わせて,人の流 れの誘導や,災害時の避難計画策定を支援するための研 究開発も実施している. 自動運転技術に関しては,九州工業大学と連携しつつ, 機械学習に基づくデータ駆動型人工知能と,自動運転用 のオントロジーを用いた論理知識型人工知能の融合によ る解釈可能な自動運転システムに関する研究開発に取り 組んでいる [橋本 18]. また,基盤となるデータプラットフォームの研究の 一環として,移動体などを含むオブジェクトに関する データの共通フォーマットの整備にも参画しており,地 理空間情報の国際標準化団体である Open Geospatial Consortium(OGC)の標準化委員会において,移動体 のデータフォーマットとデータアクセスメソッドに関す る標準化に貢献した [OGC 17]. 3・3 AI を基盤としたロボット作業 ロボットは実世界に埋め込まれた人工知能を象徴す るものであるが,近年,製造業やサービス産業の生産性 を向上させるために,組立てや調理などの複雑な作業を 人から学び,人と協調して実行するロボットの実現が期 図 4 人と相互理解できる AI によるサービス支援 図 5 生活現象を扱うためのフレーム
待されている.このタスクでは,そうした産業用,およ び日常生活支援用の作業ロボットのための人工知能基盤 として,幅広い物体のクラスや機能,姿勢を画像や三次 元形状データから認識可能にする認識クラウドエンジン [Akizuki 16, Kanezaki 17],初期状態とゴール状態から 自動的に動作計画を生成する行動計画・制御モジュール, 人間による教示から学ぶ模倣学習モジュールなどの研究 開発,およびそれらのモジュールのための学習用データ の収集・構築を進めている.それらの技術を日用品や組 立部品のピッキング,組立作業,柔軟物の操作,食品の 操作などに適用して有効性を示すことを目指している. 特に,2・3 節でも述べたように,実ロボットを用いた データの収集や試行錯誤には量的な限界があるため,い かに少数の経験やデータからロボットの複雑な行動を学 習,習得させるかが大きな課題である.そのために,例 えば,深層ニューラルネットワークを用いて,人間によ る少数の操作履歴から柔軟性の高い行動生成を可能にす る模倣学習手法 [Yang 17] や,人間の作業を観測し,デー タベースとして整備し,それらを用いてもち替えを含む ような複雑な組立作業の計画を自動的に生成する手法 [Wan 16],深層学習と進化計算を組み合わせて,柔軟物 の操作手順を自動生成する手法 [Tanaka 18] などの研究 開発を行っている. この分野では,深層学習と強化学習を組み合わせた 深層強化学習の研究も盛んに行われているが,まだま だ学習効率が十分ではないという問題がある.例えば, Abbeel らは,転移学習の一種であるメタ学習を導入す ることで,こうした問題に対処することを探求している [Abbeel 17].DeepMind の AlphaGo Zero のように,深 層強化学習のみで高いパフォーマンスを達成している例 もあるが [Silver 17],人工的なゲームとは異なり,実ロ ボットの学習においてはロボットや環境のモデルの正確 さに限界があるため,不正確なモデルと実験をうまく組 み合わせていく必要がある.同じく DeepMind が提案し ているイメージを用いたプランニングや [Weber 17],模 倣学習と深層強化学習を上手に組み合わせていくことな ども,実社会データから学習する人工知能にとって,今 後の興味深い研究方向の一つだろう. 3・4 科学技術研究加速のためのテキスト統合 このタスクでは,科学技術に関する膨大な文献情報 データを解析・集約・可視化・モデル化し,そうした文 献情報から知識を抽出し,科学技術の未来予測をするこ とによって,科学技術の研究開発の支援を行うことを目 指している.具体的には,酵素反応や G タンパク質共役 型受容体のシグナル伝達などの重要な生命科学現象の解 明を目指す研究や,科学技術文献を解析,可視化し,俯 瞰することを可能にする(学術俯瞰システム)ことによっ て,科学技術政策立案などを支援する研究に適用して有 効性を示すことを狙っている. Ross King らは,ロボットサイエンティストとして, 文献情報と実験用ロボットなどから得られる実験データ を組み合わせて,科学技術の研究開発全体を自律的に実 施する人工知能の研究開発を提唱してきているが [King 05],人工知能研究センターにおいても,産業技術総合 研究所の創薬分子プロファイリング研究センターで開発 したバイオ実験を行うヒト型汎用ロボット「まほろ」な どの実験用ロボットと AI を組み合わせて,科学技術研 究開発を支援する人工知能の研究開発を開始している. また,テキストに限らず多様なデータを活用する取組 みとしては,JST CREST のプロジェクト「人工知能を 用いた統合的ながん医療システムの開発」に参画し,国 立がん研究センターや Preferred Networks らと連携し て人工知能技術を活用したがん治療法の研究開発に取り 組んでいる.さらに,関連する取組みとして,NEDO 委託事業の中で,ATR や電気通信大学,東京大学など と連携しつつ,最新の脳科学で蓄積されている脳活動計 測データを基盤とする脳データ駆動型の人工知能の研究 開発を進めている. 3・5 AI 向け計算基盤・データ基盤の整備 深層学習を始めとする機械学習では,大量の学習用 データからデータのモデルを学習するために,膨大な計 算資源を必要とする.こうした需要に応えるために 100 PFLOPS超クラスの計算能力をもつ AI クラウドが現実 のものとなりつつある.そこで,こうした新しい計算イ ンフラを実際に構築・運用するとともに,AI ワークロー ドを支援するモジュールベースのアプリ配備・実行機構, データフローに着目したビッグデータ処理ミドルウェ ア,人工知能学習用データのセキュアで効率の良いマネ ジメントのためのデータプラットフォームの開発を行う ことで,ビッグデータを活用した AI を誰もが簡単に研 究開発できるようにし,AI 応用の開発効率と生産性を 向上させることを目指している [小川 18]. 2015年度以来,NEDO 委託事業や,補正予算などの 事業を通じて,計算基盤の整備を進めてきた.2017 年 6 月には,400 基の最新 GPGPU を備えた産業技術総合研 究所 AI クラウド(AIST AI Cloud:AAIC)の運用を開 始し,省エネルギー高性能計算機のベンチマークである Green 500のリストで 3 位を獲得した [AAIC 17].さら に,2018 年度には,東京大学とともに,東京大学の柏キャ ンパスに人工知能橋渡しクラウド(AI Bridging Cloud Infrastructure:ABCI)を構築し,運用を開始する予定 である. 計算基盤と同様に重要なものは学習・評価用のデータ である.特に,すでに述べたように,実世界のデータは, 大量に収集するためにはコストがかかり,また,企業活 動であるサービスと関わるため,公開,共有が難しい. そこで,模擬工場や模擬コンビニなど,学習・実証用の データを収集するための模擬環境の整備も進めている.
模擬環境のほかにも,データ収集のための基盤として, 革新的なセンシング技術や人間計測技術,バイオ実験ロ ボットなどの研究開発も進めていく.これらの計算基盤 やデータ構築基盤は,産業技術総合研究所内での利用に とどまらず,共同研究機関や,民間企業にも利用可能に していく予定である. これらの環境を活用して,機械学習技術を多用なデー タに対して適用し,学習済モデルを構築し,転移学習な どを通じた再利用も含めた利活用を進め,人工知能の研 究開発を加速していきたい.その際に,実社会のサービ スから得られるデータを利活用するためには,データの 安全な取扱いを担保する仕組みが必要である.例えば, 経済産業省では,IoT 技術の研究開発などの公的研究開 発プロジェクトの中で収集されるデータを広く活用でき るようにすることを目指して,委託研究開発における データマネジメントについての検討を進めている [METI 16].また,産業技術総合研究所の情報・人間工学領域で は,ABCI などの計算基盤,データ基盤の活用を促進す るために,データの安全な取扱いに関するガイドライン の検討を進めている.また,今後,学習済モデルの知財 としての取扱いなども検討していく必要があるだろう.
4.人工知能技術コンソーシアムの取組み
実世界に埋め込まれる人工知能の研究開発において は,その成果として単に技術が生まれるだけでなく,そ の技術を活用した新たな AI 応用システム開発手法や社 会実装の手法,そして,それらの技術,手法,データを 共有するコミュニティづくりも Cyber-physical system の社会実装,ディジタルトランスフォーメーションの進 展のために重要となる.別の言葉で言えば,技術の開発 者だけではなく,技術の利用者も系の要素として組み込 んだ全体系を対象として,社会システム,エコシステム の知能化を実現していく必要がある. こうした,共同で行動を行うコミュニティは実践コ ミュニティ(Community of practice)と呼ばれる.こ の実践コミュニティの形成や運用を人工知能技術によっ て支援し,誰もが自由に出入りして参加したりできるよ うな「場」ができることによって,柔軟にサービスシス テムが共創的に価値を創出できるようになることも期待 できる.こうした価値共創を持続的に再現,発展できる 仕組みによって社会や暮らしを今よりも良いものにする という方向性を強く打ち出すことが,人工知能技術によ り新たな産業や社会構造を変革するための社会実装のた めには必要である. こうした,社会システム,エコシステムに必要とされ る利用者コミュニティとして,産業技術総合研究所内に 人工知能技術コンソーシアムを設立している.産業技術 総合研究所コンソーシアムという制度のもと 2015 年か ら活動を開始したコンソーシアムは,2017 年度には参加 企業数 150 社の規模に成長し,関西支部,九州支部,中 国支部も活動を開始している.そこでは,次世代人工知 能技術を活用し,主に生活現象フレームワークを実社会 の中で実践する利用者コミュニティ,シーズとニーズを マッチングする場として,各種のワーキンググループを 中心とした活動を自立的,精力的に展開している(図 6). コンソーシアムのワーキンググループの一つである データプラットフォーム WG では,多機関が連携して データを活用するためのデータ共有の技術と仕組みづく りを提案し実証プロジェクトを開始している.また,リ ビングラボ WG では,ショールームや博物館のような フィールドにおいて,行動観測可能なデバイスを埋め込 み,データを活用する実証プロジェクトを開始した.ユー スケース WG ではスマート社会における人工知能技術活 用のシナリオづくりを,現実の自治体や住民を想定して プランニングするなど,各 WG は実践的な活動を自立的 に進めて多機関連携を着実に進める場となっている.5.お わ り に
本稿では,社会に新たに出現しつつある実社会ビッグ データの利活用という観点を中心に,そうしたデータを 活用した「実世界に埋め込まれる人工知能」の研究開発 の課題を整理するとともに,産業技術総合研究所の人工 知能研究センターおよび人工知能技術コンソーシアムの 取組みを中心に,関連する研究開発を紹介した.紙数の 制約もあり,一部の成果の概説にとどまっているが,幅 広い種類の実社会データに対して,さまざまな課題に取 り組んでいることを感じていただければと思う. IT 技術によって産業が大きく変化したのと同様に, IT技術に,よりきめの細かい,効率的なサービスを可 能にする知能を加えた人工知能技術が,今後あらゆる産 業の基盤となっていくことが予想される.しかしながら, そうした新しい技術を社会実装していくことは簡単では なく,特に実社会でのサービスに由来するデータの収集 や取扱い,そしてそれを用いた学習には,これまで述べ てきたようにいろいろな課題がある. そうした課題を解決するためには,これまでの人工知 図 6 人工知能技術コンソーシアム能のコア技術の個別的な研究を超えて,さまざまなデー タやサービスのフィールドをもつステークホルダの間の 連携を含んだ人工知能技術の研究開発が必要である.人 工知能研究センターや人工知能技術コンソーシアムの取 組みを通じて,人工知能技術の研究と社会での活用の好 循環を実現していきたい. 謝 辞 この成果の一部は、国立研究開発法人新エネルギー・ 産業技術総合開発機構(NEDO)の委託業務の結果得ら れたものです。
◇ 参 考 文 献 ◇
[AAIC 17] 産業技術総合研究所プレス発表,http://www.aist. go.jp/aist_j/press_release/pr2017/pr20170619/ pr20170619.html(2017)[Abbeel 17] Abbeel, P.: Deep learning for robotics, NIPS 2017, invited talk(2017)
[ABCD 17] AIST building change detection dataset, https:// github.com/faiton713/ABCDdataset(2017) [AIRC 15] 産業技術総合研究所人工知能研究センターホームペー ジ,http://www.airc.aist.go.jp/(2015) [AIRC 17] 次世代人工知能・ロボット中核技術開発/次世代人工 知能分野中間成果発表会,http://www.airc.aist.go.jp/ info_details/NEDOsymposium170329.html(2017) [AIST 15a] 産業技術総合研究所人間情報研究部門ホームページ, https://unit.aist.go.jp/hiri/intro.html(2015) [Akizuki 16] Akizuki, S., Iizuka, M. and Hashimoto, M.:
“Affordance”-focused features for generic object recognition,
ECCV Workshop(2016)
[DARPA 15] DARPA explainable artificial intelligence, https://www.darpa.mil/program/explainable-artificial-intelligence(2015)
[Goodfellow 14] Goodfellow, I., et al.: Generative adversarial networks, arXiv:1406.2661(2014)
[Hara 16] Hara, S. and Hayashi, K.: Making tree ensembles interpretable: a Bayesian model selection approach, arXiv: 1606.09066(2016)
[橋本 18] 橋本康平,石田裕太郎,市瀬龍太郎,我妻広明,田向 権: 論理知識型 AI に基づく自動運転のための危険予測システムの構 築と評価,システム制御情報学会論文誌,in press.
[Hinton 15] Hingon, G. E., et al.: Distilling the knowledge in a neural network, arXiv:1503.02531(2015)
[IoT 17] データの利用権限に関する契約ガイドライン Ver. 1.0, h t t p : / / w w w . m e t i . g o . j p / p r e s s / 2 0 1 7 / 0 5 / 20170530003/20170530003-1.pdf(2017)
[Kanezaki 17] Kanezaki, A., Matsushita, Y. and Nishida, Y.: RotationNet: Joint learning of object classification and viewpoint estimation using unaligned 3D object dataset, arXiv:1603.06208(2016)
[神嶌 10] 神嶌敏弘:転移学習,人工知能学会誌,Vol. 25, No. 4, pp. 572-580(2010)
[Kim 17] Kim, J., et al.: Show, attend, control, and justify: interpretable learning for self-driving cars, NIPS 2017
Workshop on Interpretable Machine Learning(2017) [King 05] King R. D., et al.: The robot scientist project. In:
Hoffmann A., Motoda H., Scheffer T.(eds.),Discovery Science. DS 2005. Lecture Notes in Computer Science, Vol. 3735, Springer, Berlin, Heidelberg(2005)
[Kingma 13] Kingma, D. P. and Welling, M.: Auto-encoding variational Bayes, arXiv:1312.6114(2013)
[METI 16] 委託研究開発におけるデータマネジメントについて (案),http://www.meti.go.jp/policy/economy/gijutsu_ kakushin/innovation_policy/ipmanagementguideline_
appendix_draft.pdf(2016)
[MUSIC 17] MUltiband Satellite Imagery for object Classification Dataset, https://github.com/gistairc/ MUSIC4P3(2017) [本村 14] 本村陽一:サービス工学におけるビッグデータの活用技 術,日本ロボット学会誌,Vol. 32, No. 10, pp. 878-880(2014) [本村 17] 本村陽一 ほか:次世代人工知能技術研究開発における 生活現象モデリング,人工知能学会第 31 回全国大会予稿集, 2F4-NFC-03b-5(2017) [NEDO 17] NEDO次世代人工知能・ロボット中核技術ハンド ブック,http://www.nedo.go.jp/library/pamphlets/ RBAI_hbook201709.html(2017)
[NIPS 16-17] NIPS Workshop on Bayesian Deep Learning, http://bayesiandeeplearning.org/
[NIPS 17a] NIPS 2017 Workshop on Meta Learning, http:// metalearning.ml/(2017)
[NIPS 17b] NIPS 2017 Symposium, Interpretable Machine
Learning, http://interpretable.ml/(2017) [小川 18] 小川宏高:人工知能・ビッグデータ処理向けクラウド基 盤の構築─産総研 AI クラウドと AI 橋渡しクラウド,人工知能, Vol. 33, No. 1, pp. 8-14(2018) [OGC 17] 産業技術総合研究所プレス発表,http://www.aist. go.jp/aist_j/press_release/pr2017/pr20170313/ pr20170313.html(2017)
[Silver 17] Silver, D., et al.: Mastering chess and shogi by self-play with a general reinforcement learning algorithm, arXive: 1712.01815(2017)
[SpM 14] スパースモデリングの深化と高次元データ駆動科学の創 成,http://sparse-modeling.jp/(2014)
[Tanaka 18] Tanaka, D., Arnold, S. and Yamazaki, K.: EMD Net: an encode-manipulate-decode network for cloth manipulation,
IEEE Robotics and Automation Lett., accepted.(2018) [Teh 17] Teh, Y. W.: On Bayesian deep learning and deep
bayesian learning, NIPS 2017, invited talk(2017)
[Wan 16] Wan, W. and Harada, K.: Achieving high success rate in dual-arm handover using large number of candidate grasps, handover heuristics, and hierarchical search, Advanced
Robotics, Vol. 30, pp. 1111-1125(2016)
[Weber 17] Weber, T., et al.: Imagination-augmented agents for deep reinforcement learning, NIPS 2017(2017)
[Yang 17] Yang, P.-C., et al.: Repeatable folding task by humanoid robot worker using deep learning, IEEE Robotics and
Automation Lett., Vol. 2, No. 2, pp. 397-403(2017)
2017年 12 月 28 日 受理