実社会ビッグデータを活用する次世代人工知能技術

(1)

1．は　じ　め　に

人工知能技術は，これまで主に，インターネットサービスで収集される大規模なデータや知識を利活用することで発展してきた．しかし，今後は，各種の IoT デバイスやロボット技術とも連携して，実社会でのサービスや生活行動を通じて収集されるビッグデータ（実社会ビッグデータ）を活用した人工知能技術が，実社会でサービスの高度化や新たな価値創造を実現していくことが期待されている．しかしながら，実社会サービスを通じて収集されるデータは非常に多様であり，その利活用には，これまでの機械学習のための静的なベンチマークデータなどとは異なり，プライバシーやセキュリティの問題，データの権利の問題，データの欠乏や欠損の問題，などの多くの課題が存在することが指摘されている．本稿では，社会に新たに出現しつつある実社会ビッグデータの利活用という観点を中心に，そうしたデータを活用するための次世代人工知能技術について，産業技術総合研究所の人工知能研究センターおよび人工知能技術コンソーシアムの取組みを中心として，現状と課題を解説する．

2．実社会ビッグデータを活用する人工知能と

その課題

現在の人工知能技術の興隆の要因は，インターネット上に大量のデータが蓄積され，機械学習技術によってそれらの大量のデータからきめの細かい知識を獲得することが可能になったことにある．すなわち，深層学習を始めとした統計的な機械学習手法を基盤とする人工知能システムの性能向上のためには，良質の学習用データが必要である．これまで，大規模なデータの集積には，特に，情報検索や e-Commerce，CRM，ソーシャルネットワークサービスなどのインターネット上のサービスが大きな役割を果たしてきた．そうしたインターネットサービスを提供する企業が，収集した大量のデータに機械学習技術を適用し，自らのサービスをよりきめ細かい個人依存，状況依存のものへと改善して収益を上げ，その収益を，機械学習を中心とした人工知能技術に再投資し，企業買収なども通じて研究開発人材を囲い込んで技術開発を進める，というアプリケーションとデータをともに成長させるスパイラル（図 1）を回すことによって，人工知能技術は急速に発展してきたと考えられる．これに対して，今後は，機械学習や推論，プラニングなどの人工知能のコア技術と，IoT やロボットの技術を結び付けていくことにより，インターネット上のサービスのみならず，自動運転，介護，医療，ヘルスケア，ものづくり，研究開発，などの実社会における多様な活動・サービスについても，同様のスパイラルを回すことで，機械学習，人工知能技術によってサービスの質や効率を改善し，パーソナル化，コミュニティ化，状況依存化されたきめ細かいものにしていくことが期待されている．そのために，どのようなデータを誰が収集し，どのようにサービスの価値向上に生かすのか，そのためにどのような技術が必要になるのか，についての検討や試みが，さまざまな分野で行われ始めているが，そこにおいては，情報技術以外の分野と連携する必要があることや，分野ごとの個別性も大きいことなどに由来する困難がある．以下この節では，データとの関係を中心に，その現状と課題を概観する．

実社会ビッグデータを活用する

次世代人工知能技術

Next Generation AI Technology Based on Big Data in the Real-World

麻生　英樹

産業技術総合研究所人工知能研究センター

Hideki Asoh Artiﬁcial Intelligence Research Center, AIST.

[email protected], http://www.airc.aist.go.jp/

本村　陽一

（同上）

Yoichi Motomura _{[email protected], http://staff.aist.go.jp/y.motomura/}

Keywords:

big data, real-world, cyber-physical system, digital transformation, open inovation. 「AI とデータ─データに基づく意思決定と社会イノベーション創出─」

(2)

2･1 実社会の現象の観測とデータの収集・管理・保護サービス上でのユーザの行動に関するデータ（主にはマウスのクリックやテキスト入力など）が，ほとんどコストなしに自動で記録され得るインターネット上のサービスとは異なり，多くの実社会でのサービスにおいては，その過程やそこで起こる現象を，センサや人手による入力を通じて観測するところから始める必要がある．これらの観測コストはクリックの記録に比べて高く，収集し得る情報にも限りがあるため，何のために，どのようなセンサや入力を用いて，何を観測するべきか，が最初の課題になる．多くの場合には必要なセンサやセンシング手法の開発にまで立ち戻る必要も生じる．そうして観測したデータは，雑音，不要な情報，欠損値を含んでいることが多く，データをクレンジングして，形式を整えて機械学習が適用可能な形に加工することにもコストがかかるとともに，そのための標準的な手続きやデータの形式について，コンセンサスが得られていることは少ない．また，収集したデータには，企業活動に関する機微な情報や，個人情報，プライバシーに関わる情報が含まれることが多いため，データの管理に関する保護，取扱いのセキュリティへの要求も高いものになることが多い．例えば個人の病歴や遺伝子情報といった配慮が必要な情報を，どのように，どこまで保護するべきかについては，さまざまな検討が行われているが，現状では，それらの情報を取得した機関で，外部のネットワークに接続されていないシステム上で，特別な許可を得た者が処理しなくてはいけない，など，機械学習，人工知能技術の適用が難しくなっていることも多い．さらに，多くのサービスにおいては，収集者が異なる複数のデータを組み合わせて利用することで価値が生まれることも多いが，上記のような制約のために，そうした異業種連携やデータ共有，サービスの水平展開の取組みが難しいという課題もある．特に，プライバシーや個人情報の扱いに対しては，データの一部を削除する，粒度を粗くする，などさまざまな匿名化の方法が検討されてきた．2017 年 5 月 30 日に改正された個人情報保護法でも，匿名加工情報という概念が導入されている．後でも述べるように，例えば本村らは，顧客や商品，サービスを確率的潜在意味解析（Probabilistic Latent Semantic Analysis：PLSA）により情報量をできるだけ落とさずにクラスタリングすることで非パーソナル化，匿名性を確保し，データやモデルの流通を促進することが有効であることを示している． 2･2 データに関する権利・流通の仕組み現在の人工知能において「データが石油である」という状況に伴い，データに関する権利についての検討も重要になっている．サービス利用規約の中で比較的簡単にユーザのデータ提供に関する許諾を得られるインターネット上のサービスとは異なり，実社会のデータにおいては，データに関する権利についてもより複雑な状況が生じやすい．その結果，データの流通の仕組みも確立されてはいない．これに対して，例えば，IoT コンソーシアムと経済産業省による「データの利用権限に関する契約ガイドライン」[IoT 17] では，「データは無体物であって民法上の所有権の対象ではない．非パーソナルデータについていえば，著作権や営業秘密といった知的財産として保護されるものを除いて，契約など私的自治の下で利活用に供されるものである」として，契約を適正かつ公平に行うための考え方をまとめている．一方，テキストや絵画のような著作物として扱われるデータについては，すでによく知られているように，著作権法 47 条の 7 の「電子計算機による情報解析（多数の著作物その他の大量の情報から，当該情報を構成する言語，音，影像その他の要素に係る情報を抽出し，比較，分類その他の統計的な解析を行うことをいう．以下この条において同じ）を行うことを目的とする場合には，必要と認められる限度において，記録媒体への記録または翻案（これにより創作した二次的著作物の記録を含む）を行うことができる」に照らして，機械学習のためのデータとして著作物を利用しても，著作権侵害にはあたらないと考えられているが，このような考え方が社会に十分に浸透し，受容されているとは言い難い． 2･3 データの少数性・不完全性への対処実社会のサービスから得られるデータには，観測のコ図 1　データとサービスの成長スパイラル図 2　実世界に埋め込まれる人工知能

(3)

ストの高さや困難さから，大量には収集できないことも多い．また，機械学習に必要となる情報がすべて得られないことも多い．特に，教師あり学習の正解ラベルにあたる情報は，通常，観測が困難な変数であるため簡単には得られない．そこで，少数のデータを生かす技術や，教師なしの学習を利用する技術がこれまで以上に重要になる．この問題に対して，機械学習の分野では，半教師あり学習のような，必要な学習用の正解ラベルの量を削減する手法が提案されている．少数のデータをより収集が容易な大規模データと結び付けることも検討されている．例えば，持丸らは，少数でも，きちんと計測された品質の高いデータを「ディープデータ」と呼び，それをビッグデータと連係させることで利活用することを目指している [AIST 15a]．新しい課題の学習の際に，関連する課題の学習結果を利用する転移学習（transfer learning）の技術 [Kamishima 10]や，それをさらに発展させたマルチタスク学習（multi-task learning）やメタ学習（meta learning）の技術も，特に，学習用データが得にくいロボットのための機械学習などを中心に研究が盛んになっている [Abbeel 17, NIPS 17a]．

物理法則などに基づくシミュレーションと機械学習を組み合わせることによって，不足するデータを補うことも検討されているが，第一原理に基づくシミュレーションは計算コストが高いという問題がある．さらに，実社会のサービス，特に，人間に対するサービスにおいては，精密なシミュレーション自体が困難である．そこで，近似的な確率モデルによるシミュレーション＝エミュレーションの利用可能性も検討されている．さらに，近年，VAE（Variational Auto-Encoder）[Kingma 15] や GAN（Generative Adversarial Networks） [Goodfellow 14]などのような，データを模倣生成するタイプの深層ニューラルネットワーク（深層生成モデル）を用いて学習用データを生成する，補完するといったことも検討されている．このような，人工知能によって生成，創作されたデータについては，第一義的には著作物には当たらないと考えられているが，その場合の権利の保護などについても検討が必要であろう． 2･4 人間との相互理解・性能保証人工知能技術が実社会のサービスに導入される場合，従来よりもさらに，人間との相互理解を高めることが必要と考えられる．典型的には，自動運転や医療支援のような応用では，人工知能による予測や判断の導出過程や根拠が説明可能であり，人間にとって理解可能であることがより一層求められると考えられている．このことはまた，人間に理解可能，評価可能な形での，人工知能システムの性能保証，安全性検証という課題とも関連している．こうした問題は，例えば推薦システムにおいて，推薦の説得性を高めることを目的として議論されてきたが，特に，深層学習のような複雑なモデルを用いる機械学習において深刻で，その学習結果のブラックボックス性，解釈困難性についてはこれまでにも多くの指摘がなされてきた．このうち，学習結果の説明可能性や解釈可能性に関しては，後述するように，産業技術総合研究所の人工知能研究センターにおいても，2015 年の設立当初より「人間と相互理解可能な次世代人工知能技術」を研究の一つの柱として取り上げてきている．また，DARPA が 2016年から Explainable Artificial Intelligence（XAI）というプロジェクトを開始している [DARPA 15] ほか， 2017年の NIPS においても，Interpretable Machine

Learningをテーマとしたシンポジウムが企画される [NIPS 17b]など，具体的な研究が盛んになりつつある．研究のアプローチとしては，観測データや現象のモデリングを行う時点で，スパースモデリングやベイジアンネットワークのような比較的解釈しやすいモデルを用いる方法（例えば [本村 14, SpM 14]）や，複雑なモデルでの学習結果を，より解釈しやすいモデルで近似する方法（例えば [Hara 16]）が研究されてきた．後者は， Hintonらのモデル蒸留とも関係が深い [Hinton 15]．さらに，近年では，深層ニューラルネットワークの学習結果を直接的に説明文章に変換するような試みも現れている [Kim 17]．一方，機械学習を含む人工知能システムの性能評価，性能保証，安全性の保証などについても，近年研究が盛んになっている．例えば，自動運転や医療などの分野では，機械学習したシステムの出力の信頼性をどのように評価するか，システムの安全性をどのように評価，担保するか，という課題が議論されているが，これに対して， Bayesian Deep Learningのような，ベイズ的推論と深層学習を統合することで対処しようとする試みなどが始まっている [NIPS 16-17, Teh 17]．

3．産業技術総合研究所人工知能研究センターの

取組み

産業技術総合研究所では，国内の公的研究機関としては最も早く 2015 年の 5 月に情報・人間工学領域のもとに人工知能研究センターを設置した [AIRC 15]．設立当初は 70 名程度の規模であったが，2017 年 10 月には総勢で 400 名を超える規模となり，国内最大の研究開発拠点の一つとして，次世代の人工知能技術の研究開発と社会実装の好循環を生み出すことを目指して活動を行っている．センターでは，前章に述べたような実社会ビッグデータを活用した次世代の人工知能を「実世界に埋め込まれる人工知能」（図 2）と呼んで，2015 年 5 月のセンター

(4)

設立当初から，そのための基盤技術の確立と社会実装に向けた研究開発やコミュニティ，エコシステムの構築を実施してきた．また，その実現のために必要な人工知能の社会的受容性を向上させるためには，現在のブラックボックス性が高い人工知能ではなく「人間と相互理解できる人工知能」が重要であるとの考え方のもと，多くの競争的公的資金による研究開発や民間企業との共同研究を進めてきた．特に，NEDO 委託事業「次世代人工知能・ロボット中核技術開発」については，その次世代人工知能分野の研究開発の中心部分を研究開発拠点として受託し，多くの大学への再委託や企業からの出向者の参画のもと，人間と相互理解できる次世代人工知能技術の研究開発を推進してきている [AIST 17, NEDO 17]．プロジェクトでの研究開発は，人間との相互理解を可能にする次世代の人工知能に向けた①大規模目的基礎研究・先端技術研究開発，人工知能の中核的な要素技術を容易に組み合わせて利用できるようにするための②次世代人工知能フレームワーク研究・先進中核モジュール研究開発，そして，人工知能システムを評価するための手法やベンチマークデータの構築を行う③次世代人工知能共通基盤技術研究開発，という三つの層から成っている（図 3）．こうした研究開発を通じて，基礎研究と社会実装の間の谷を埋めて，研究開発と社会実装の好循環を実現していくことを目指している．このうち，データと最も関係が深い③については，人工知能技術戦略会議によって策定された人工知能技術の産業化ロードマップを踏まえつつ，性質の異なるデータを扱う代表的な課題として，1）日常生活支援とサービス業の生産性向上の基盤となる「生活現象モデリング」， 2）スマートな空間の移動の基盤となる「地理空間情報プラットフォーム構築」，3）製造業やサービス業へのロボット導入による生産性向上の基盤となる「AI を基盤としたロボット作業」，そして，4）科学技術イノベーションに寄与する「科学技術研究加速のためのテキスト統合」の四つのプロジェクト内共有タスクを設定して，実際のユースケースを想定した研究開発を進めている．以下本章では，それぞれのタスクにおけるデータ構築などの取組みと，それを支える計算基盤やデータ構築基盤の整備について，前章で示したような実社会ビッグデータ利活用の課題との関係を中心に紹介する． 3･1 生活現象モデリングこのタスクでは，人間の日常生活に関する現象を観測しデータ化して，そうした現象の背景にある生活現象をモデル化，その現象を近似できる計算モデルを構築し，生活の中のリスク・コスト・ベネフィットの予測や，きめの細かい制御・介入を可能にすることを目指している [本村 17]．生活現象は，相互作用や状況依存性の高い現象であり，そこにおいては，人依存性の高い行動のように，単一の解ではなく，多様な価値・仮説提示が求められる．また，生活現象の計算モデル化のために必要な明示的な記号や構造の体系が確立されていない．さらに，人工知能の本質的な困難性であるフレーム問題の影響も大きい．そこで，生活現象を観測し，表現する記述子・構造を構築して，生活現象を確率的なモデリング技術で計算モデル化するとともに，計算モデルを適用しシミュレーションすることで，介入・効果評価を実施するというアプローチ，さらに共通のフレームや評価関数を共有するためのコミュニティ参加型アプローチでの研究開発を進めている．具体的には，人手不足や，リスク・コスト削減が必要であるなど，人工知能技術に対するニーズが顕在化しているサービス現場を主たる対象として，対話システム（インタラクティブディジタルサイネージや次世代自動販売機など）の開発に寄与する行動観測センサと RF-ID カー図 3　研究開発と社会実装の好循環の実現

(5)

ドを併用した行動観測モジュールや収集したデータから予測を行う確率モデリングモジュールの開発と応用をユーザ参加型の体制の中で行った．そこでは，PLSA を用いてユーザや展示・商品，状況記述などをクラスタリングした後に，ベイジアンネットワークでそれらの間の関係をモデル化することにより，データから，人にとって可読性の高いグラフィカルモデルとして現象のモデルを得る．それによって，例えば，どのようなタイプの顧客に，どのような商品を，どのような状況で推薦すると，どれほどの効果が得られるか，といった予測をし，さらに人が理解することも可能になる（図 4）．今後，これらを組み合わせて，イベントのマネジメントの支援システム，地域コミュニティの構築と運用の支援システムなどの AI 応用システムの開発効率が向上することを示していく．また，介護サービスの現場においては，介護プロセスを観測・推定するモジュール，健康状態を観測・推定するモジュール，サービス利用者の支援システム，サービス提供側のスタッフ支援システムなどの開発，現場への導入がすでに行われ，それらを用いた介護業務の現場知識抽出とサービス改善効果の評価を目指している．同様の試みは，保育園における保育者の支援についても実施している．そこでは，子供の行動と感情の関係を捉えるためのデータを収集し，モデル化することで，子供の状態の把握を助けて，保育業務を支援するための研究開発を実施している．これらに共通の要素技術として，例えば，人間の日常生活の認識の研究開発も進めている．バランス良く選ばれた 100 種類の日常動作のそれぞれについて，インターネット上の動画 1 000 本を収集したデータセットを構築するとともに，それを用いて，深層学習によって短い動画中の日常動作を認識する機能モジュールを開発している．さらに，データ収集基盤としては，実社会の生活の中でのさまざまな現象を捉えるための観測手法の研究開発を行うために，産業技術総合研究所内に模擬環境であるリビングラボを構築するとともに，そこで得られた観測手法を，連携している病院や介護施設，個人住宅などに実装し，データの収集を開始している．また，人間と人間，人間とロボットのインタラクションデータを大量に収集するための VR 環境の構築も進めている． 3･2 地理空間情報プラットフォーム構築地上観測衛星，航空機，ドローン，自動運転車などにより，大量の三次元の地理空間情報が得られるようになっている．このタスクでは，そうした，さまざまなスケールでの大量の地理空間情報をシームレスにマネジメントするとともに，そうした地理空間情報から，物体認識技術や変化検知・認識技術などによって人間にとって意味のある情報を抽出して，地理空間情報とともに検索・利用・ダイナミックな更新を可能にする地理空間情報プラットフォームの実現を目指している．これまでに，衛星画像データを整備・公開 [ABCD 17, MUSIC 17]するとともに，深層学習を適用して地上の物体や変化を検出するモジュールを構築している．また，地理空間情報のユースケースとして，自律移動ロボットや自動運転車のための 3D 地図の構築，意味的情報の付与と利用に関する研究開発や，地理空間情報と混雑した環境で人流を計測するシステムと組み合わせて，人の流れの誘導や，災害時の避難計画策定を支援するための研究開発も実施している．自動運転技術に関しては，九州工業大学と連携しつつ，機械学習に基づくデータ駆動型人工知能と，自動運転用のオントロジーを用いた論理知識型人工知能の融合による解釈可能な自動運転システムに関する研究開発に取り組んでいる [橋本 18]．また，基盤となるデータプラットフォームの研究の一環として，移動体などを含むオブジェクトに関するデータの共通フォーマットの整備にも参画しており，地理空間情報の国際標準化団体である Open Geospatial Consortium（OGC）の標準化委員会において，移動体のデータフォーマットとデータアクセスメソッドに関する標準化に貢献した [OGC 17]． 3･3 AI を基盤としたロボット作業ロボットは実世界に埋め込まれた人工知能を象徴するものであるが，近年，製造業やサービス産業の生産性を向上させるために，組立てや調理などの複雑な作業を人から学び，人と協調して実行するロボットの実現が期図 4　人と相互理解できる AI によるサービス支援図 5　生活現象を扱うためのフレーム

(6)

待されている．このタスクでは，そうした産業用，および日常生活支援用の作業ロボットのための人工知能基盤として，幅広い物体のクラスや機能，姿勢を画像や三次元形状データから認識可能にする認識クラウドエンジン [Akizuki 16, Kanezaki 17]，初期状態とゴール状態から自動的に動作計画を生成する行動計画・制御モジュール，人間による教示から学ぶ模倣学習モジュールなどの研究開発，およびそれらのモジュールのための学習用データの収集・構築を進めている．それらの技術を日用品や組立部品のピッキング，組立作業，柔軟物の操作，食品の操作などに適用して有効性を示すことを目指している．特に，2･3 節でも述べたように，実ロボットを用いたデータの収集や試行錯誤には量的な限界があるため，いかに少数の経験やデータからロボットの複雑な行動を学習，習得させるかが大きな課題である．そのために，例えば，深層ニューラルネットワークを用いて，人間による少数の操作履歴から柔軟性の高い行動生成を可能にする模倣学習手法 [Yang 17] や，人間の作業を観測し，データベースとして整備し，それらを用いてもち替えを含むような複雑な組立作業の計画を自動的に生成する手法 [Wan 16]，深層学習と進化計算を組み合わせて，柔軟物の操作手順を自動生成する手法 [Tanaka 18] などの研究開発を行っている．この分野では，深層学習と強化学習を組み合わせた深層強化学習の研究も盛んに行われているが，まだまだ学習効率が十分ではないという問題がある．例えば， Abbeel らは，転移学習の一種であるメタ学習を導入することで，こうした問題に対処することを探求している [Abbeel 17]．DeepMind の AlphaGo Zero のように，深層強化学習のみで高いパフォーマンスを達成している例もあるが [Silver 17]，人工的なゲームとは異なり，実ロボットの学習においてはロボットや環境のモデルの正確さに限界があるため，不正確なモデルと実験をうまく組み合わせていく必要がある．同じく DeepMind が提案しているイメージを用いたプランニングや [Weber 17]，模倣学習と深層強化学習を上手に組み合わせていくことなども，実社会データから学習する人工知能にとって，今後の興味深い研究方向の一つだろう． 3･4 科学技術研究加速のためのテキスト統合このタスクでは，科学技術に関する膨大な文献情報データを解析・集約・可視化・モデル化し，そうした文献情報から知識を抽出し，科学技術の未来予測をすることによって，科学技術の研究開発の支援を行うことを目指している．具体的には，酵素反応や G タンパク質共役型受容体のシグナル伝達などの重要な生命科学現象の解明を目指す研究や，科学技術文献を解析，可視化し，俯瞰することを可能にする（学術俯瞰システム）ことによって，科学技術政策立案などを支援する研究に適用して有効性を示すことを狙っている． Ross King らは，ロボットサイエンティストとして，文献情報と実験用ロボットなどから得られる実験データを組み合わせて，科学技術の研究開発全体を自律的に実施する人工知能の研究開発を提唱してきているが [King 05]，人工知能研究センターにおいても，産業技術総合研究所の創薬分子プロファイリング研究センターで開発したバイオ実験を行うヒト型汎用ロボット「まほろ」などの実験用ロボットと AI を組み合わせて，科学技術研究開発を支援する人工知能の研究開発を開始している．また，テキストに限らず多様なデータを活用する取組みとしては，JST CREST のプロジェクト「人工知能を用いた統合的ながん医療システムの開発」に参画し，国立がん研究センターや Preferred Networks らと連携して人工知能技術を活用したがん治療法の研究開発に取り組んでいる．さらに，関連する取組みとして，NEDO 委託事業の中で，ATR や電気通信大学，東京大学などと連携しつつ，最新の脳科学で蓄積されている脳活動計測データを基盤とする脳データ駆動型の人工知能の研究開発を進めている． 3･5 AI 向け計算基盤・データ基盤の整備深層学習を始めとする機械学習では，大量の学習用データからデータのモデルを学習するために，膨大な計算資源を必要とする．こうした需要に応えるために 100 PFLOPS超クラスの計算能力をもつ AI クラウドが現実のものとなりつつある．そこで，こうした新しい計算インフラを実際に構築・運用するとともに，AI ワークロードを支援するモジュールベースのアプリ配備・実行機構，データフローに着目したビッグデータ処理ミドルウェア，人工知能学習用データのセキュアで効率の良いマネジメントのためのデータプラットフォームの開発を行うことで，ビッグデータを活用した AI を誰もが簡単に研究開発できるようにし，AI 応用の開発効率と生産性を向上させることを目指している [小川 18]． 2015年度以来，NEDO 委託事業や，補正予算などの事業を通じて，計算基盤の整備を進めてきた．2017 年 6 月には，400 基の最新 GPGPU を備えた産業技術総合研究所 AI クラウド（AIST AI Cloud：AAIC）の運用を開始し，省エネルギー高性能計算機のベンチマークである Green 500のリストで 3 位を獲得した [AAIC 17]．さらに，2018 年度には，東京大学とともに，東京大学の柏キャンパスに人工知能橋渡しクラウド（AI Bridging Cloud Infrastructure：ABCI）を構築し，運用を開始する予定である．計算基盤と同様に重要なものは学習・評価用のデータである．特に，すでに述べたように，実世界のデータは，大量に収集するためにはコストがかかり，また，企業活動であるサービスと関わるため，公開，共有が難しい．そこで，模擬工場や模擬コンビニなど，学習・実証用のデータを収集するための模擬環境の整備も進めている．

(7)

模擬環境のほかにも，データ収集のための基盤として，革新的なセンシング技術や人間計測技術，バイオ実験ロボットなどの研究開発も進めていく．これらの計算基盤やデータ構築基盤は，産業技術総合研究所内での利用にとどまらず，共同研究機関や，民間企業にも利用可能にしていく予定である．これらの環境を活用して，機械学習技術を多用なデータに対して適用し，学習済モデルを構築し，転移学習などを通じた再利用も含めた利活用を進め，人工知能の研究開発を加速していきたい．その際に，実社会のサービスから得られるデータを利活用するためには，データの安全な取扱いを担保する仕組みが必要である．例えば，経済産業省では，IoT 技術の研究開発などの公的研究開発プロジェクトの中で収集されるデータを広く活用できるようにすることを目指して，委託研究開発におけるデータマネジメントについての検討を進めている [METI 16]．また，産業技術総合研究所の情報・人間工学領域では，ABCI などの計算基盤，データ基盤の活用を促進するために，データの安全な取扱いに関するガイドラインの検討を進めている．また，今後，学習済モデルの知財としての取扱いなども検討していく必要があるだろう．

4．人工知能技術コンソーシアムの取組み

実世界に埋め込まれる人工知能の研究開発においては，その成果として単に技術が生まれるだけでなく，その技術を活用した新たな AI 応用システム開発手法や社会実装の手法，そして，それらの技術，手法，データを共有するコミュニティづくりも Cyber-physical system の社会実装，ディジタルトランスフォーメーションの進展のために重要となる．別の言葉で言えば，技術の開発者だけではなく，技術の利用者も系の要素として組み込んだ全体系を対象として，社会システム，エコシステムの知能化を実現していく必要がある．こうした，共同で行動を行うコミュニティは実践コミュニティ（Community of practice）と呼ばれる．この実践コミュニティの形成や運用を人工知能技術によって支援し，誰もが自由に出入りして参加したりできるような「場」ができることによって，柔軟にサービスシステムが共創的に価値を創出できるようになることも期待できる．こうした価値共創を持続的に再現，発展できる仕組みによって社会や暮らしを今よりも良いものにするという方向性を強く打ち出すことが，人工知能技術により新たな産業や社会構造を変革するための社会実装のためには必要である．こうした，社会システム，エコシステムに必要とされる利用者コミュニティとして，産業技術総合研究所内に人工知能技術コンソーシアムを設立している．産業技術総合研究所コンソーシアムという制度のもと 2015 年から活動を開始したコンソーシアムは，2017 年度には参加企業数 150 社の規模に成長し，関西支部，九州支部，中国支部も活動を開始している．そこでは，次世代人工知能技術を活用し，主に生活現象フレームワークを実社会の中で実践する利用者コミュニティ，シーズとニーズをマッチングする場として，各種のワーキンググループを中心とした活動を自立的，精力的に展開している（図 6）．コンソーシアムのワーキンググループの一つであるデータプラットフォーム WG では，多機関が連携してデータを活用するためのデータ共有の技術と仕組みづくりを提案し実証プロジェクトを開始している．また，リビングラボ WG では，ショールームや博物館のようなフィールドにおいて，行動観測可能なデバイスを埋め込み，データを活用する実証プロジェクトを開始した．ユースケース WG ではスマート社会における人工知能技術活用のシナリオづくりを，現実の自治体や住民を想定してプランニングするなど，各 WG は実践的な活動を自立的に進めて多機関連携を着実に進める場となっている．

5．お　わ　り　に

本稿では，社会に新たに出現しつつある実社会ビッグデータの利活用という観点を中心に，そうしたデータを活用した「実世界に埋め込まれる人工知能」の研究開発の課題を整理するとともに，産業技術総合研究所の人工知能研究センターおよび人工知能技術コンソーシアムの取組みを中心に，関連する研究開発を紹介した．紙数の制約もあり，一部の成果の概説にとどまっているが，幅広い種類の実社会データに対して，さまざまな課題に取り組んでいることを感じていただければと思う． IT 技術によって産業が大きく変化したのと同様に， IT技術に，よりきめの細かい，効率的なサービスを可能にする知能を加えた人工知能技術が，今後あらゆる産業の基盤となっていくことが予想される．しかしながら，そうした新しい技術を社会実装していくことは簡単ではなく，特に実社会でのサービスに由来するデータの収集や取扱い，そしてそれを用いた学習には，これまで述べてきたようにいろいろな課題がある．そうした課題を解決するためには，これまでの人工知図 6　人工知能技術コンソーシアム

(8)

能のコア技術の個別的な研究を超えて，さまざまなデータやサービスのフィールドをもつステークホルダの間の連携を含んだ人工知能技術の研究開発が必要である．人工知能研究センターや人工知能技術コンソーシアムの取組みを通じて，人工知能技術の研究と社会での活用の好循環を実現していきたい．謝　辞この成果の一部は、国立研究開発法人新エネルギー・産業技術総合開発機構（NEDO）の委託業務の結果得られたものです。

◇　参　考　文　献　◇

[AAIC 17] 産業技術総合研究所プレス発表，http://www.aist. go.jp/aist_j/press_release/pr2017/pr20170619/ pr20170619.html（2017）

[Abbeel 17] Abbeel, P.: Deep learning for robotics, NIPS 2017, invited talk（2017）

[ABCD 17] AIST building change detection dataset, https:// github.com/faiton713/ABCDdataset（2017） [AIRC 15] 産業技術総合研究所人工知能研究センターホームページ，http://www.airc.aist.go.jp/（2015） [AIRC 17] 次世代人工知能・ロボット中核技術開発／次世代人工知能分野中間成果発表会，http://www.airc.aist.go.jp/ info_details/NEDOsymposium170329.html（2017） [AIST 15a] 産業技術総合研究所人間情報研究部門ホームページ， https://unit.aist.go.jp/hiri/intro.html（2015） [Akizuki 16] Akizuki, S., Iizuka, M. and Hashimoto, M.:

“Affordance”-focused features for generic object recognition,

ECCV Workshop（2016）

[DARPA 15] DARPA explainable artificial intelligence, https://www.darpa.mil/program/explainable-artiﬁcial-intelligence（2015）

[Goodfellow 14] Goodfellow, I., et al.: Generative adversarial networks, arXiv:1406.2661（2014）

[Hara 16] Hara, S. and Hayashi, K.: Making tree ensembles interpretable: a Bayesian model selection approach, arXiv: 1606.09066（2016）

[橋本 18] 橋本康平，石田裕太郎，市瀬龍太郎，我妻広明，田向権：論理知識型 AI に基づく自動運転のための危険予測システムの構築と評価，システム制御情報学会論文誌，in press.

[Hinton 15] Hingon, G. E., et al.: Distilling the knowledge in a neural network, arXiv:1503.02531（2015）

[IoT 17] データの利用権限に関する契約ガイドライン Ver. 1.0， h t t p : / / w w w . m e t i . g o . j p / p r e s s / 2 0 1 7 / 0 5 / 20170530003/20170530003-1.pdf（2017）

[Kanezaki 17] Kanezaki, A., Matsushita, Y. and Nishida, Y.: RotationNet: Joint learning of object classification and viewpoint estimation using unaligned 3D object dataset, arXiv:1603.06208（2016）

[神嶌 10] 神嶌敏弘：転移学習，人工知能学会誌，Vol. 25, No. 4, pp. 572-580（2010）

[Kim 17] Kim, J., et al.: Show, attend, control, and justify: interpretable learning for self-driving cars, NIPS 2017

Workshop on Interpretable Machine Learning（2017） [King 05] King R. D., et al.: The robot scientist project. In:

Hoffmann A., Motoda H., Scheffer T.（eds.），Discovery Science. DS 2005. Lecture Notes in Computer Science, Vol. 3735, Springer, Berlin, Heidelberg（2005）

[Kingma 13] Kingma, D. P. and Welling, M.: Auto-encoding variational Bayes, arXiv:1312.6114（2013）

[METI 16] 委託研究開発におけるデータマネジメントについて（案），http://www.meti.go.jp/policy/economy/gijutsu_ kakushin/innovation_policy/ipmanagementguideline_

appendix_draft.pdf（2016）

[MUSIC 17] MUltiband Satellite Imagery for object Classification Dataset, https://github.com/gistairc/ MUSIC4P3（2017） [本村 14] 本村陽一：サービス工学におけるビッグデータの活用技術，日本ロボット学会誌，Vol. 32, No. 10, pp. 878-880（2014） [本村 17] 本村陽一ほか：次世代人工知能技術研究開発における生活現象モデリング，人工知能学会第 31 回全国大会予稿集， 2F4-NFC-03b-5（2017） [NEDO 17] NEDO次世代人工知能・ロボット中核技術ハンドブック，http://www.nedo.go.jp/library/pamphlets/ RBAI_hbook201709.html（2017）

[NIPS 16-17] NIPS Workshop on Bayesian Deep Learning, http://bayesiandeeplearning.org/

[NIPS 17a] NIPS 2017 Workshop on Meta Learning, _http:// metalearning.ml/（2017）

[NIPS 17b] NIPS 2017 Symposium, Interpretable Machine

Learning, http://interpretable.ml/（2017） [小川 18] 小川宏高：人工知能・ビッグデータ処理向けクラウド基盤の構築─産総研 AI クラウドと AI 橋渡しクラウド，人工知能， Vol. 33, No. 1, pp. 8-14（2018） [OGC 17] 産業技術総合研究所プレス発表，http://www.aist. go.jp/aist_j/press_release/pr2017/pr20170313/ pr20170313.html（2017）

[Silver 17] Silver, D., et al.: Mastering chess and shogi by self-play with a general reinforcement learning algorithm, arXive: 1712.01815（2017）

[SpM 14] スパースモデリングの深化と高次元データ駆動科学の創成，http://sparse-modeling.jp/（2014）

[Tanaka 18] Tanaka, D., Arnold, S. and Yamazaki, K.: EMD Net: an encode-manipulate-decode network for cloth manipulation,

IEEE Robotics and Automation Lett., accepted.（2018） [Teh 17] Teh, Y. W.: On Bayesian deep learning and deep

bayesian learning, NIPS 2017, invited talk（2017）

[Wan 16] Wan, W. and Harada, K.: Achieving high success rate in dual-arm handover using large number of candidate grasps, handover heuristics, and hierarchical search, Advanced

Robotics, Vol. 30, pp. 1111-1125（2016）

[Weber 17] Weber, T., et al.: Imagination-augmented agents for deep reinforcement learning, NIPS 2017（2017）

[Yang 17] Yang, P.-C., et al.: Repeatable folding task by humanoid robot worker using deep learning, IEEE Robotics and

Automation Lett., Vol. 2, No. 2, pp. 397-403（2017）

2017年 12 月 28 日受理

著　者　紹　介

麻生　英樹（正会員） 1981年東京大学工学部計数工学科卒業．1983 年同大学院工学系研究科情報工学専攻修士課程修了．同年，通商産業省工業技術院電子技術総合研究所入所．現在，国立研究開発法人産業技術総合研究所人工知能研究センター副研究センター長．修士（工学）．ニューラルネットワークや統計的機械学習による学習能力をもつ知的情報処理システムの研究に従事．本村　陽一（正会員）産業技術総合研究所人工知能研究センター首席研究員兼，確率モデリング研究チーム長，東京工業大学特定教授，神戸大学客員教授，統計数理研究所客員教授を兼務．博士（工学）．1993 年通商産業省工業技術院電子技術総合研究所入所後，アムステルダム大学招聘研究員，産業技術総合研究所サービス工学研究センター副研究センター長，同人工知能研究センター副研究センター長などを経て 2016 年 4 月より現職．次世代人工知能技術開発・社会応用などに従事．本学会理事，サービス学会理事，行動計量学会理事，人工知能技術コンソーシアム会長を歴任．

実社会ビッグデータを活用する次世代人工知能技術

1．は じ め に

2． 実社会ビッグデータを活用する人工知能と