1.は じ め に
本稿の著者は,ビッグデータの解析をもとにマーケ ティング支援サービスを提供しているサイジニア(株) の役員を務めている.代表の吉井は,前職は北海道大学 の助教授として,機械学習や進化的計算理論などの複雑 系工学の研究に従事していた.大学の職を辞して起業後 は,米国シリコンバレーのベンチャーキャピタルから資 金調達を行い,昨年 12 月に東証マザーズに上場を果た した. 本稿では,起業から上場に至る過程において,技術 の研究開発と会社の経営という視点から経験した,技術 シーズを事業化するまでに直面する課題について述べ, 当社の場合はどのように乗り越えてきたかを述懐する. 当社の企業活動自体が「イノベーションと AI 研究」と いうテーマに沿うところがあるのではないかと思い,ま ずは,次章ではサイジニア株式会社の設立趣旨と今日に 至るまでの取組みについて紹介したい.2.サ イ ジ ニ ア
サイジニア(株)は,北海道大学複雑系工学講座自律 系工学研究室(当時)のメンバを中心に北海道で設立さ れた.サイジニアとは,「サイエンス」×「エンジニア リング」の造語であり,「サイエンスとエンジニアリン グで 21 世紀の課題を解決する」という企業理念を掲げ ている.ここで「21 世紀の課題」と限定しているのは, 特に情報技術などの発展によって今世紀に入ってから出 現した新たな課題に目を向けているからである. 現在取り組んでいるのは,情報過多時代における自律 的・適応的な情報提供プラットフォームの実現である. ディジタル化が進んだ今日,情報の複製コスト・流通コ ストはゼロに近づき,情報流通量は増加の一途をたどる. 一方で,人間の可処分時間は有限であり,もはやすべて の情報に対応・消費することはできない.そこで,ユー ザ一人一人の過去の行動履歴をもとに,将来に所望する であろう情報を推測し,レコメンデーションという形で 情報をパーソナライズする技術を開発した. 当研究のきっかけは,代表の吉井が日本学術振興会特 別研究員を務めていた 1990 年代後半に,当時急速に普 及が進みだした Web のキラーアプリケーションとして 誕生した検索エンジンに対して抱いていた問題意識に端 を発する.それは,検索エンジンの利用では,検索ボッ クスにキーワードを入力することが必要なことから,自 分が知らないことや言語化しにくいものは発見できない という問題である. 一方,ユーザはたとえすべての情報から最適な選択を しているわけではないにしても,目の前に提示されてい る情報の中から限定合理的に自分の趣味嗜好に最も合致 する情報を選択しているはずである.その行動結果がク リックとなる.そこで Web 上の大量のクリックを解析 すると,個々人が将来に所望する情報への最短経路が見 つけられるとの仮定のもと,Web の行動履歴を解析する 情報システムの開発を行った. 実装理論については,複雑ネットワーク理論が好適で あると考えた.大量に蓄積される行動履歴は,一見ラン ダムに見えるものの,複雑系に広く観測される性質とし て知られるスケールフリー性を備えているためである. 一般的にレコメンデーション技術は,協調フィルタリン グと呼ばれる手法が使われるが,サイジニアでは,ユー実ビジネスによって磨かれる学術研究
Real Business Enhances Academic Research
吉井 伸一郎
サイジニア株式会社Shinichiro Yoshii Scigineer Inc.
[email protected], http://www.scigineer.co.jp/
Keywords:
academic research, business, entrepreneurship, innovation. 「イノベーションと AI 研究」ザの閲覧や購買行為をグラフ理論の考え方を用いて取り 扱い,同類の嗜好を有するアイテム群やユーザ群を抽出 する仕組みを開発した(図 1).当社ではこのような解 析技術について日米で 6 件の特許を取得している. 現在は,「デクワス」(deqwas)というサービス名で, ECサイトにおける商品のレコメンデーションサービス (デクワス.RECO)や,パーソナライズ型のリターゲ ティング広告(デクワス.AD),広告枠をリアルタイム に入札して最適化する DSP(デマンドサイドプラット フォーム),そして商品出荷後の納品書を個人の嗜好に パーソナライズするカタログの印刷サービス(デクワス. POD)などを提供している(図 2).言語に依存しない 解析技術であるゆえ,国内のみにとどまらず海外顧客向 けにもサービス提供している.解析対象となるデータの サイズは,月間でおよそ 3.5 億人(ユニークブラウザベー ス)の約 300 億クリックものオンライン行動履歴データ である. リアルタイム処理にも優れた情報解析プラットフォー ムは,ネット上の行動解析だけでなく,実世界の行動解 析にも適用することができる.例えば,実店舗に来店 した顧客に対して商品をディジタルサイネージに表示 する,あるいは商品購入時に,購入した商品情報などを POS端末から取得し,会計処理中にパーソナライズカ タログを印刷することが可能である(図 3). スマートフォンの普及や IoT 時代の到来を見据え,サ イジニアでは,ネットとリアルをまたぐビッグデータの 解析と情報の最適化に取り組んでいる.
3.AI 研究の新パラダイム
今日,AI 研究に関わる者にとって「ビッグデータ」 というキーワードを聞かない日はないほどだが,これを 単なる IT 業界のバズワードとしてではなく,著者は科 学の方法自体が新たな転換点を迎えているのだと考えて いる.すなわち,下記のようなパラダイムの変化である. 1 Observation Science(観測の科学)の時代 対象に作用することなく観測することから生まれた科 学.観測結果を比較し,思考によって知見を積み上げて いく.例えば,古代の人々が空を見上げることから天文 学が生まれ,天体の運動体系などがつくり上げられた. 2 Experimental Science(実験科学)の時代 実験を主たる方法とする科学.対象に何らかの操作を 加え,その結果生じる変化を調べて新たな知見を導き出 そうとする.物理や化学,生物学などは特に実験科学に より大きく進歩した. 3 Simulation Science(シミュレーション科学)の時代 計算機の発展は,さまざまな自然科学の法則や経済・ 社会学における知見をコンピュータ上にモデル化するこ とを可能にし,計算によって対象がどのように振る舞う かを予測することができるようになった.仮想的な実験 により,早く安価に研究を行うことができる. 4 Data Science(データの科学)の時代 昨今のビッグデータを前提とした,データの中から未 知の新たな知見を得ようとする新しい科学.コンピュー タを使うことから従来の計算機科学や上述のシミュレー ション科学,あるいは統計学の延長線上に捉えられるこ ともあるが,シミュレーション科学では,モデルがリッ チだがアウトプットされるデータはシンプルであるのに 対して,Data Science においてはリッチなデータから, その背景にあるシンプルなモデルを見いだそうとする. あるいはこれをさらに推し進め,最近ではモデルすら自 動的に生成しようとする deep learning も注目されてい る.システムが正しく動く理由が不明でも,データが大量 にあれば適切に動かす方法がある時代が到来しつつある. このような新しい科学的方法論は,近年の IT 産業の 企業活動の在り方も変えていく.図 4 (a)は,従来の研 究開発型の企業活動のバリューチェーンの一例である. 研究開発はバリューチェーンの左端に位置し,必要な資 源が調達されて製造され,マーケットに対して販売され 図 2 サイジニアの提供サービス概要 図 3 実世界における情報パーソナライゼーションていく.マーケットの変化は,研究開発の速度よりも遅 く,独立したものとして捉えられている. 一方で,Google や Amazon のような企業は,研究開 発・販売される製品やサービス自体がマーケットを構成 し,そこから発生するデータによって,間断なく技術が 進化していく.このような企業活動プロセスを図示した ものが図 4(b)である.マーケットは企業活動を通じ て自己言及的に進化するエコシステムだ.今開発された コードはマーケットを通じて即座に問題の所在が判断さ れ,次の開発に活かされる.インターネット関連ビジネ スについてはこの傾向が顕著であり,シーズとなる技術 が優れていても,自らマーケットないしはそこへのアク セス権を有しリアルタイムにフィードバックを得ること ができなければ,持続的なイノベーションを実現するこ とは困難である. アカデミックな環境においては,このようなプロセス の中で研究開発をすることが難しい.成果を論文として 発表する間に世の中のニーズが変わってしまう可能性が あるばかりか,開発した技術シーズの正当性を検証する 方法もないのがその理由である. これに関する一つの事例として,2006 年に米国で開 催された Netflix Prize を紹介したい.Netflix は DVD レンタル事業の最大手企業で,自社が保有する DVD レ ンタルに関するユーザデータを公開した.自社のレコメ ンデーション技術の精度に対して 10%以上上回るアル ゴリズムを開発した者に 100 万ドルを与えるとして当時 話題を呼んだ.今日でいうビッグデータのオープン化に よる技術開発コンテストである. コンテストは,Netflix が保有するユーザのレーティ ングデータの一部を使って DVD レコメンデーションの モデルを開発し,残りのデータを使ってレーティングと 合致しているかを検証するやり方で実施された.このコ ンテストには,当時,世界中から大学や企業の研究者が 参加し,10%の精度向上を達成するまで数年にわたって 実施された.最終的に条件を満足するアルゴリズムが開 発されたが,その後,Netflix のサービスには採用され ることはなかったという. 後年,Netflix 開発者のエンジニアの blog によると, コンテスト優勝者のアルゴリズムを本サービスに利用し なかった理由として,①抽出された少量のデータセット に対して有効だったアルゴリズムも,本サービスの巨大 データに対しては実効性が伴わなかったこと,②コンテ スト開催中に,Netflix の事業モデルが DVD レンタルか らビデオのストリーミングサービスに移行し,ユーザの 利用パターンが大きく変わってしまったことなどがあげ られている. 結局のところ,研究室用に一部取り出された静的な データセットに対して最適化を図ったとしても実用には 耐えないのである.これは理論の問題ではない.あるア ルゴリズムを実際に運用した際には,そのサービスを 通じてユーザの行動パターンが動的に変化する.それに よって評価関数自体も変わる.これらの影響を取り込ん でモデルが更新され続ける仕組みが必要である. 著者らが大学の研究室から起業するに至ったのはこの ような考えによる.AI 研究が Data Science として実世 界でのイノベーションにつながるためには,最初から実 環境とセットで研究開発をする必要がある.例えば,当 社が携わっているオンライン広告のリアルタイム入札に よる広告配信サービスにおいては,1 秒間に数十万回の bid requestを行い,機械学習などによってリアルタイ ムに最適化が図られている.競合他社も同様な仕組みで 動作している環境においては,今日の最適戦略は明日に は最適ではなくなっている.今後,実環境を前提にした 研究開発がますます重要になるのは間違いない.
4.マーケットニーズと技術シーズ
次に,マーケットニーズと技術シーズの関係について 考察する.当社は,2007 年に大学での研究活動から何 らの事業基盤もないまま起業した.収益もない状況下で 製品開発を行うため,投資家からの資金調達を行うこと になった.本章では,当時のベンチャーキャピタル(以 下 VC)とのコミュニケーションから得た体験を振り返 り,上述のテーマについての考えを述べる. 2008年,我々は最初のクライアント事例をもって, 米国シリコンバレーに飛び立った.前職まで大学教員を していた著者にとって個人的な人的ネットワークがあっ たわけではない.単純に「IT に関する VC と言えばシリ コンバレー」という発想のもとに実行に踏み切った.2 週間にわたってサンドヒルロードという VC の集積地域 (b)マーケットが研究開発に直結する企業活動 図 4 (a)研究開発型企業活動のバリューチェーン要であり,新奇性,独自性がなければ出資を得ることは 難しい.しかし,シリコンバレーの VC にとって,技術 というものは必要があればどんな技術も調達できるもの であり,技術シーズに対するプライオリティは概して低 いようであった.彼らのもとには毎日数えきれないほど の案件がもち込まれるため,仮に技術シーズがそれほど ではなくても①∼③に価値があれば,技術は適切なもの を調達すればよいというスタンスである. ところで,近年では,クラウドサービスの普及によっ て IT 分野で起業するための必要資金は少なくなったこ とや,あるいはリーンスタートアップと呼ばれる,小さ く産んでデータを見ながら仮説検証して事業を成長させ るアプローチが注目されるようになり,VC の位置付け や投資スタイルも様変わりしつつあるようだ.これに伴 い,上述の検討項目の優先順位も変化していくであろう. しかし,いずれにせよ,世界中で最もイノベーションに 近いと考えられるシリコンバレーにおいて,技術シーズ は極論するとコモディティであり,「誰も見たことがな い技術」よりも「誰も考えつかなかった(誰も解決して いなかった)問題」を見いだすことのほうがより重要視 されているというのを実感した.すなわち,マーケット ニーズは技術シーズに優先する.イノベーションを実現 するために VC からのリスクマネーを必要とするなら, 技術シーズだけでは不足である. ちなみに,余談ではあるが,当時,当社は 3 社のシリ コンバレーの VC から出資意向のタームシートを受け取 り,最終的には 1 社から資金調達を行うこととなったが, 契約が締結・実行された 1 週間後にリーマンショックが 起こった.1 週間契約が遅れていたら,全く違った未来 が訪れていただろう.
5.イノベーションへの理想と現実
前章では,世界で最もイノベーション創出に影響力 がある米国シリコンバレーの投資家サイドから見た技術 シーズと市場ニーズの関係について述べた.最後に本章 では,当社が考えるイノベーションへ向けての取組みに 関する理想と現実についての考えを述べる. 著者ももともとは日本学術振興会の特別研究員や大学 で助教授を務めていたことから,アカデミック的に高い レベルで,かつビジネスにもインパクトのある仕事をし たいと考えていた.この状態を可視化するものとして, 例えば,アカデミックとビジネスを座標軸とする A-B 平 面を考えてみる(図 5).座標軸は,A 軸 : 学術的な意義 や研究としての新奇性・レベルなど,および B 軸:具体 的なビジネスに結び付いているかどうかその事業性・収 益性など,を表すものとする.「学術的にレベルが高く ビジネスになる」という理想形は,A-B 平面上では①の 位置にプロットされる.通常,産学連携という取組みも を中心に一軒ずつ訪問し,ロードショー(資金調達のた めの売込み活動)を行った. 訪問先は,飛込みで営業するほか,訪問している VC から次の訪問先を紹介してもらうことも多かった.シリ コンバレーに居を構える多数の VC は,セクタやステー ジにより注力領域が細分化している.セクタとは,例え ば IT やクリーンテック,セミコンダクタなど事業分野 別,またステージとは,創業直後のスターアップが該当 するアーリーステージから,株式公開直前のレイトス テージなどに分かれている.互いに共同出資することも 多い彼らは日常的に案件を紹介し合う.そこで,面談後 に「関心がある」といわれれば共同出資する可能性があ る VC を,逆に「関心がない」といわれれば興味をもち そうな VC を尋ねると,快く紹介に応じてくれた.こう した売込み活動の繰返しにより,プレゼンテーションも しだいに上達していく. 当初は,特許出願中の技術やそのアイディアのユニー クネスがセールスポイントになると考えていたが,合計 で 20 数社ほど面談してわかったのは,技術シーズにつ いてのプライオリティの低さである.彼らの質問を優先 順位ごとに要約すると以下のとおりである.① What pain do you address?
あなたが取り組む問題は何か? ここで言う「pain」 とは,「痛みとも思えるほど取り除きたい問題」という 意味である.「problem」よりもっと起業家にとって“自 分事化”された特別な課題は何なのかを探るものであり, 日々さまざまな案件を吟味している VC にとって今まで になかった問題に取り組もうとしているほうが挑戦し甲 斐がある.ここの導入部分で興味をもってもらえないと 面談はそこで終了となる可能性が大きい.
② What is your “must-have” value proposition? あなたの「must-have」な提供価値は何か? これは, 他者が「絶対にそれを必要」と思う提供価値が何なのか ということを問うている.代替手段が他になければ自ず と提案技術の市場価値は高まるだろう.必須ではないけ れども「あったらよい」というレベルは「want-to-have」 と呼ばれ,マーケットに訴求する魅力が足りないことか ら多くの資金を得るのは難しくなる.
③ Which market? How big is the market?
どんなマーケットを想定し,その市場規模はいくら か? 最終的には VC は投資先企業が,株式公開あるい は買収によりイグジットすることを期待しているため, 投資先の事業規模が大きいことは必須である.一方,仮 に巨大な市場規模があるということは競合企業との競争 が激しくなることから,どのマーケットを狙うのかとい うことは非常に重要である.
④ What is your technology?
そして,いよいよどんな技術をもっているのか,とい う質問になる.もちろん,技術シーズの競争優位性は重
その多くは,この①の状態を目指して取組みが始まるこ とが多いはずだ. しかし,現実には,アカデミック側の立場では図 5 に おける②の状態にとどまってしまう場合が多い.すなわ ち,論文にはなるが,金にならない状態である.逆に企 業側からすると,ビジネスにはなるが論文にならない状 態,つまり③の位置に収れんしがちである.理想は A-B 平面の右上側なのだが,現実には軸寄りの領域に落ち着 くのはなぜなのだろうか. アカデミックの軸を高めるということは,それは専門 性の向上であり,代償として汎用性が失われていく.特 定条件下では活きてくる特徴も,その他の条件のもとで は実効性が伴わない結果となる.先の Netflix Prize に おいて世界中の研究者から開発されたアルゴリズムコン テストの話を思い出してみよう.テスト用のデータセッ トとして提供された,“レコメンデーション機能がない 状態”でのユーザデータに対して最適化されたアルゴリ ズムは,そのアルゴリズム自身が提供するレコメンデー ション機能によって変化していくユーザ行動様式には効 果がなかった.また DVD レンタルからストリーミング 配信というビジネスモデルの変化により一新されたユー ザ行動特性にも対応できなかった. 逆に,ビジネスの軸を追求する動きをしていくと,専 門性を損なってでも汎用性を高める必要が生じる.属人 性が高く,つぶしがきかない仕組みに依拠していては, スケーラビリティに乏しいばかりか事業の永続性を担保 できないからである. 一方,本稿では,実環境とセットの研究開発姿勢,マー ケットと直接リンクした実データに基づく企業活動の重 要性を述べてきたが,これを図示すると図 6 になる.つ まり,直交する A 軸と B 軸で面積が最大になる領域(図 5の①)を目指すのではなく,A 軸と B 軸を互いに近づ けて生まれる領域へのフォーカスである.イノベーショ ンとは,面積が最大になる領域にあるのではなく,合成 ベクトルが最大化した先に生じるものだと思う. ところで,前章において米国シリコンバレーではマー ケットニーズが技術シーズに優先する旨の話をした.し かし,このことはすなわちビジネス側の人間がより重要 だということを主張したいわけではない.本稿の執筆に あたっては,今後マーケットニーズから出発する研究者 がもっと登場することを期待している. マーケットのニーズは絶えず変化し,競争によってビ ジネス環境は進化していく.一方,アカデミックないし 科学とは客観的・論理的な営みであり,先人の知識の上 に新たな知識が積み重ねられていく.B 軸は常に一定し ないが,A 軸は一歩ずつ深まっていく性質をもつ.変動 する B 軸群とすり合わせ可能な研究姿勢を貫く研究者が 登場すると面白いと思う(図 7). 世間では,産業界から見た大学への提言,あるいはそ の逆の話を聞くことがあるが,直行する軸上の者同士で 自分が見えている世界から互いに他者に何かを求めるよ り,自分で両方をやってみたい.その際,研究者側がマー ケットニーズを鑑みてスタートすることこそが大きなイ ノベーションにつながるはずだと考える. 著者も長らく AI 領域の研究に携わったが,現在,か くも多くのチャレンジしがいのある課題がまだまだマー ケットに眠っていることに興奮を覚える.サイジニアは, 科学的探究心という想像力と工学的な課題解決という創 造力をもって取り組んでいる.
6.お わ り に
本稿では,大学での研究時代から会社の起業を通じて 経験した事柄を踏まえて,マーケットニーズと技術シー 図 5 イノベーションの理想と現実(A-B 平面) 図 6 サイジニアのアプローチ 図 7 期待する研究開発の在り方ズの関係,およびイノベーションについて考察した. ベンチャー企業とは,空中から落下しながら飛行機を 組み立て,地面にぶつかる前に飛び立つようなものだと いわれる.当社も過去に危険な状態を経験したことがあ る.その度に事業モデルを修正しつつ,今日まで会社を 継続してきた.最近では,事業モデルを修正することを 「ピボットする」と称するが,当社においては事業モデ ルは変われど,中核となる技術は一貫して変わっていな い.これは技術的にアカデミックな裏付けがあることが プラスに働いたものといえる. 事業活動の一つには,細かく仮説検証を繰り返しなが ら改善を図っていく要素があるので,研究者向きでもあ る.要は,地面に激突する(=資金がなくなり倒産する) 前に,いくつの試行錯誤をすることができて離陸するこ とができるかが重要である.大学や大企業の研究室に所 属しているとこの感覚に乏しくなってしまうが,研究者 の皆さんには一つでも多くチャレンジをして,自身の研 究をイノベーションにつなげていただきたい. 2015年 4 月 4 日 受理