305 人 工 知 能 29 巻 3 号(2014 年 5 月)
IEEE ICDM, Dallas (Dec. 7-10, 2013)
ICDMは IEEE が主催するデータマイニング業界の なかで比較的権威のある国際会議である [中島 02,比戸 06,佐藤 09].2013 年の開催地であるダラスへの旅は 不吉な予感から始まった.シリコンバレー出張時にパス ポートを落とした前科のある学生が,懲りないことに搭 乗券を落として白人の紳士に拾っていただいている姿を 目の前にし,著者のテンションはすでに最低レベルに下 がっていた.何かある,何かある……乗継ぎ便までの待 ち時間に身を寄せた航空会社のラウンジで,突然声をか けられた.「本日のダラス行きの便は,大雪のためすべ てキャンセルされました」,な,なんと! ……南部の州 での大雪というのが意外だったので,膝の上に開いたま まの PC から Google 検索で Dallas と打ってみると,続 けざまに Snow Storm, 2011, 2012 などという単語や数 字が検索ワード候補として自動的に表示された.内陸部 のダラスは冬に氷点下になることもあり,大雪に見舞わ れると除雪設備がないので,東京のように大変なことに なるようなのだ.だが今回の大雪はかなりひどいようで, Facebookを見ると知人達が全米のあちこちの空港で足止 めをくらっているようで,私達もあきらめてダラスのホ テルの予約を同じチェーンのサンディエゴのホテルに追 加料金なしで振り替える手続きを済ませてから空港を後 にした.この時点ですでに発表のチャンスを逃してしまっ た学生(ICDM 併設のワークショップ参加だった)と, 学生の発表を聴くという出張の目的を失ってしまった教 員にとっては,サンディエゴの青空が目に刺さるほどに まぶしく,ダラスの大雪が心底うらめしかった.次の日 もダラス行きの飛行機が出るのを待ちながら空港で過ご し,深夜になってどうにかたどり着けたダラス空港では 数時間雪の中でタクシー待ち,というトラブルてんこ盛 りの往路だったが,皮肉にも冒頭の学生のトラブルのお かげで脱力し,何が起きても動じることのない淡々とし た道中となった. どうにか ICDM のオープニングには間に合い,発表で きなかった代わりに学生とともに分担して真面目にセッ ションを聞いて勉強に励むことにした.会議は 7 日が併 設のワークショップ,8 ∼ 10 日に三つのキーノート,4 セッション同時進行で全 24 セッション(うちチュートリ アルが二つ)という構成だった.予稿集が大雪の影響で 最終日まで届かなかったうえ,会場には無線 LAN サービ スがなかったので,参加者は印刷された簡易プログラム のセッション名や発表タイトルだけで中身を類推して各 自興味のあるアプリケーションや手法の話を聞きに部屋 を渡り歩くことになった.さらに大雪の影響で登壇でき なくなった発表者がいたり,別のセッションで登壇でき なかった発表者が割込みで発表するために質疑応答時間 を大幅に削ったりと,プログラムどおりではない進行も 見られたが,大雪を乗り越えて集ったことへの連帯感か らか,会議期間中を通して非常に和やかかつ活発に参加 者間の議論や交流が行われていた. セッションタイトルを 2012, 2011 の過去 2 回分と比 較すると,Mobile Intelligence, Business Intelligence, Bioinformatics and Medical Informaticsなどといった アプリケーション寄りの名称が目立つ.発表のレベルは 採択率の低さに裏打ちされて十分に高く,数式だらけに もかかわらず,デザイン性の高い美しいわかりやすいス ライドをつくり,軽快なトークで聴衆を魅了する学生も いて感心させられた.その一方で,予稿集が誰の手元 にもないという今回のような特殊な状況を想定していな かったのか,個々のスライドのつくり方や全体構成が雑 で,聴衆に内容が伝わりづらい発表もあった.ICDM の 公開資料から採択率や件数を見ると,55 か国からの 809 件の応募(うち 475 件(58.7%)は学生が第 1 著者)が あり 159 件(19.65%)が採択,国別採択件数は USA が 70件弱で 1 位,中国が 25 件程度で 2 位,インドも日本 もヨーロッパ各国も 10 件以下の下のほうに位置している [ICDM 13].この USA 枠の発表者の多くが中国系・イン ド系であったのか,筆者が聴講した発表のほとんどが中 国系・インド系の学生や若手によるものであったのが強 烈な印象だった.[ICDM 13] の公開資料には査読のポイ ントなども整理されており,分野が違う方にも一読をお 勧めしたい. 今回の会議では注目のトピックやセッション,発表が あるから見逃すな,といった雰囲気は特になく,特定の 部屋だけが聴講者で溢れかえるような状況も見受けられ なかった.著者の周囲の参加者が話題にしていたのは, 同時期に米国内で開催されていた Deep Learning の会議 に Facebook のザッカーバーグが参加している,というこ とだった.ここでもまた時代が動くのを感じた. ◇ 参 考 文 献 ◇
[中島 02] 中島智晴:The 2001 IEEE International Conference on Data Mining(ICDM’01)に参加して,システム制御情報学会誌, Vol. 46, No. 4, p. 226(2002)
[比戸 06] 比戸将平:International Conference on Data Mining (ICDM’05), 人工知能学会誌,Vol. 21, No. 4, pp. 511-512(2006) [佐藤 09] 佐藤 誠:ICDM2008 参加報告(会議レポート),情報処理,
Vol. 50, No. 4, p. 352(2009)
[ICDM 13] ICDM’13 Community Meeting Slides, http://www. cs.uvm.edu/~icdm/Slides/ICDM13-CommunityMtng.pdf (2013)
〔矢入 郁子(上智大学)〕
会 議 報 告
会 議 報 告
306 人 工 知 能 29 巻 3 号(2014 年 5 月)
The 7th ACM WSDM Conference
開催場所:Crowne Plaza Times Square, New York (ニューヨーク,アメリカ合衆国)
開催期間:2014 年 2 月 24 日∼ 2 月 28 日 (本会議は 2 月 25 ∼ 27 日)
http://www.wsdm-conference.org/2014/ 1.会 議 概 要
ACM WSDM*1 Conferenceは Web における検索と
データマイニングに関する研究を扱う国際会議である. 本会議の採択率は今回 18%と低く,しかも年々低下傾 向にあり,トップクラスの会議とみなされている.内容 は主に Web の検索,広告,推薦,そしてソーシャルネ ットワークについて扱い,特に実用性と新しいモデルに 基づいた研究が多い. なお,会議の発表資料などの情報は上記 Web 上にま とめられている. 2.今回の会議について 会場はニューヨークの中心街の一つであるタイムズス クエアに面したホテルで行われた.本会議前のチュート リアル,本会議後のワークショップは並行していくつか のセッションが行われるものの,本会議自体はシングル トラックで行われた.そのためか時間配分が非常にタイ トで,12 分程度で発表と質疑応答を行わなければなら ず,時間の関係で質疑応答が省略されることもいくつか あった.セッション中に十分議論できないことを考慮し てか,発表者らによるポスターセッションも行われたも のの,本会議 1 日目であったために深い議論まで至らな いという意見も聞かれた.いくつかのセッションの最初 には Practice and Experience Talks と題して産業界の エキスパートらによる講演があり,アカデミアへの問題 提起や,産業界のデータを扱ううえで既存技術がどのよ うに生かされているかなどの発表があった. 2・1 本 年 度 実 績 本年は 44 か国から 355 の投稿があり,64 本がフルペー パとして採択されている.そのうち 19 本がロングプレ ゼンテーションとして選ばれた.チュートリアルは午前 午後に分けて合計 6 セッションが,ワークショップは全 日と半日の合計 5 セッションが行われた.本会議最初に 行われた Keynote Address と,セッションの最初に行わ れた Practice and Experience Talks について次に報告 する.
2・2 本会議中の講演
本会議の最初に行われた Keynote は,コロラド大 学ボルダー校准教授 Leysia Palenx によるクライシス 情報学の現状と展望についての講演であった.彼女 は EPIC(Empowering the Public with Information during Crisis)プロジェクトを率いており,災害に対 して人々がどのように反応をしたか,災害に遭った人々 にとって有用な情報とそうでないものの判別についてな ど,データを用いて災害に立ち向かう人々をいかに援助 できそうか紹介した.Practice and Experience Talks で は Facebook の Xiao Li が Graph Search の実装の概要 について,クエリを実用的な範囲で解釈する方法や自然 言語処理との関係について講演し,産業界のシステムに 既存の技術がどのように生きているか説明するものもあ れば,eHarmony の Vaclav Petricek のように自社の男 女マッチングサイトのデータを用いて,長期的な付き合 いをする相手をいかに紹介するかといった,分析とモデ リングの紹介をするものもあった.印象深かったものは 図 1 タイムズスクエア 図 2 チュートリアルの様子 *1 “wisdom”と発音される.
307 人 工 知 能 29 巻 3 号(2014 年 5 月)
Amazonの Guy Lebanon による推薦システムの問題点 と新しい方向性について指摘した講演であった.アカデ ミアで手に入るデータは大きくても産業界で扱っている データよりは小さいためスケーラビリティに問題がある こと,Netflix の公開したデータのような星の数よりは 買うか買わないか,見たか見なかったかといったバイナ リのデータが実用上は大事であること,そして一番重要 なのは推薦結果を見せたときにユーザがどのような行動 を示したかであることを指摘し,企業とアカデミアの協 業の可能性についても言及していた. 2・3 全 体 傾 向 発表を通じて,問題に対して新しいモデリングでア プローチし,実データを使って性能評価を行う発表が多 かった.特に実データが絡んでいるからか,Microsoft Researchや Yahoo! Labs,Google の研究者とインター ン生による発表が多く見られた.これは,他の国際会議 では,研究対象のデータを他の研究者も利用可能である オープンなデータに限りつつある中,WSDM では特に 制限を設けていないことが背景にあるように思える. セッションごとに見ていくと,Web 検索の発表では 図 3 バンケットの様子 ユーザの検索意図を知ることや,クエリ理解の難しさが 問題意識として共有されているようであった.この問題 に対するアプローチとしては,外部データを用いたり似 た行動をした他のユーザの情報を使ったりして属性と して使える情報を増やすものや,クエリというよりセッ ションで行動ログを取ってほしい情報を探し出すまでど のような行動を取るか調べたものもあった. トピックモデルのセッションは自然言語処理とリン クトデータの二つに分けられていたものの,どちらも LDAを用いた研究が多くを占めた.それぞれのデータ と問題設定の特性に合わせて LDA に改良を施したモデ リングをしていた. そのほか,ネットワーク上での情報拡散やリンク予 測など機械学習よりの複雑なネットワークに関するセッ ションも設けられ,ワークショップも複数設けられてい た. 3.お わ り に 本会議が扱う Web 検索,広告,推薦,ログ解析のい ずれもオープンに手に入るデータが限られているため か,企業に所属した研究者またはインターン生による発 表が多い印象を受けた.それぞれの分野では比較的問題 意識が共有され,本会議が求める実践的な研究が集まっ たばかりか,企業側がアカデミアに対して注文をつける 講演もあり,産業界がこれからどのような方向に向かい たいのか透けて見えた部分もあったように思う. またもう一点指摘したいことは,本会議における日 本の大学・企業の存在感の低さである.今回採択され た論文は 1 本のみであった.対照的に中国の大学と Microsoft Research Asiaの存在感は非常に大きく,それ を反映してか WSDM 2015 は上海で開催される予定と なっている.