• 検索結果がありません。

ICDM 2008会議報告

N/A
N/A
Protected

Academic year: 2021

シェア "ICDM 2008会議報告"

Copied!
1
0
0

読み込み中.... (全文を見る)

全文

(1)のである.10K の 3 乗程度の規模のテンソルデータにお いて,従来手法よりも 1000 倍程度メモリ量を圧縮でき るとの報告があった.さらに,データマイニングコンテ ストでは,大気中の放射性核種の希ガス観測値から核爆 発が生じた場合を識別するという問題が出題され,ここ でも IBM の Wei Fan 氏らのグループがチャンピオンに 選ばれた.用いた手法はランダム決定木と bagging 決定 木を組み合わせた手法とのことである.. 会議レポート ICDM 2008 参加報告.  注目されているトピックとしては,やはりインターネ ットやインターネット産業に関するものである.ネット 上のテキスト文書やそのグラフ構造,ソーシャルネッ トワークなどの WWW において生じている現象そのも のを分析対象にしたものや,クリックストリーム分析 や dyadic(二項)データを対象とした co-clustering,効.  2008 年 12 月 15 ∼ 19 日にイタリアのピサで開催さ. 果的な推薦システムのように Web サーバを用いて直接. れた IEEE International Conference on Data Mining (ICDM). ビジネスを行うインターネット企業において特に重要と. 2008 に参加した.IEEE ICDM は ACM SIGKDD と並ぶ非. なる分析手法が多い.その他には,学習の結果得られた. 常に大規模なデータマイニングに関する国際会議として. 機械が運用時においても賢さを保てるように工夫した機. 知られている.今回の会議は 3 日間の本会議に加えて. 械学習である semi-supervised learning や covariate shift,. その前後に 1 日ずつ,合わせて 10 のワークショップが. あるいは,時空間情報を持つユビキタスデータを対象に. 併設され,計 5 日間にわたって盛大に開催された.斜塔. したマイニング技術などが注目を集めていた.. で有名なピサはトスカーナ地方の小都市であるが,古く.  また,多くの著者が利用しており流行しているなと感. からの大学都市でもあり,ガリレオ・ガリレイが教鞭を. じた手法としては,テキストマイニング等で用いられる. とったピサ大学(1343 年設立)を始めとしていくつも. トピックモデル(topic model)と非負値行列分解(NMF:. の大学があるため街は多くの学生であふれている.その. non-negative matrix factorization)である.トピックモ. ような開催地の魅力もあってか,本会議には 700 件以. デルは文章をトピックという潜在変数の混合で表現する. 上の投稿があった.そのうち約 20%が採録され,主に. ための確率モデルである.清華大の Hongning Wang 氏. 3 つのパラレルセッションにおいて口頭発表を行った.. らはトピック間の相関を考慮したトピックモデルであ. そのほかにも,3 つの招待講演,4 つのチュートリアル,. る CoL Model を提案し多値クラス分類問題に適用した.. デモ,パネル,データマイニングコンテストなどの多様. NMF は高次元の行列を要素が非負という制約の下で. なセッションが設定されていた.. 2 つの行列に分解する手法であり,次元圧縮手法として.  招待講演は,1)INRIA(フランス国立情報学自動制御. 注目を集めている.イリノイ大学 UIUC の Deng Cai 氏ら. 研究所)の Serge Abiteboul 氏による P2P で効率的にユ. はクラスタリング問題に適した NMF 手法である GNMF. ーザのデータを共有するためのデータベース技術に関す. (graph regularized non-negative matrix factorization) 法. るもの,2)Yahoo! 研究所の Ravi Kumar 氏によるソー. を提案し,さまざまなクラスタリング問題に適用した.. シャルネットワークのモデリングとマイニングに関す.  もう少し統計的な分析手法やインターネット産業以外. るもの,3)ユタ大学の Harvey J. Miller 氏による空間デ. への恩恵がある手法も期待したいところだが,どの発表. ータマイニングに関するものであり,多くの聴衆を集. も関連研究がよく調べられていて多くの実験結果が示さ. め活発な議論がなされていた.また,ベストリサーチ. れるなど発表のレベルは高いと感じた.基本的に米国と. ペーパーには IBM の Jimeng Sun 氏他の Scalable Tensor. 米国外を交互に開催地にしているため,次回は 2009 年. Decomposition for Multi-Aspect Data Mining が選ばれた.. 12 月に米国フロリダ州マイアミで開催される予定であ. この論文は高次元かつ疎なテンソルデータを圧縮するた. る(詳しくは http://www.cs.umbc.edu/ICDM09/ 参照).. めに,テンソル分解手法の一種である Tucker 分解をベ ースにした Memory-Efficient Tucker 法の提案に関するも. 352. 情報処理 Vol.50 No.4 Apr. 2009. (佐藤 誠/(株)東芝研究開発センター).

(2)

参照

関連したドキュメント

例えば,金沢市へのヒアリングによると,木造住宅の 耐震診断・設計・改修工事の件数は,補助制度を拡充し た 2008 年度以降において 120

度の﹁士地勘 L

 第1報Dでは,環境汚染の場合に食品中にみられる

算処理の効率化のliM点において従来よりも優れたモデリング手法について提案した.lMil9f

定可能性は大前提とした上で、どの程度の時間で、どの程度のメモリを用いれば計

測定結果より、凝縮器の冷却水に低温のブライン −5℃ を使用し、さらに凝縮温度 を下げて、圧縮比を小さくしていくことで、測定値ハ(凝縮温度 10.6℃ 、圧縮比

⼝部における線量率の実測値は11 mSv/h程度であることから、25 mSv/h 程度まで上昇する可能性

  支払の完了していない株式についての配当はその買手にとって非課税とされるべ きである。