機械学習のさせ方:棋譜データ

Top PDF 機械学習のさせ方:棋譜データ:

将棋ソフトウェアにおける棋譜データの利用と機械学習

将棋ソフトウェアにおける棋譜データの利用と機械学習

ゲーム基本的なアルゴリズム • 人間は, 「読み」 と「大局観」 で指し手を決定 • コンピュータ場合,それぞれ 「探索」 と「評価関数」 で実現 【最善手▲7六歩】 ▲2六歩

32 さらに読み込む

PDFファイル 3F3 「関係・構造の機械学習」

PDFファイル 3F3 「関係・構造の機械学習」

データから多項式時間帰納推論可能であることを示した.また 提案したアルゴリズムを計算機上に実装し評価実験を行った. 今後課題として,スタート辺ない順序グラフパターンへ 応用や,地図データデータを用いた実験が考えられる.

2 さらに読み込む

PDFファイル 3F3 「関係・構造の機械学習」

PDFファイル 3F3 「関係・構造の機械学習」

本稿では,確率的主成分分析に基づく, 3 階テンソル構造 アンケートデータ欠損補完手法を提案した.実際 Web アンケートに適用し,提案手法 2( 回答者間類似性を考慮 ) で は従来法よりも真値を補完できる割合が高いことを示した.今 後課題として,回答者間類似性について,評点付け方を 考慮した方法に対する検討などが挙げられる.

4 さらに読み込む

PDFファイル 3F3 「関係・構造の機械学習」

PDFファイル 3F3 「関係・構造の機械学習」

1. はじめに 近年様々な分野において,大規模 ・ 複雑な事象をネットワーク としてとらえ,ノード間相互関係やネットワーク構造,ネッ トワーク上で現象を分析する研究が盛んに行われている.こ れら研究多くは,マーケティングなど多様な経営問題や 公共政策問題解決において重要な役割を果たすと考えらえ るが,ネットワーク構造を既知として分析れることが多い. ところが,現実社会においてはプライバシー問題や取得デー タ量制限など理由から,完全な全体ネットワーク構造を知る ことが困難な場合がある.従って,ネットワークに関するさま ざまな種類断片情報や統計情報を収集することにより,ネッ トワーク全体構造をできるだけ精緻に推定することは重要な 研究課題である.
さらに見せる

4 さらに読み込む

機械学習か?ルール定義か?

機械学習か?ルール定義か?

提出前チェックシート ※許諾はセッション毎に必要です※ ■ 非公開業績情報(金額、台数等)は書かれていない ■ お客様が特定できる事例/データは含まない(含む場合はお客様同意/承認済みである) ■ 他社ロゴ・マークを使用していない(使用場合、全て会社責任者同意/承認済である) ■ 他文献など(IBM著作物を含む)利用(複製、改変、翻訳)は適切に行われている
さらに見せる

22 さらに読み込む

機械学習によるこれまでにないビジネスのスピードとスケールの実現

機械学習によるこれまでにないビジネスのスピードとスケールの実現

ジネスリーダー75%が、分析による価値最大源泉として「成長」を挙げているにもかかわら ず、それらリーダーうち予測分析機能を導入しているは60%に過ぎません 2 。 ビッグデータをフルに活用することで、顧客挙動を詳細に理解して、顧客ごとに適したユーザー エクスペリエンス提供、製品乗り換え予防、異状検知、収益拡大などが可能になります。し かしながら、データ速度、分量、多様性増加によって、予測モデル作成作業はしだいに複雑 になっています。このような大量データセットを、ビジネスに合った速度で処理できるツールは ほとんどないからです。これに対して、Verticaインデータベース機械学習を使えば、ビッグデー タパワーを活かして、ビジネス成果を制約や妥協なしに拡大できます。
さらに見せる

18 さらに読み込む

PDFファイル 4G1 「機械学習の応用」

PDFファイル 4G1 「機械学習の応用」

本研究は,この店舗横断的なデータであるスキャンパネル データを用いて,顧客購買行動に関する特徴をマイクロクラ スタリングにより概念化し,概念を利用した分類モデルを構築 する.購買行動特徴は,顧客が店舗や商品を選択する際に想 起する店やブランドをマインドとして捉えることを目的にして おり,正例と負例でマインド違いを明らかにする.そして, 意味解釈妥当性と分類精度向上という2つ観点から評価 を行う.スキャンパネルデータは,経営科学系研究部会連合協 議会が主催する平成 25 年度データ解析コンペティションで提 供していただいた.
さらに見せる

4 さらに読み込む

PDFファイル 1G2 「機械学習の基礎」

PDFファイル 1G2 「機械学習の基礎」

あるトピックが抽出できたことが分かる。 5. おわりに 提案手法では行列 SVD とデータ点に対する体積最小閉包 楕円計算を行う必要がある。そのため、並列計算機へ実装を 考えた場合、良い並列効率が得られない可能性がある。今後 課題として、 SVD を経由ずに同様な手法が設計できるかを

4 さらに読み込む

PDFファイル 1G2 「機械学習の基礎」

PDFファイル 1G2 「機械学習の基礎」

用いるデータは,マカクサルに顔画像を提示した際神経細 胞活動を記録したデータである.提示した顔画像は, 4 つ identity それぞれに対して, 7 つ異なる角度から見たもので あり,合計 28 = 4 × 7 枚である.この 28 枚刺激をそれぞれ 提示した際, anterior inferior temporal cortex (AIT) と呼 ばれる部位神経細胞活動を,電極を用いて記録を行った. 活動を記録した神経細胞数は, 23 個である.
さらに見せる

2 さらに読み込む

天気予報 防災情報への機械学習 の利 ( 概要 ) 2

天気予報 防災情報への機械学習 の利 ( 概要 ) 2

目的変数品質管理 28 目的変数(教師データ)にエラーがあった場合、適切な機械学 習ができない。特に逐次学習では、変な学習をして、その後予 測精度が落ちることがある。学習前に除いておく必要がある。

35 さらに読み込む

PDFファイル 1G2 「機械学習の基礎」

PDFファイル 1G2 「機械学習の基礎」

masa@complex.ist.hokudai.ac.jp らば,各入力に対する属性 a m 値が分かるので,入力 x を特 徴ベクトル,対応する属性 a m 値をラベルとして訓練する. テスト際は,目標タスク内クラス集合 Z に属するデー タを入力データとする.またクラス z ついても属性と関係 が予めわかっているとし,元タスクで訓練した分類器でテスト をすると,各属性について分類確率 p(a m = 1|x) を得る.ま た入力が x とき出力するクラスが z である確率は, p(z|x) なので,分類する z は MAP (最大事後確率 ) 推定より
さらに見せる

2 さらに読み込む

PDFファイル 3F4 「人間・行動と機械学習」

PDFファイル 3F4 「人間・行動と機械学習」

7. おわりに 本研究では,分布に対する仮定を置かず,多クラス分類に適 用することができ,予測に対する確率を計算することができる 半教師あり学習法として, SSKLR を提案した.また,ラベル なしデータ選別手法として,ランダムセレクション法と半教 師あり擬 RVM を提案した.ランダムセレクション法は,ラ ベルなしデータすべてを用いるではなく,数に制限を置い てランダムに複数回選別し,ラベルありデータに対する尤度が 最大になるラベルなしデータを使用して評価を行なう手法で ある.半教師あり擬 RVM は,カーネル空間基底ベクトル と観測値ベクトルとコサイン距離を計算し,値小さい基底 ベクトルを計画行列から取り除いて学習を行なう手法である. これら手法と,半教師あり学習既存手法である SSGMM
さらに見せる

4 さらに読み込む

PDFファイル 3F4 「人間・行動と機械学習」

PDFファイル 3F4 「人間・行動と機械学習」

end while 各予測モデル k ∈ K から一つタスク t ∈ T をランダムに選 択.選ばれたタスクデータから最終的な ˆ h k を学習 一つ予測モデルに割り当てられる.予測モデル数 K がタス ク数 T より少ない時予測モデルが複数タスクで共有れる ため,共有予測モデルと呼ばれる.共有予測モデル代表例と して SHAMO アルゴリズム [Crammer 12] (Algorithm 2) が 提案れている,ここで,本稿で SHAMO アルゴリズムとし て扱うアルゴリズムは,既存手法から各タスク訓練・テスト データ分割処理を除いたものになっている.既存モデルでは 各反復で学習手法として経験リスク最小化を用いている.
さらに見せる

4 さらに読み込む

PDFファイル 3F4 「人間・行動と機械学習」

PDFファイル 3F4 「人間・行動と機械学習」

The 28th Annual Conference of the Japanese Society for Artificial Intelligence, 2014 3F4-3 日常行動識別ため文字列カーネルを用いた時系列データ分節 Segmentation of Time-Series Data Using String Kernels for Recognition of Activities of Daily Living

4 さらに読み込む

HOKUGA: WMT2012データとWMT2013データにおける機械翻訳のための自動評価法の性能について

HOKUGA: WMT2012データとWMT2013データにおける機械翻訳のための自動評価法の性能について

1 はじめに 機械翻訳 野では近年,統計翻訳研究 が盛 んに行われている.統計翻訳は基本的に原言語文 とその訳文である目的言語文ペアセットであ る対訳コーパスから言語モデルと翻訳モデルを統 計手法に基づき学習し,未知原言語文を翻訳す るものである.その際,必要となるは対訳コー パスのみであるため,様々な言語間対訳コーパ スを構築することで翻訳対象となる言語を制限す ることなくシステム構築が可能である. に, 一般的には対訳コーパスデータサイズが大きく なればなるほど翻訳精度は向上する.この統計翻 訳問題点1つは対訳コーパスデータサイズ が大きくなるに伴い,モデル学習に時間がか かることであった.しかし,近年計算機におけ るハードウェア性能向上により,この問題も大 幅に改善れてきた.そのことが,統計翻訳研究 急速な進展大きな要因となっている.
さらに見せる

11 さらに読み込む

RIETI - 機械学習手法を用いた不正会計の検知と予測

RIETI - 機械学習手法を用いた不正会計の検知と予測

表4はこの投入変数群に関する詳細をまとめたものであるが、特に注目すべきモデルと してモデル1、2、6、12を取り上げる。モデル1は、本稿における比較対象であり、不 正会計検知を目的とした代表的な先行研究である Song et al. (2016)セットアップに基づ き、理論に基づく限定的な変数をパラメトリックなモデルを用いることで不正会計検知 モデルを構築したものである。これに対して、モデル2は、モデル1と同様変数群を参照 した上で、モデルを Weighted Random Forest に変更したものであり、限定的な変数セットア ップ下で機械学習手法が実現する検知精度改善度合いを確認するものである。モデル 6は、こうした機械学習ベースモデル構築によって可能となる高次元変数利用を行っ たものであり、既存研究変数と追加的な財務変数両方を用いている。当該モデル6検 知精度をモデル2と比較することで、追加的な変数利用がもたらす効果を把握すること ができる。最後に、モデル 12 は、既述追加的な財務変数に加えてガバナンス変数及び銀 行取引変数を含めたものである。
さらに見せる

35 さらに読み込む

講義名 統計 機械学習モデリング 担当教員汪金芳 山崎眞見 単位数期間 曜日 時限科目区分学習到達目標 2 単位 後 水 6 限 専門科目 機械学習の基本である 回帰 分類 モデル選択 ニューラルネットワーク サポートベクトルマシンを初めとする理論を理解する 講義概要 データに潜む有用な情報を数理モ

講義名 統計 機械学習モデリング 担当教員汪金芳 山崎眞見 単位数期間 曜日 時限科目区分学習到達目標 2 単位 後 水 6 限 専門科目 機械学習の基本である 回帰 分類 モデル選択 ニューラルネットワーク サポートベクトルマシンを初めとする理論を理解する 講義概要 データに潜む有用な情報を数理モ

学習到達目標 公共領域における課題に対し、データ分析を用いた課題深堀から解決策策定・提言 まで問題解決一連プロセスについて、関係者と連携しながら進められる素地醸 成 講義概要 本講義では、個票データ(擬似データ含む)分析を用いた問題解決一覧プロセスを、 主にグループワークを通じて実践的な形で学習する。各グループには、ビジネス経験、 データ分析経験が豊富な講師が付き、各回アウトプットに対してフィードバックを提 供する。また、グループワークを通じて問題解決における他者と協働を身に着けるだ けではなく、クライアントへ模擬インタビューやプレゼンテーションを実施し、問題 解決に必要な能力素地を総合的に養う。
さらに見せる

25 さらに読み込む

PDFファイル 1G2 「機械学習の基礎」

PDFファイル 1G2 「機械学習の基礎」

記事配信システムは,過去ユーザ記事好みに関する データを用いて学習を行うが,推薦はまだ読まれていない記事 に対してする必要がある.従って,目標仮説から偏見を排除す るためには,未知記事に対して中立である必要がある.この ように,教師あり学習における中立性は,未知入力 x に対 応する目標 f (x) と視点 g(x) 相関性によって測られる.こ れは,教師あり学習において分類器精度を測る汎化損失と似 たような基準であることから,未知事例に対する中立性性 連絡先 : 福地 一斗,筑波大学大学院システム情報工学研究科コ ンピュータサイエンス専攻,茨城県つくば市天王台 1-1-1 , 029-853-3826 , kazuto@mdl.cs.tsukuba.ac.jp
さらに見せる

4 さらに読み込む

はじめての機械学習

はじめての機械学習

機械学習における課題大部分は、データ処理と正しいモデル発見に関連して います。 データ形式や規模は均一ではありません。実世界データセットは、乱雑で、不 完全で、フォーマットもさまざまです。シンプルな数値データのみ場合もあるか もしれません。しかし、センサー信号、テキスト、カメラからストリーミング画像 など、さまざまな種類データを組み合わせる場合もあるでしょう。
さらに見せる

16 さらに読み込む

Show all 10000 documents...