• 検索結果がありません。

機械学習・データマイニング用語

機械学習とデータマイニングは交差する部分が大きく 技法も同じなので混同されることが多いが 次のよう に定義できる 機械学習の目的は 訓練データから学んだ 既知 の特徴に基づく予測である データマイニングの目的は それまで 未知 だったデータの特徴を発見することである セルフサービス BI Power

機械学習とデータマイニングは交差する部分が大きく 技法も同じなので混同されることが多いが 次のよう に定義できる 機械学習の目的は 訓練データから学んだ 既知 の特徴に基づく予測である データマイニングの目的は それまで 未知 だったデータの特徴を発見することである セルフサービス BI Power

... • クラウドベースの機械学習実行基盤 • 機械学習の「モデル作成」「モデルの評価」から、作成した分析モデルのデプロ イ( Web サービス化)まで、機械学習 の開発~サービス提供で必要となるすべ てのコンポーネントを Paas で提供 ...

42

カオス文献情報からのデータマイニングによる研究動向調査

カオス文献情報からのデータマイニングによる研究動向調査

... 解析結果から、ある程度の研究分野をうかがうことができる ことが確認できた。また、解析には用語の統一が重要であると いうことが確認できた。 現在、データベースのクリーニングを行っており、それと並 行して、多のデータマイニング手法の適用を検討している。ク リーニングに関しては、用語の統一、キーワードとして不適 切な用語の削除などである。キーワードレベルではなく、キー ...

6

PDFファイル 3J4 「データマイニングの応用」

PDFファイル 3J4 「データマイニングの応用」

... 万歩計には Fitbit one という機器を用いた。 Fitbit one が スマートフォンからデータを逐次サーバにアップロードする機 能を持った万歩計であり、データ収集が容易なためである。 また、被験者には万歩計の装着を徹底したが、その他は特に ...

2

目次 1. はじめに センサーと設置場所 不要なデータの除去 データ前処理 A) 機械学習ための時系列データ前処理 B) 2 つ部分時系列の距離計算 クラスタリングでの異常検知 A

目次 1. はじめに センサーと設置場所 不要なデータの除去 データ前処理 A) 機械学習ための時系列データ前処理 B) 2 つ部分時系列の距離計算 クラスタリングでの異常検知 A

... - 15 - 時系列がある事がわかった。外れた部分を拡大して調べると、その部分時系列は 0 に近い指 数のデータであった。 図 19 に 2018 年 02 月 02 日の外れ値付近の地磁気と加速度の 6 軸の時系列データを示 す。横軸の時系列指数が 55,250 から 56,750 の間で、データが変則的であることがわかる。 ...

22

PDFファイル 3J4 「データマイニングの応用」

PDFファイル 3J4 「データマイニングの応用」

... 反映 地図 作成 確 ,化学構造特徴空 間地図 作成 行 . タ ッ ,能 作成 薬化合物 NTG 辞書[能 08] 単純 フ同型 NTG/CG 数 20 種 NTG/SG 用い .SOM 学習 佐々 木 開 さ SOMSAR[佐々木 04] 使用 . ップ イ 10x10 地図 作成 図 3 示 . ...

2

データストリームマイニングアルゴリズムの性能評価手法の検討

データストリームマイニングアルゴリズムの性能評価手法の検討

... 次に,静的なデータセットを用いてオンラインアルゴリズムを評価する場合を想定する. オンラインアルゴリズムでは,データを 1 つずつ逐次的に与えて学習を行う.そのため,オ ンラインアルゴリズムにデータを与える時,アルゴリズムに与えるデータの順番を決める必 要がある.特に順番を考えずに与える場合,データセットのインデックスに基づいてデータ ...

56

機械学習か?ルール定義か?

機械学習か?ルール定義か?

... 提出前チェックシート ※許諾はセッション毎に必要です※ ■ 非公開の業績情報(金額、台数等)は書かれていない ■ お客様が特定できる事例/データは含まない(含む場合はお客様の同意/承認済みである) ■ 他社のロゴ・マークを使用していない(使用の場合、全ての会社の責任者の同意/承認済である) ■ 他の文献など(IBM著作物を含む)の利用(複製、改変、翻訳)は適切に行われている ...

22

機械学習のご紹介

機械学習のご紹介

... 機械学習のさまざまなアルゴリズムは、データに潜む自然なパ ターンを見つけ出し、そこから洞察を導き、あなたがよりよい意 思決定や未来予測をするのを助けてくれます。これらは、日々 の医療診断や株取引、エネルギー需要予測など、さまざまな場 面での意思決定に利用されています。音楽・動画配信サイトで は、何百万もの選択肢の中から個々のユーザーに合った曲や映 ...

12

PDFファイル 3J3 「データマイニングの基礎」

PDFファイル 3J3 「データマイニングの基礎」

... [ 君山 08] 君山 由良:データ分析入門 2 多変量解析法・ MDS の応用 , 第 2 巻 , Data Analysis Instetute, Inc (2008) [ 木下 08] 木下 祐介 , 井上 勝雄 , 酒井 正幸:携帯電話機デザイ ンの男女差の調査分析 , 感性工学研究論文集 , Vol. 7, No. 3, ...

2

はじめての機械学習

はじめての機械学習

... エッジ検出-輝度が急に変化するポイントを特定 トランザクションデータ データ内の情報を強化する抽出値を計算 タイムスタンプ分解-タイムスタンプを日、月などの成分に分解 抽出できる特徴量は、想像力次第で変わります。しかし、データの種類によって一般的によく用いられる手法というものがあります。 ステップ3:特徴量を抽出する (続き) ...

16

質的データ分析におけるグラウンデッドなテキストマイニング・アプローチの提案

質的データ分析におけるグラウンデッドなテキストマイニング・アプローチの提案

... confirmability(確証性)という 4 つの概念によって支えられている。 Credibility は、研究参加者が持つリアリティと、研究者によって表現された結果が一致して いるかどうかという評価規準である。これを評価するための方法としては、長期にわたる関与、 継続的な観察、中立な評価、否定事例分析、メンバーチェックなどがある。Transferability は、 ...

22

日本プロ野球におけるバントの有効性 ~実データを用いたデータマイニングより~

日本プロ野球におけるバントの有効性 ~実データを用いたデータマイニングより~

... 分析 2~ディシジョン・ツリーの利用~ 今回の分析では、 VMS内のDecision Tree(デシジョンツリー)の機 能を活用することで、バント作戦が具体的にどのような場面で有効で あるのかを模索した。 1年分全試合という膨大な量のデータをツリーを 用いることで、複雑な分析過程、結果を可視化させ、そのイメージが 容易に為されることに期待してデシジョンツリーの活用を試みた。 ...

27

データマイニングのための前処理アルゴリズム簡易自動選択システム

データマイニングのための前処理アルゴリズム簡易自動選択システム

... Stevens は測定の尺度を特定のクラスに分類されるという内容について報告した [17] . 測定とは,広義にはルールに従ってオブジェクトまたはイベントに数字を割り当てること として定義されている.その際に異なるルールの下で数字を割り当てることができるが,異 なる種類の尺度と異なる種類の測定によって,数字の割当に関する様々な規則,結果の尺度 の数学的特性の違い,尺度の各タイプで行われた測定に適用可能な統計演算が明確とならな ...

34

遺伝的プログラミングによるデータマイニングアルゴリズムの組み合わせ手法の改良

遺伝的プログラミングによるデータマイニングアルゴリズムの組み合わせ手法の改良

... そこで以前、 を用いて、各情報カテゴリをもとに して各キーワード抽出法を選択し、その時のキーワー ド抽出法の正答率を求め、正答率が一番高い情報カテ ゴリとキーワード抽出法の組み合わせを見つける手法 を提案した。 この手法では、 を用いることで 情報カテゴリに適したキーワード抽出法を自動選択し、 キーワードの抽出を行うことができる。また、適応度 関数の設計時に、キーワードの精度や数、抽出までの ...

5

エージェント技術を用いた複数データベースからのデータマイニング

エージェント技術を用いた複数データベースからのデータマイニング

... 使用したデータベースは、文献データベースと、それに関 係するシソーラスデータベースである。このうち、文献データ ベースは、非線形分野に関する研究会の予稿集から作成した。 [新美 03] 今回の実験のため、それを 2 つに分けたて実験で使 用した。また、シソーラスデータベースとして、この文献デー タベースからテキストを抜き出し 、形態素解析を行った上で、 相関の高い高頻度語を抽出し 、さらに専門家によりある程度 ...

4

PDFファイル 1G2 「機械学習の基礎」

PDFファイル 1G2 「機械学習の基礎」

... 式 (6) の最適化問題は, 2 次計画問題 (Quadratic Program- ming : QP) の一種であり, QP のソルバーを用いることによっ て解くことができるが,メモリの制限により大量のデータに 対してスケールしない.そこで, SVM の最適化手法としてよ く知られる Sequencial Minimal Optimization (SMO) を,中 立 SVM に適用する. SMO ...

4

テキストマイニング(データマイニング)技術紹介 「特技懇」誌のページ(特許庁技術懇話会 会員サイト)

テキストマイニング(データマイニング)技術紹介 「特技懇」誌のページ(特許庁技術懇話会 会員サイト)

...  多くの企業が、次の新事業の創出に苦慮する中で、 現在、保有する要素技術の強みをもとに、新たな事業 機会を模索するものである(図表12)。 と、テキストマイニング専用ソフトウェアを使って言葉 の抽出を行った場合で結果を比較したところ、100%に 近い精度で同様の集計結果が得られている。ただし、こ のわずかな差異が重要な場合もあり、テキストマイニン グでは、文章からの単語の切り出し=「形態素解析」の ...

16

SQLインジェクションと推測によるデータマイニング

SQLインジェクションと推測によるデータマイニング

... SQL インジェクション脆弱性を悪用してデータの入手を試みる方法は、帯域内、帯域外、推測の 3 つに分類される。 帯域内の手法は攻撃者とアプリケーションの間の既存のチャネルを用いてデータを取り出す。たとえば、正常な Web ページ内にデータを表示させる手法とエラーメッセージに表示させる方法がある。帯域外の手法はクライアントとアプ ...

10

PDFファイル 1G2 「機械学習の基礎」

PDFファイル 1G2 「機械学習の基礎」

... 4. まとめ 本研究では,交換モンテカルロ法を用いた,変数選択問題に おける解の効率的な全数探索手法を提案した.また,マルチヒ ストグラム法による解の個数の推定法も提案し,顔識別データ において提案手法の有効性を検証した. ...

2

Show all 10000 documents...

関連した話題