• 検索結果がありません。

頻出パターンマイニング ある

頻出パターンマイニング

頻出パターンマイニング

... H.Mannila, H.Toivonen, and A.I.Verkamo “Discovery of Frequent Episodes in Event Sequences” Data Mining and Knowledge Discovery (1997) A C B A B A A C B A B A 重複して数えられたり… パターンが分断されたり… 無理に分割すると… ...

62

複数データベースからのエージェントベースデータマイニング

複数データベースからのエージェントベースデータマイニング

... 以前、複数のテキストデータベースを対象としたデータマ イニングにおいて、マルチエージェント技術を取り込んだ手法 を提案した。提案手法では、複数のデータベースを用いてデー タマイニングを行う際、データの入出力を を用いて記 述する。さらに、エージェントにデータベースへのアクセス、 データマイニングアルゴリズムの適用、結果の整理をそれぞれ 行わせる。これにより、複数のデータベースを用いる際の記述 ...

4

Microsoft PowerPoint 岡テキストマイニング%20提出稿[1]

Microsoft PowerPoint 岡テキストマイニング%20提出稿[1]

... 4.テキストマイニング演習 ーKH‐Coderを使ってやってみるー KH‐Coderとは • 立命館大学の樋口耕一准教授が開発した、 計量テキスト分析をグラフィカルユーザーイン ターフェイスで行えるフリーソフトウェア • R(統計解析ソフト)・chasen(形態素解析ソフ ...

12

菌類オントロジー構築に向けたマイナーターム・マイニング

菌類オントロジー構築に向けたマイナーターム・マイニング

... 今回の解析手法は単独では決して完全で はなく、単語ベースの収集であるため熟語表 現が取得できないほか、必要な専門用語が偶 然に一般語と同じ綴りで除外されてしまっ た可能性、あるいは逆に除外された一般語が 特殊な用例で専門性を帯びていた可能性も 考えられる。オントロジー構築にあたっては、 実作業の過程で検証を重ね、継続的に取捨選 択を行う必要があるだろう。 ...

8

てきた自発活動がネットワーク ダイナミクスの状態を形成している可能性が示されている. また, 神経回路網において, 特定の電極への電流刺激に対する誘発応答のパターンは類似し, ほぼ再現可能である. 他方, 異なる電極への電流刺激による誘発活動パターンは互いに異なり, パターンが分離する場合があること

てきた自発活動がネットワーク ダイナミクスの状態を形成している可能性が示されている. また, 神経回路網において, 特定の電極への電流刺激に対する誘発応答のパターンは類似し, ほぼ再現可能である. 他方, 異なる電極への電流刺激による誘発活動パターンは互いに異なり, パターンが分離する場合があること

... ペニシリン(ライフテクノロジーズ) 100 µg/ml 及び 100 unit/ml ウシ胎児血清(ライフテクノロジーズ) 5% ウマ血清(ライフテクノロジーズ) 5% 培養 24-30 日(Days In Vitro, DIV 24-30)の培 養神経回路網を電気生理学的実験に使用した.神経 回路網の構築過程における活動の安定性を解析する ため,神経自発活動パターンが完全に定常化する前 ...

6

目次 はじめに ますます増える仮想通貨 ブロックとブロックチェーン ハッシュ関数 ビットコインの取引 ( トランザクション ) ビットコインアドレスと署名 マイニング マイニング

目次 はじめに ますます増える仮想通貨 ブロックとブロックチェーン ハッシュ関数 ビットコインの取引 ( トランザクション ) ビットコインアドレスと署名 マイニング マイニング

... ビットコインのアイデアは、 Satoshi Nakamoto(以降、Satoshi 1 )により 2008 年に発表さ れた。わずか 9 ページの論文からビットコインは生まれた 2 。その後、 Satoshi が 2009 年 1 月 3 日に一番初めのブロック(#0:genesis ブロックとも呼ばれる)を生成し、その次の ブロック( #1)は 1 月 9 日に生成された。ビットコインではブロックチェーン技術を使っ ...

49

PDFファイル 4A1 「テキストマイニング」

PDFファイル 4A1 「テキストマイニング」

... り入れた指標であり,各トピックの生成確率を TF 値,文書 ( トピック ) 頻度を DF 値とみなして,特徴量を算出するスコ アである . この指標を用いることで複数のトピックに出現して いる単語の重みが下がり,上記の分析結果よりも各トピックを 推定しやすくなると期待される . term-score を用いて対象コ ...

4

PDFファイル 1A3 「テキストマイニング」

PDFファイル 1A3 「テキストマイニング」

... 1. はじめに 近年, ビッグデータを収集・分析して社会問題の解決, マー ケティング戦略立案や業務改善などのビジネスに活かす取り 組みが急速に拡がっており, ソーシャルメディアはその情報源 のひとつとして注目されている. 代表的なソーシャルメディア である Twitter では, ユーザーは 140 文字以内のツイートと呼 ばれるメッセージを使い, 日々の生活体験や思いを投稿できる. ...

2

PDFファイル 4A1 「テキストマイニング」

PDFファイル 4A1 「テキストマイニング」

... , 頻出度が高いものほど音象徴を強 調し , また , そのパターンの長さが長いほど特異的なパターンあると考えられる ..., 頻出度最大の同音反復パターン を最大頻度同音反復パターン , 長さ最大の同音反復パターンを 最大長同音反復パターンと定義する ...

4

PDFファイル 4A1 「テキストマイニング」

PDFファイル 4A1 「テキストマイニング」

... 2. 関連研究 評価視点の構造化の関連研究として Carenini らの研究があ る [Carenini 05] 。 Carenini らは User-defined-features という ユーザが定義した木構造を用意し、評価視点をこの木構造の 各ノードに割り振るというクラス分類問題として扱った。この 手法では、入力として木構造を与える必要がある。また、どの ノードにも当てはまらない評価視点が出現したとしても、いず ...

4

PDFファイル 4A1 「テキストマイニング」

PDFファイル 4A1 「テキストマイニング」

... Twitter 特有の単語を扱うために,行動を表す単語を集めた辞 書を構築し,この辞書を用いて行動情報を抽出する手法を提案 [ 矢野 13] した.しかしこの手法では,人手で行動を表す単語 を選択するため,手間がかかるという問題点がある.そこで本 研究では,文字 n-gram 法により文章を特徴化し,行動を表す 投稿を分類することで,少ない手間で行動情報を抽出する。 ...

2

PDFファイル 1A3 「テキストマイニング」

PDFファイル 1A3 「テキストマイニング」

... 学技術文献データ数が多かった.医学分野は,他の分野に比べ ると多くの分野に細分化されるため,分野ごとの論文件数で みると数が少なくなることが原因の一つであると考えられる. ただし,どの分野をどれだけ細分化するかはカテゴリ設計者の 観点によるため,一つの文献に対し複数のカテゴリを付与し, 分析を行う必要がある. ...

4

PDFファイル 3J3 「データマイニングの基礎」

PDFファイル 3J3 「データマイニングの基礎」

... めに,ここでは j-core と記す. ここで,注意すべき点として,極大な j- 核性連結 k-Plex は 必ずしも極大連結 k-Plex とは限らないことである.このこと は, j- 核性制約により,連結 k-Plex に追加可能な候補がさら に絞りこまれることを示唆しており,次節で詳しく論じる. ...

3

データストリームマイニングアルゴリズムの性能評価手法の検討

データストリームマイニングアルゴリズムの性能評価手法の検討

... データストリームを対象としたアルゴリズムを評価する場合,最も望ましいのはデータス トリームを使用することである.しかし,データストリームを用いる場合は前処理に十分な 時間を割くことが出来ないという問題や,データストリームを調達してくるのが難しいとい う問題が存在する.アルゴリズムを評価する際,重要なのはアルゴリズムであってデータで はない.そのため,データは軽視されがちであり,データストリームを対象としたアルゴリ ...

56

PDFファイル 3J4 「データマイニングの応用」

PDFファイル 3J4 「データマイニングの応用」

... The 28th Annual Conference of the Japanese Society for Artificial Intelligence, 2014 を動画の評価指標として認めつつも,動画の再生数からその信 頼性を割り出す必要があることが分かる.さらに,再生数とマ イリスト率の両方を考慮した評価値は,動画の話題性や集客能 力に左右されないということも期待できる. ...

4

PDFファイル 3J4 「データマイニングの応用」

PDFファイル 3J4 「データマイニングの応用」

... 同行とは、 2 人で一緒に歩く行為を指す。たとえば、一緒に 会議に参加したり、食事をしたり、運動をしたり、といった行 為である。通常は互いに一分間の歩数や歩調の異なる 2 人で も、同行時は互いの歩調を合わせ、また歩き始めや歩き終わり ...

2

PDFファイル 3J3 「データマイニングの基礎」

PDFファイル 3J3 「データマイニングの基礎」

... 複合非負値行列因子分解 (NM2F: Non-negative Multiple Matrix Factorizaion) とは , インデクス対応が取れる複数の非 負行列を非負の因子行列に同時分解する手法である [7]. NM2F のキーアイディアは同一のインデクスに対して同一の因子行列 を仮定することである . NM2F は , 1 つの観測データと 2 つの ...

4

PDFファイル 3J3 「データマイニングの基礎」

PDFファイル 3J3 「データマイニングの基礎」

... 上記の ¬X はアイテム集合の否定表現であり , 負アイテム 集合と呼ぶ . 負アイテム集合内のアイテムは論理積で関係づけ られているとする . つまり , X ⇒ ¬{a, b} は X ⇒ ¬(a ∧ b) と 解釈し , 「 X が出現する場合 , a, b のどちらか一方は出現しな いことが多い」を表していると考える . X ⇒ (¬a ∨ ¬b) と変 形できるので , 否定和形と呼ぶ . 否定和形の負ルールの支持度 は , ...

4

PDFファイル 3J3 「データマイニングの基礎」

PDFファイル 3J3 「データマイニングの基礎」

... に σ 2 を自動で決定する方法を提案する.文献 [Pelleg 00] で は,代表的なクラスタリング手法の一つである K-means 法に おいて,ベイズ情報量規準( Bayesian Information Criterion: BIC ) [Schwarz 78] を用いて最適なクラスタ数を決定する手法 として, X -means 法が提案されている. BIC は以下の式で表 される. ...

2

2F5-OS-01b-3 意味ネットワークの探索と系列パターンマイニングによる想起の類型化

2F5-OS-01b-3 意味ネットワークの探索と系列パターンマイニングによる想起の類型化

... 規模言語知識に関連付けて分析することにより,想起の背景に ある概念連鎖のパターンを探る.より具体的には,起点概念 とターゲット概念を結ぶ意味ネットワークにおける経路を収集 し,これらの経路群に対して系列パターンマイニングの手法を 適用することにより,顕著な概念連鎖を分析する.以上の結果 として,想起をもたらす概念連鎖に関する知見が得られれば, ...

4

Show all 10000 documents...

関連した話題