• 検索結果がありません。

統計解析、データマイニング

カオス文献情報からのデータマイニングによる研究動向調査

カオス文献情報からのデータマイニングによる研究動向調査

... タベースを構築する。構築したデータベースに対してテキスト マイニング手法を適用し、文献情報からキーワードを抽出す る。そして、抽出したキーワードとと書誌情報のキーワードか らキーワード解析による研究動向調査についてを検討する。本 論文では、既存の文献データベースを利用するのではなく、文 献書誌情報データベースの構築から検討することにより、より ...

6

Partek 社の NGS データ解析ソリューションは次世代シーケンサーから出力されたファイルを読み込んで 参 照ゲノム配列へのアラインメント データの品質管理 統計解析 ゲノム統合解析 生物学的解釈 各種グラフ やゲノムビューアーでの表示など NGS のデータ解析をすべてサポートします ファイルの

Partek 社の NGS データ解析ソリューションは次世代シーケンサーから出力されたファイルを読み込んで 参 照ゲノム配列へのアラインメント データの品質管理 統計解析 ゲノム統合解析 生物学的解釈 各種グラフ やゲノムビューアーでの表示など NGS のデータ解析をすべてサポートします ファイルの

... ➢ データを選択するとデータの種類に対応した解析メニューを表示 FASTQ ファイル、BAM ファイル、遺伝子ごとのリード数、変異のコール、転写因子結合部位のピークな ど選択したデータの種類に応じた解析メニューが表示されます。解析メニューを選択すると、プルダウンメ ...

12

カオス文献情報からのデータマイニングによる研究動向調査

カオス文献情報からのデータマイニングによる研究動向調査

... I35打8 │I 127.94 W 零 してまとめる必要がある。 全体的に、書誌情報からの解析のほうが、キーワー.ド抽出 処理を含んでい鞍いぶん、きれい鞍キーワードが抽出された。 キーワード抽出法や、その後のフィルタリングなどを検討する 必要がある。特に診ほかのキーワードの一部として含まれてい るキーワードが多数出力されたので、これの扱いをどうするか 検討する必要もある[r] ...

6

エージェント技術を用いた複数データベースからのデータマイニング

エージェント技術を用いた複数データベースからのデータマイニング

... データマイニングでは、単独のデ ータベースのみだけでな く、複数のデータベースを使うこともある。複数のデータベー スを使い、データマイニングを行うことにより単独でデータ ベースを用いるのと違った見方ができる可能性がある。また、 単独でデータベースを管理するよりも、分散して管理したほう が管理しやすいという利点もある。さらに 、分析する目的/対 ...

4

連載 第 5 回 医学データの統計解析の基本 生存時間データの解析 Fundamentals of statistical analysis in biomedical research:analysis of survival data 朝倉こう子 * * 濱﨑俊光 1 生物学や医学分野において

連載 第 5 回 医学データの統計解析の基本 生存時間データの解析 Fundamentals of statistical analysis in biomedical research:analysis of survival data 朝倉こう子 * * 濱﨑俊光 1 生物学や医学分野において

... 図7 のように Kaplan-Meier法に基づく生存率の推定値が描画される。この際、 「conf.int=TRUE」と指定すれば、95%信頼区間があわせて描画される。また検 定を行う場合は、survdiff関数を用い、survfit関数の場合と同様に式、群変数お よびデータを指定し実行すれば、治療群間での生存率の比較のための検定が実 行される。検定の種類を特に指定しなければ、規定値でログランク検定の結果 ...

11

日本プロ野球におけるバントの有効性 ~実データを用いたデータマイニングより~

日本プロ野球におけるバントの有効性 ~実データを用いたデータマイニングより~

... 分析 2~ディシジョン・ツリーの利用~ 今回の分析では、 VMS内のDecision Tree(デシジョンツリー)の機 能を活用することで、バント作戦が具体的にどのような場面で有効で あるのかを模索した。 1年分全試合という膨大な量のデータをツリーを 用いることで、複雑な分析過程、結果を可視化させ、そのイメージが 容易に為されることに期待してデシジョンツリーの活用を試みた。 ...

27

統計的データ解析

統計的データ解析

... 最尤法の直接利用と最小二乗法 „ 最小二乗法を使えないとき=分布が正規分布でないとき „ ビンまとめし、ヒストグラムをつくると、1ビンあたりに含ま れるデータ数が十分大きい場合、正規分布で近似できる。 この場合最小二乗法が使えるようになる。 ...

61

「IBM SPSS Modeler_予測分析ツールの基本操作  データマイニング」

「IBM SPSS Modeler_予測分析ツールの基本操作 データマイニング」

... ・IBM SPSS Modeler2 データ加工 (MD0Q2) 1. クラスタリングとアソシエーションモデルの紹介 2. クラスタリングのテクニック 3. アソシエーションルール 4. アソシエーションルールアドバンス 5. シーケンスルール ...

2

データストリームマイニングアルゴリズムの性能評価手法の検討

データストリームマイニングアルゴリズムの性能評価手法の検討

... 次に,静的なデータセットを用いてオンラインアルゴリズムを評価する場合を想定する. オンラインアルゴリズムでは,データを 1 つずつ逐次的に与えて学習を行う.そのため,オ ンラインアルゴリズムにデータを与える時,アルゴリズムに与えるデータの順番を決める必 要がある.特に順番を考えずに与える場合,データセットのインデックスに基づいてデータ ...

56

PDFファイル 3J4 「データマイニングの応用」

PDFファイル 3J4 「データマイニングの応用」

... The 28th Annual Conference of the Japanese Society for Artificial Intelligence, 2014 3J4-3 統計モデルに基づく楽曲動画の評価推移分析 An Evaluation Transition Analysis of Music Videos Based on a Statistical Model 山岸 祐己 ∗1 ...

4

PDFファイル 3J4 「データマイニングの応用」

PDFファイル 3J4 「データマイニングの応用」

... 提案手法は、被験者の万歩計データの各区間の歩数パタン の類似度から同行しているかどうかを検出し、検出された同行 の頻度に応じて人間関係の強度を定義するという手法である。 提案した手法を 31 名の被験者に試し評価した結果、本手法 ...

2

質的データ分析におけるグラウンデッドなテキストマイニング・アプローチの提案

質的データ分析におけるグラウンデッドなテキストマイニング・アプローチの提案

... に過ぎないという前提を取る。 本稿で提案する GTMA では、特に構成主義版グラウンデット・セオリー・アプローチ(Charmaz, 2000, 2006) のコード化プロセスを想定している。構成主義版グラウンデット・セオリー・アプロー チのコード化では、少なくとも 2 つの段階、つまり「初期段階のコード化(initial coding)」と 「焦点化のためのコード化(focused ...

22

遺伝的プログラミングによるデータマイニングアルゴリズムの組み合わせ手法の改良

遺伝的プログラミングによるデータマイニングアルゴリズムの組み合わせ手法の改良

... 出現頻度による抽出 形態素解析で分割された各要素単語の出現回数 頻度 を調べる。出現頻度の高い要素単語をキーワードとし て抽出する。出現頻度の高い要素単語をキーワードと して抽出するため、どんな文章からも最適なキーワー ドを抽出しやすい手法である。しかし、助詞などのキー ワードとして適切でない語を抽出する傾向があるため、 抽出後のフィルタリングが重要になる。単純な頻度を 使わずに、 を用いることもできる。これは、以 ...

5

データマイニングのための前処理アルゴリズム簡易自動選択システム

データマイニングのための前処理アルゴリズム簡易自動選択システム

... Stevens は測定の尺度を特定のクラスに分類されるという内容について報告した [17] . 測定とは,広義にはルールに従ってオブジェクトまたはイベントに数字を割り当てること として定義されている.その際に異なるルールの下で数字を割り当てることができるが,異 なる種類の尺度と異なる種類の測定によって,数字の割当に関する様々な規則,結果の尺度 ...

34

R による統計解析入門

R による統計解析入門

... ファイルデータを扱う 利用できるファイルの種類 タブ・スペースでデータが区切られたテキストファイル カンマでデータが区切られたテキストファイル (CSV ファイル ) Excel のデータ(拡張子 .xls, .xlsx ) ...

23

研究デザインと統計解析の基礎

研究デザインと統計解析の基礎

... 因に関連がない,などの相違や関連が無(= 0)に等し い状況を仮定したときに,そのデータの相違や関連がど れくらいの確率で起こるかを推定した結果である。 健常群の平均握力が 25 kg で,ある患者群の平均握力 が 23 kg だったとき,平均で 2 kg の差がある。仮に健 常群の母集団平均握力と患者群の母集団平均握力に差が ないとしても,標本の取り方によっては平均 2 kg 程度 の差は起こり得るかもしれない。この ...

7

講義のーと : データ解析のための統計モデリング. 第5回

講義のーと : データ解析のための統計モデリング. 第5回

... といったことを説明してきました.今日は統計学的な検定のハナシです. 統計学における「検定」. 「ふつーではない」講義を標榜してきましたが, 最終回ではこういうありがちな統計学教科書にくわしく説明されているよう なハナシをすることになりました.ただしこの講義らしく,最後まで「世の 中で濫用されている『検定』とは 距離をおく,疑いをもちつづける,批判的 ...

21

テキストマイニング(データマイニング)技術紹介 「特技懇」誌のページ(特許庁技術懇話会 会員サイト)

テキストマイニング(データマイニング)技術紹介 「特技懇」誌のページ(特許庁技術懇話会 会員サイト)

...  これに類似した例としては、企業において、営業情 報や、技術に関する個人レベルの知見を共通の「知」 として管理、共有する「ナレッジマネジメント」の仕 組みが挙げられる。そこでは、単に、社員一人ひとり が入力したデータをそのまま残し、蓄積するのではな く「ナレッジ・エディタ」と呼ばれる役割の担当者が、 インデックスの付与や、言葉の統一など、常にメンテ ナンスを行う「仕組み」を組み込むことで、生きた情 ...

16

Show all 9155 documents...

関連した話題