この際に、上図のcsvファイルで"?"を入力した行を複数にして、実験計画法で設定 した因子を設定しておけば、これまでの実験から導き出されるルールをもとにシミュレ ーションしたことになる。
結果を見て?であれば、新たな実験を行うであろうし、議論すべき結果があれば議論 するであろうし、シミュレーションはリソース(実験に伴う費用、人件費など)はほぼ皆 無なので、無駄なく先に進めると考えてよい(私も100通りほどの実験結果から仕様 を決定する際は実際にこの方法で決定した)。
・・・研究開発に「魔法」は存在しないが、工夫は出来るものである。
(「Wekaを起動する(補足 研究開発部門での使用)」了)
適宜気づいたことを掲載します。
このシリーズの最後に・・・
「データマイニング」シリーズも今回で最後になります。従来のコンセプトどおり、ほぼ 無料です(書籍代+ネット料金)。ネットで検索すれば、善意の利用者が多くのサイト に使用法を掲載していますし、海外のサイトにおいても多くの記事やファイルを無料 で手に入れることも出来ます。
データマイニングは「少しやってみよう」にもあまりにも高額ですが、わかってしまえば、
ほとんど無料で「だいたいのこと」が出来てしまいます。PCが発達した現在では、企 業実務において、ほとんどが分析可能になってくると思われますが(分析により時間 がかかるものもあります)、膨大な顧客のデータ、膨大なアイテム数となれば、分析は 同様に可能ですが、維持管理していくシステムは各企業の考え方によります。
高額なコストを支払える企業は、外部に任せてもいいのでしょうが、やはり、分析のシ ステムを知っていれば、価格交渉において有利に働くに違いありません。
そういったビジネス上の意味で、本ブログが「データマイニング」を知る上での入り口 になれば幸いです。
関連リンク
○本ブログの記事
http://tech-d.blogspot.com/search/label/%E3%83%87%E3%83%BC%E3%82%B F%E3%83%9E%E3%82%A4%E3%83%8B%E3%83%B3%E3%82%B 0)
○本ブログより内容の深いブログ
データマイニング・WEKA(http://blogs.yahoo.co.jp/pironotakarabako)
○総合サイト
朱鷺の杜Wiki−情報論的学習理論と機械学習に関するページ
(http://ibisforest.org/index.php?FrontPage)
*このページの"検索"にて"weka"を入力すると、多くの関連ページも表示されます。
WEKAの日本語情報サイト(http://www.weka-jp.info/) kdnuggets−マイニングのポータルサイト(英語)
(http://www.kdnuggets.com/index.html)
○ソフトウェア
WEKA−Machine Learning Project(http://www.cs.waikato.ac.nz/ml/)
*このページヘッドの"software"をクリックし、左の"Download"からwekaをダウ ンロードできます。
TeraPad−シンプルなSDIタイプのテキストエディタのダウンロードページ
(http://www5f.biglobe.ne.jp/~t-susumu/library/tpad.html)
○各種分析に関する
WEKA と樹木(決定木)モデルに関しての説明
(http://www1.doshisha.ac.jp/~mjin/R/20.pdf)
アソシエーション分析の報告(同志社大学 金明哲教授)
(http://www1.doshisha.ac.jp/~mjin/R/200611_40.pdf)
相関ルールの分析が行えるフリーソフトaprioriがダウンロードできるページ κ
統計量の説明(http://aoki2.si.gunma-u.ac.jp/lecture/Kappa/kappa.html) 交差検証法の説明
(http://musashi.sourceforge.jp/tutorial/mining/xtclassify/accuracy.ht ml)