データマイニングは統計解析と異なり、最適解ではなく、満足解である。
「ビール」と「おむつ」が「金曜日」に売れている、という有名なルールの発見は、統計解析のように有意差がある、ないの問題とは異なる。
数%支持されているだけでも、その(分析対象)データは数万いや数十万のデータをもとに発見しているルールなので、その店の店主やマネージャーは、ビールとおむつを近くに陳列するのか、なるべく顧客が店内を歩くように配列するのか、はたまた、どちらかを目玉商品に据え、来店を促すのか、分析結果を受けての行動は様々であることが考えられる。
取り上げた書籍は、データマイニングソフトWEKAの解説書である。たいていの場合、データマイニングのソフト導入は高額で、いかにも高級な分析を思わせるが、WEKAはWaikato大学が開発したフリーウェアである。(*Downloadクリック後、weka-3-4-8a.exe(JAVA含まず)weka-3-4-8ajre.exe(JAVAのインストールも含む))
解説書の和訳はないが、多くのサイトで使用法や成り立ちが解説されているので、検索すれば、たいていの使用法は把握できる。
私は社会人MBAコースでこれを習ったが、たいていの大学には科目履修生の制度を設けているので、あらかじめ、どのような講義かを調べておき、講義終了後(卒業後)もライセンスの縛りがなく使用できることを考慮している講義であれば(いわゆる秀逸なフリーウェアを使用していれば)、お買い得である。
科目履修生は確かに1科目につき数万するが、「日本語で、使いやすく、画面操作もわかりやすく、サポートも充実しているソフトウェア」はオーダーが2,3つことなる価格であることを考えると・・・である。
・・・それで目的が達せられるのであれば、安いことにこしたことはない。
0 件のコメント:
コメントを投稿