今回はニューラルネットで、これは、神経系機能のモデル化を行い、予測などに用いられる。やはり、習うより慣れろで、使用法から紹介する。
分析用のファイルをPreprocess:Open file...から呼び込み、Classify:MultilayerPerceptronを選択する。このファイルは、以下で、wekaをインストールしたときに、添付されているweather.arffをcsv形式に変換し修正保存したもので(この方法は以前のブログを参照してください)、赤字の部分を加筆しており、予測したい部分は"?"を入力している。
Cross-validationのFolds数を10のままにして、More options...でOutput predictionsをチェックしOK。目的の因子に(Nom)playとなっていることを確認し("Start"のすぐ上の欄)、分析を"Start"をクリックする。
これまでの投稿のように、ここまでで分析は終了している。
outputの欄を見ると、
...
...
2 ? 2:yes + 0.327 *0.673
...
Correctly Classified Instances 12 85.7143 %
...
...
と表示されている(...はアウトプットされている項目を省略しています)。
結論的には、ニューラルネットによる予測は"yes"と分析されたのである。
ちなみに、図のようにGUIによりinput、outputなど層やノードの様子を観察できるセッティングもある。
上図での○(:ノード)では、inputからの情報を結合関数により結合し、次へ出力する。この際の出力関数はtanhに類似しているものである(ある地点から急激に変化が起こる様相、例)化学の滴定の実験のイメージ)。
どのような設定が最もふさわしいかは、分析のデータによるので、法則はない。種々のパラメーターの設定を変更し、Correctly Classified Instances の%での評価となる。
化学系の方がよく理解されている交互作用の存在は、統計解析では不十分である。完全な分析方法は存在しないが、種々の積み上げてきた実験を統合的に分析するのは、ニューラルネットは有効である。
データマイニングを使用し得た結果は、最後ではない。リーチなのである。その結果から、どのように実験をおこなう、陳列を変更する、広告方法を変更する、などの戦略の参考になるのである。従って、ビジネススクールの講義にも大学が準備するのである。
<参考>「重み」とは、何なのか?
分析の応答因子は次の3つの目的で予測される。大きな値が望ましい(望大特性)、逆の望小特性、ある値が望ましい望目特性である。この際に、分析に関する誤差をどうするかが「重み」である。例えば、ある値100に近いことを目的にしている場合、100付近の値周辺では誤差は小さいほうがいい(50や60、150や160付近の誤差に比べて)。
(「Wekaを起動する(ニューラルネット)」了)
--> 次回は「一度に複数の分析を行う」です。
*ブログ中の図はクリックすれば、拡大されます。
*本ブログ記事の下「Labels」の「データマイニング」をクリックすると、データマイニングに関する記事が一括掲載されます。
0 件のコメント:
コメントを投稿