Wekaを起動する（ニューラルネット）-社会人MBA

今回はニューラルネットで、これは、神経系機能のモデル化を行い、予測などに用いられる。やはり、習うより慣れろで、使用法から紹介する。

分析用のファイルをPreprocess:Open file...から呼び込み、Classify:MultilayerPerceptronを選択する。このファイルは、以下で、wekaをインストールしたときに、添付されているweather.arffをcsv形式に変換し修正保存したもので（この方法は以前のブログを参照してください）、赤字の部分を加筆しており、予測したい部分は"?"を入力している。

Cross-validationのFolds数を10のままにして、More options...でOutput predictionsをチェックしOK。目的の因子に(Nom)playとなっていることを確認し（"Start"のすぐ上の欄）、分析を"Start"をクリックする。

これまでの投稿のように、ここまでで分析は終了している。

outputの欄を見ると、

...
...
2 ? 　2:yes 　+ 　0.327 *0.673
...
Correctly Classified Instances　12　85.7143 %
...
...
と表示されている（...はアウトプットされている項目を省略しています）。
結論的には、ニューラルネットによる予測は"yes"と分析されたのである。

ちなみに、図のようにGUIによりinput、outputなど層やノードの様子を観察できるセッティングもある。

上図での○（：ノード）では、inputからの情報を結合関数により結合し、次へ出力する。この際の出力関数はtanhに類似しているものである（ある地点から急激に変化が起こる様相、例）化学の滴定の実験のイメージ）。

どのような設定が最もふさわしいかは、分析のデータによるので、法則はない。種々のパラメーターの設定を変更し、Correctly Classified Instances の％での評価となる。

化学系の方がよく理解されている交互作用の存在は、統計解析では不十分である。完全な分析方法は存在しないが、種々の積み上げてきた実験を統合的に分析するのは、ニューラルネットは有効である。

データマイニングを使用し得た結果は、最後ではない。リーチなのである。その結果から、どのように実験をおこなう、陳列を変更する、広告方法を変更する、などの戦略の参考になるのである。従って、ビジネススクールの講義にも大学が準備するのである。

<参考>「重み」とは、何なのか？
分析の応答因子は次の3つの目的で予測される。大きな値が望ましい（望大特性）、逆の望小特性、ある値が望ましい望目特性である。この際に、分析に関する誤差をどうするかが「重み」である。例えば、ある値100に近いことを目的にしている場合、100付近の値周辺では誤差は小さいほうがいい（50や60、150や160付近の誤差に比べて）。

（「Wekaを起動する（ニューラルネット）」了）
--> 次回は「一度に複数の分析を行う」です。

＊ブログ中の図はクリックすれば、拡大されます。
＊本ブログ記事の下「Labels」の「データマイニング」をクリックすると、データマイニングに関する記事が一括掲載されます。

Wekaを起動する（ニューラルネット）

0 件のコメント:

コメントを投稿

自己紹介

MBA技術者の視点

このブログを検索

ラベル

ブログアーカイブ