Wekaを起動する(ニューラルネット)

2007年9月9日

データマイニング

t f B! P L
今回はニューラルネットで、これは、神経系機能のモデル化を行い、予測などに用いられる。やはり、習うより慣れろで、使用法から紹介する。

分析用のファイルをPreprocess:Open file...から呼び込み、Classify:MultilayerPerceptronを選択する。このファイルは、以下で、wekaをインストールしたときに、添付されているweather.arffをcsv形式に変換し修正保存したもので(この方法は以前のブログを参照してください)、赤字の部分を加筆しており、予測したい部分は"?"を入力している。





Cross-validationのFolds数を10のままにして、More options...でOutput predictionsをチェックしOK。目的の因子に(Nom)playとなっていることを確認し("Start"のすぐ上の欄)、分析を"Start"をクリックする。


これまでの投稿のように、ここまでで分析は終了している。

outputの欄を見ると、

...
...
2 ?  2:yes  +  0.327 *0.673
...
Correctly Classified Instances 12 85.7143 %
...
...
と表示されている(...はアウトプットされている項目を省略しています)。
結論的には、ニューラルネットによる予測は"yes"と分析されたのである。

ちなみに、図のようにGUIによりinput、outputなど層やノードの様子を観察できるセッティングもある。




上図での○(:ノード)では、inputからの情報を結合関数により結合し、次へ出力する。この際の出力関数はtanhに類似しているものである(ある地点から急激に変化が起こる様相、例)化学の滴定の実験のイメージ)。

どのような設定が最もふさわしいかは、分析のデータによるので、法則はない。種々のパラメーターの設定を変更し、Correctly Classified Instances の%での評価となる。

化学系の方がよく理解されている交互作用の存在は、統計解析では不十分である。完全な分析方法は存在しないが、種々の積み上げてきた実験を統合的に分析するのは、ニューラルネットは有効である。

データマイニングを使用し得た結果は、最後ではない。リーチなのである。その結果から、どのように実験をおこなう、陳列を変更する、広告方法を変更する、などの戦略の参考になるのである。従って、ビジネススクールの講義にも大学が準備するのである。


<参考>「重み」とは、何なのか?
分析の応答因子は次の3つの目的で予測される。大きな値が望ましい(望大特性)、逆の望小特性、ある値が望ましい望目特性である。この際に、分析に関する誤差をどうするかが「重み」である。例えば、ある値100に近いことを目的にしている場合、100付近の値周辺では誤差は小さいほうがいい(50や60、150や160付近の誤差に比べて)。

(「Wekaを起動する(ニューラルネット)」了)
--> 次回は「一度に複数の分析を行う」です。

*ブログ中の図はクリックすれば、拡大されます。
*本ブログ記事の下「Labels」の「データマイニング」をクリックすると、データマイニングに関する記事が一括掲載されます。

自己紹介

自分の写真
エンジニアの視点から、品質技法、解析技術、生成AIについて発信しています。 (シックスシグマ・ブラックベルト、MBA)

このブログを検索

ブログ アーカイブ

QooQ