Wekaを起動し決定木分析を行い、Wekaでの結果の一部の意味を説明した(前回まで)。Wekaは種々のサイトでも説明されているので、あわせて参考にしてください。
今回は前回のアウトプットの解説の続きである。
図(クリックすると拡大されます)のように、種々の計算項が並んでいる。図中の「(Kappa statistic)κ統計量)」は一致率の検定に使用されるもので、この場合に限らず使用するものである。
図では、Confusion Matrixを示し、TP Rateなどが計算されている。これは、yes(ゴルフをする)をPositiveとした場合である。
モデルの精度に関しては、通常「Accuracy」(図ではCorrectly Classified Instances "9"の右に示される64.2857%)と呼ばれるもの示され、全データ(例は14件)中、9件(yesの場合)を正解している、というものである。
企業実務家が使用する指標はこれらである。
(Kappa statistic)κ統計量やTP Rateなどは、○○以上であればよい、という数値はない。取得しているデータの性質(趣向なのか、売れ行きなのか)により、高低があるからである。これは統計解析と異なる点である。
決定木分析は、あるデータ群において、目的変数を説明変数で分類し、傾向を把握する、というものである。
(「Wekaを起動する(決定木分析②-2)」了)
--> 次回は「交差検証法」です。
*ブログ中の図はクリックすれば、拡大されます。
*本ブログ記事の下「Labels」の「データマイニング」をクリックすると、データマイニングに関する記事が一括掲載されます。
0 件のコメント:
コメントを投稿