Wekaを起動する(決定木分析②-2)。

2007年8月21日

データマイニング

t f B! P L
Wekaを起動し決定木分析を行い、Wekaでの結果の一部の意味を説明した(前回まで)。Wekaは種々のサイトでも説明されているので、あわせて参考にしてください。

今回は前回のアウトプットの解説の続きである。



図(クリックすると拡大されます)のように、種々の計算項が並んでいる。図中の「(Kappa statistic)κ統計量)」は一致率の検定に使用されるもので、この場合に限らず使用するものである。

図では、Confusion Matrixを示し、TP Rateなどが計算されている。これは、yes(ゴルフをする)をPositiveとした場合である。
モデルの精度に関しては、通常「Accuracy」(図ではCorrectly Classified Instances "9"の右に示される64.2857%)と呼ばれるもの示され、全データ(例は14件)中、9件(yesの場合)を正解している、というものである。

企業実務家が使用する指標はこれらである。

(Kappa statistic)κ統計量やTP Rateなどは、○○以上であればよい、という数値はない。取得しているデータの性質(趣向なのか、売れ行きなのか)により、高低があるからである。これは統計解析と異なる点である。

決定木分析は、あるデータ群において、目的変数を説明変数で分類し、傾向を把握する、というものである。

(「Wekaを起動する(決定木分析②-2)」了)
--> 次回は「交差検証法」です。

*ブログ中の図はクリックすれば、拡大されます。
*本ブログ記事の下「Labels」の「データマイニング」をクリックすると、データマイニングに関する記事が一括掲載されます。

自己紹介

自分の写真
エンジニアの視点から、品質技法、解析技術、生成AIについて発信しています。 (シックスシグマ・ブラックベルト、MBA)

このブログを検索

ブログ アーカイブ

QooQ