今回は、wekaで記憶ベース推論を取り扱う。
最近傍アプローチは、過去に経験した類似の状況を元に分析を行う手法。分類、推定、予測などの問題を解くために用いられるもので、そのなかの:
①記憶ベース推論とは、過去に起こった事例に基づいて次に起こる事象を予測する場合などに用いられる。
例1)過去の不正のパターンに類似する傾向を発見する。
例2)過去の反応した顧客のパターンより次に反応しやすい顧客を特定する。
例3)過去に効果があった治療法が類似している特徴の患者に効果的。
②協調フィルタリングは、ある人に類似した人の好みを利用して、その人の好みを予測する場合などに用いられる。
例1)Amazonの書籍推薦など(「この商品を買った人はこんな商品も買っています」のあれです)。
とにかく、前回同様、「習うより慣れろ」である。
データは以下をCSV形式にて作成した。
ある顧客の番号、性別、年齢、収入のデータがあり、それぞれの購入可否(yes or no)を示しており、図中、赤で示した顧客がyesなのかnoなのか予測する。予測の項目には"?"を入力する。
分析は、まず、Preprocess:Open files...でファイルを読み込み、Classify:lazy:IBkを選択。More optios..をクリックし、Output predictionsを選択し"OK"。分析の設定は図のように設定し、"Test option"はデータ数の関係から、"Use training set"を選択し"start"。
すると、下の画面のアウトプットが現れ、予測は"yes"であることがわかる。
次回は分析を若干解説します。
(「Wekaを起動する(記憶ベース推論①)」了)
--> 次回は「記憶ベース推論分析の解説」です。
*ブログ中の図はクリックすれば、拡大されます。
*本ブログ記事の下「Labels」の「データマイニング」をクリックすると、データマイニングに関する記事が一括掲載されます。
0 件のコメント:
コメントを投稿