実務でのChatGPT(決定木分析)

2024年3月1日

データマイニング 実務でのChatGPT

t f B! P L

以前、こちらの投稿(Wekaを起動する(決定木分析①))でWeka(:ニュージーランドのワイカト大学で開発された機械学習ソフトウェア)を用いた分析の投稿をしました。本投稿は、その記事のデータをGPTs:Data Analystを使用し決定木分析を行います。



データは、wekaにサンプルとしてインストールされている以下のデータで、(おそらく)ゴルフのplayの判断に関して、天気(outlook)、温度(temperature)、湿度(humidity)、風(windy)の気候条件による分類です。


wekaでの分析によるツリーは以下になります(C4.5アルゴリズム:wekaではJ48として使用されています)。*解説は以下の投稿を参照ください。



ChatGPTでは、生データはcsvに保存->アップし「「play」を目的に決定木分析をしてください」とのプロンプトで実行。結果がアウトプットされます。続いて「ツリーを描画できますか?」とすると以下のツリーを出力してくれます。



「?」となっても、生成AIの強みは、これを聞けることです。
このツリーを説明してください


また、ChatGPT(Data Analyst)が用いたのはCARTアルゴリズムで「ジニ不純度を使用して、各分割の質を評価」したとの回答がありました。


ここで、CARTアルゴリズムをGoogleで検索すると、上位に統計ソフトMInitabによる解説がヒットします。*予測分析:CART(決定木)とは?


早速、Minitabで解析すると、以下にツリーが表示されます。
*事前確率:すべてのクラスで同じ、ノード分岐:ジニ、最適木:最小誤分類コスト、モデルをテストする検証法:なし



いずれにしても、最初の分岐は「天気(outlook)」になります。


何でもできてしまうのはいいのですが。。。


生成AIの登場により、プロンプトを介して多様な作業が可能になることは、情報や技術の民主化を促進します。これは実務の世界での競争の激化をもたらす二面性を持ちます。


今後、この変化に適応するためには、「小さな経営者」として自らの専門領域において、一次情報を提供できるレベルまで継続的に学習し続けること・・・ですかね。



(関連記事)

  --> YouTube:https://www.youtube.com/@WekaMOOC

自己紹介

自分の写真
エンジニアの視点から、品質技法、解析技術、生成AIについて発信しています。 (シックスシグマ・ブラックベルト、MBA)

このブログを検索

ブログ アーカイブ

QooQ