以前、こちらの投稿(Wekaを起動する(決定木分析①))でWeka(:ニュージーランドのワイカト大学で開発された機械学習ソフトウェア)を用いた分析の投稿をしました。本投稿は、その記事のデータをGPTs:Data Analystを使用し決定木分析を行います。
データは、wekaにサンプルとしてインストールされている以下のデータで、(おそらく)ゴルフのplayの判断に関して、天気(outlook)、温度(temperature)、湿度(humidity)、風(windy)の気候条件による分類です。
wekaでの分析によるツリーは以下になります(C4.5アルゴリズム:wekaではJ48として使用されています)。*解説は以下の投稿を参照ください。
ChatGPTでは、生データはcsvに保存->アップし「「play」を目的に決定木分析をしてください」とのプロンプトで実行。結果がアウトプットされます。続いて「ツリーを描画できますか?」とすると以下のツリーを出力してくれます。
「?」となっても、生成AIの強みは、これを聞けることです。
「このツリーを説明してください」
また、ChatGPT(Data Analyst)が用いたのはCARTアルゴリズムで「ジニ不純度を使用して、各分割の質を評価」したとの回答がありました。
ここで、CARTアルゴリズムをGoogleで検索すると、上位に統計ソフトMInitabによる解説がヒットします。*予測分析:CART(決定木)とは?
早速、Minitabで解析すると、以下にツリーが表示されます。
*事前確率:すべてのクラスで同じ、ノード分岐:ジニ、最適木:最小誤分類コスト、モデルをテストする検証法:なし
いずれにしても、最初の分岐は「天気(outlook)」になります。
何でもできてしまうのはいいのですが。。。
生成AIの登場により、プロンプトを介して多様な作業が可能になることは、情報や技術の民主化を促進します。これは実務の世界での競争の激化をもたらす二面性を持ちます。
今後、この変化に適応するためには、「小さな経営者」として自らの専門領域において、一次情報を提供できるレベルまで継続的に学習し続けること・・・ですかね。
(関連記事)
0 件のコメント:
コメントを投稿