決定木の分類ルールセットを編集して予測する方法|R

R
この記事は約3分で読めます。

ナバ
ナバ

こんにちは!

IT企業でデータ分析をしています、ナバです。

この記事では、決定木モデルの分類ルールセットを編集する方法をご紹介します。

決定木でテストデータの予測を行う前に、訓練データから派生した分類ルールセットを編集したい場合に役立ちます。

スポンサーリンク

RのC50でルールセットを編集する

Rには決定木のパッケージが多数あります。

パッケージ「C50」であれば、下記の手順によって、ユーザーが編集したルールセットを予測に適用できます。

【編集したルールセットを予測に適用する手順】

①訓練データから派生したルールセットをファイル出力

②ファイル内のルールセットを編集

③編集済みのルールセットをRにインポートして予測

以下、サンプルコードです。

install.packages("C50")
library(C50)

data(churn) #顧客離れのデータ

ruleModel <- C5.0(churn ~ ., data = churnTrain, rules = TRUE) #訓練データでルールセット構築

summary(ruleModel)  #ルールセットを表示

ruleText = ruleModel$rules  #ルールセットをオブジェクトに格納

write(ruleText, file="ruleText.txt")  #ファイル出力(ファイル上でルールセット編集)

ruleModel$rules = ""  #ルールを空にする

ruleText = paste(readLines("ruleText.txt"),collapse="\n") #編集済みルールセットをインポート

ruleModel$rules=ruleText  #新しいルールセットを決定木モデルに適用

predict(ruleModel,newdata=churnTest)    #新しいルールセットによる予測

ルールセットの見方は以下の通りです。

決定木についてもっと詳しく知りたい方はこちら!

スポンサーリンク

データ分析について学びたい方にオススメの講座

【DataMix】データサイエンティスト育成コース

この講座は、未経験の方であってもデータサイエンティストのエントリー職として仕事に就けるレベルにまで引き上げることを目的とした講座です。

データサイエンティストに必要な知識やスキル、考え方を実践的に学ぶことができる約6か月間のプログラムです。

【DataMix】データサイエンティスト育成コースで学べる知識・スキル

・機械学習・統計学に関する基礎知識
・PythonとRによるプログラミング
・自然言語処理
・画像処理(Deep Learning)
・データサイエンスPJの進め方

コメント

タイトルとURLをコピーしました