SkyFoxで気軽に機械学習

機械学習自動化ツール「SkyFox」の紹介ブログ

裏技① 任意の比率で学習データと評価データに分割する方法

SkyFoxのデータ分割は学習75%、評価25%で固定と書きましたが、これを任意の比率にする裏技があるので紹介させて頂きます。

 

その方法がこちら

 

アップロードするファイルに”__train__”という名前のカラムを用意しておき、学習として使いたい行には1、評価として使いたいものには0を入れておきます。

 

このカラムの位置の指定はありません。

 

こうすることでSkyFoxは自動での振り分けは行わず、このカラムの情報に従って振り分けてくれます。

 

事前にこのカラムを作っておかないといけないので手間は増えますが、どうしてもこの比率で行いたいといった場合や、学習データと評価データの指定がある場合には役立つ機能です。

 

良かったら使ってみてください!