Python と SPSS® Modeler で XGBoost の特徴量選択を比較する
特徴量選択(feature selection)= 「どれを説明変数として使うか」は、データ分析では重要です。このBlogでは、特徴量選択についてXGBoostのアルゴリズムでSPSS® Modeler の特徴量選択とPython Scikit-Learnの結果を比較してみたいと思います。
特徴量選択(feature selection)= 「どれを説明変数として使うか」は、データ分析では重要です。このBlogでは、特徴量選択についてXGBoostのアルゴリズムでSPSS® Modeler の特徴量選択とPython Scikit-Learnの結果を比較してみたいと思います。
アピアランスパネルは、オブジェクトの実体は同じままで、見た目を変えるものです。イラストレーターの数ある機能の中で押さえておくべアピアランス機能にいて説明します。
カテゴリカルデータの個数、構成比率、トータル行を集計、整形する方法をまとめました。 データフレームの特定の列(例:部門)ごとに、❶件数(何件あるか)、❷構成比(全体のうち何%か)を出して、 後で加工しやすい「表(データフレーム)」の形にまと、ついでに合計(Total)行も付けるためのスクリプトをまとめました。
日付の新しい方を残す重複排除やり方をまとめました。重複排除するルールとして、❶新しいものを残す。❷古い方を残す。といった一工夫が必要な場合があります。そのステップをまとめました。
このブログではデータハンドリングの基本である、DataFrame, ndarray, list の形式変換について「DataFrame, ndarray, list の使い分けについて実用的に考える」という問いに対してブログにしました。