Recent posts

Python と SPSS® Modeler で XGBoost の特徴量選択を比較する

1 minute read

特徴量選択(feature selection)= 「どれを説明変数として使うか」は、データ分析では重要です。このBlogでは、特徴量選択についてXGBoostのアルゴリズムでSPSS® Modeler の特徴量選択とPython Scikit-Learnの結果を比較してみたいと思います。

イラレのアピアランスパネルを理解する

less than 1 minute read

アピアランスパネルは、オブジェクトの実体は同じままで、見た目を変えるものです。イラストレーターの数ある機能の中で押さえておくべアピアランス機能にいて説明します。

カテゴリカルデータの個数、構成比率、トータル行を集計、整形する

less than 1 minute read

カテゴリカルデータの個数、構成比率、トータル行を集計、整形する方法をまとめました。 データフレームの特定の列(例:部門)ごとに、❶件数(何件あるか)、❷構成比(全体のうち何%か)を出して、 後で加工しやすい「表(データフレーム)」の形にまと、ついでに合計(Total)行も付けるためのスクリプトをまとめました。

【Pandas】日付の新しい方を残す重複排除

less than 1 minute read

日付の新しい方を残す重複排除やり方をまとめました。重複排除するルールとして、❶新しいものを残す。❷古い方を残す。といった一工夫が必要な場合があります。そのステップをまとめました。