日付データYYYY-MM-DDの最初の7桁YYYY-MMでデータセットをgroupbyで集約します。 集約の演算は合計としています。
データフレームの可視化の際、データフレームそのまま操作するのではなく、ラベルでインデックスをしてpltをかける方法を説明します
二項ロジスティック回帰分析も目的変数は 1または0の配列です。Label Encoder で作成します。
1900/1/1 を起点とするEXCELのDateシリアル値をPython Datetime に変換する関数です。
生年月日(MM/DD/YY)から年齢を計算をします。文字列MM/DD/YYで年が二桁しかありません。