seabornはmatplotlibをベースにしたデータビジュアライゼーションライブラリです。barplot は、データの大小が、棒の高低で表されるので、データの大小を比較するのに適しています。
前回は基本seaborn barplot の棒グラフに平均値のannotationをつけるで各々のbar(棒)の値をannotationの方法について解説しました。 今回は、比較対象の各々 barを隣接させ、より大小比較を際立たせるグラフの作成を紹介します。また、Y軸をパーセント(%)表示にする方法もご紹介します。Excelの代わりにseanborn でサクサク、グラフ化の参考の第三弾になります。
seabornはmatplotlibをベースにしたデータビジュアライゼーションライブラリです。countplot はカテゴリカルデータを集計から度数分布図までを一気に行なってくれる大変便利なツールです。
前回はseaborn countplot の棒グラフに度数のannotationをつけるでcountplotで度数をannotationする方法を紹介しました。 今回は、barplot で棒グラフを作成し、各々のbarの値をannotationしたいと思います。Excelの代わりにseanborn でサクサク、グラフ化の参考の第二弾になります。
seabornはmatplotlibをベースにしたデータビジュアライゼーションライブラリです。countplot はカテゴリカルデータを集計から度数分布図までを一気に実行してくれる大変便利なツールです。
本サイトでも何度か、データビジュアライゼーションのサンプルとしてseaborn をcode を紹介してきましたが、今回は度数分布を作成するcountplot での annotation(度数) のつけ方について解説します。
法人名、部署などフォームに自由入力された表記ゆれのあるデータを集計・分析のための名寄せ作業の一環である「全角を半角に統一する」のように決められたフォーマットに変換する方法についてBlogにまとめました。フォーム入力データの統一作業の参考になれば幸いです。
テキストマイニングの定番であるKH Coder に頻出語及び複合語の抽出、排除等のコントロールをさせて。そのリストから分かち書きのテキストを再作成してWordCloudを作成するまでの手順をBlogにまとめました。