折角作ってもらった、data.csv
ファイルがうまくread できないで;
UnicodeDecodeError: 'utf-8' codec can't decode byte 0x83 in position 2: invalid start byte
でエラーとなった場合の対処法をメモしました。
1
2
3
4
# データの内容を無視してread する
import codecs
with codecs.open("data.csv", mode ="r", encoding ="Shift-JIS", errors="ignore") as file:
df = pd.read_csv(file, delimiter =",", header=0)
もちろん、一旦ファイルをEXCELで開いて、data.xlsx
形式にして以下のようにEXCELファイルで読み込むことも可能ですが、この場合
csv to xlsx の手作業が発生します。頻繁にデータの入れ替えをして解析する場合やチームで対応する場合は実質、EXCELで編集する方法は、無理な場合が多いと思います。
1
2
# EXCELファイルをread する
df.to_excel('data.xlsx', sheet_name='Sheet1')