Excelデータをpythonで集計

python

基本

1つのフォルダに3つのファイルが入っている時に
必要な行と列だけに編集して

ライブラリの準備

import pandas as pd    #表計算形式のファイルを操作しやすくする
import os              #フォルダの操作をする

ファルダの移動

集計をしたいフォルダに移動します。今回は下記フォルダに集計したファイルがある場合です。

C → user → ユーザー名 → Desktop → python  

os.chdir でフォルダを移動します。

os.chdir("C:/Users/nozawa/Desktop/python")

Excelファイルの呼び出し

Excelファイル(*.xlsx)の場合

変数dfにExcelファイルの内容を取り込みます。今回はsheetを指定していないので
一番左側のsheetの内容が取り込まれます。

df = pd.read_excel("発注見込み-t.xlsx")

csvファイルの場合

変数dfにExcelファイルの内容を取り込みます。今回はsheetを指定していないので
一番左側のsheetの内容が取り込まれます。

df = pd.read_csv(file_name_1)

文字化けを起こす時は引数に「encoding」を追加して文字コードを指定します

df = pd.read_csv(file_name_1,encoding="shift-jis")

または

df = pd.read_csv(file_name_1,encoding="cp932")

CSVファイルや複数のファイルを取り込むときはこちらからです。

列の削除

必要な列のみを残す方法

1つの列のみを抽出

列「waiting」「kind」の2列のみにする

df = df[["waiting","kind"]]
df.head(5)
#結果
     waiting	kind
0	79	long
1	54	short
2	74	long
3	62	short
4	85	long

セルからの文字の取り出し

ファイルの保存

  • 表形式のファイルの呼び出し
  • 列の削除
  • 行の削除
  • セルからの文字列の抽出
  • ファイルの保存

コメント

タイトルとURLをコピーしました