今回は、Pythonのデータ解析ライブラリ「Pandas」を使用してMicrosoft Excelファイルを新規に作成する方法、必要な追加ライブラリのインストール方法、スクリプトのサンプルと実行方法を説明する。また、データを含んだExcelファイルの作成、ヘッダを含めないExcelファイルの作成など、Pandasのちょっとした応用例も紹介する。
初心者でも簡単にExcelファイル操作を学べるようにまとめているので、試してもらえれば幸いだ。
Visual Studio Codeの使い方
今回は最初の取り組みとして、PythonスクリプトからMicrosoft Excelファイルを生成するところを説明する。
Visual Studio Code (以降、VSCode)の操作方法を説明に含めると冗長になるので、最初に必要になる操作方法をまとめておく。
操作 | メニュー | ショートカットキー |
---|---|---|
ファイルの新規作成 その1 | 「File」→「New File」オススメ | 「Ctrl」+「Alt」+「Win」+「N」 |
ファイルの新規作成 その2 | 「File」→「New Text File」 | 「Ctrl」+「N」 |
「File」→「Save」 | 「Ctrl」+「S」 | |
ファイルの保存 | 「File」→「Save」 | 「Ctrl」+「S」オススメ |
コードの実行 | 「Run」→「Run Without Debugging」 | 「Ctrl」+「F5」オススメ |
覚えておくと便利な操作には「オススメ」と記入しておいた。
VSCodeには多くのショートカットキーが用意されており、カスタマイズもできる。しかしそのすべてを覚えておくことはできないので、特によく使うショートカットキーだけは覚えるようにしておきたい。必須だが使用頻度が低い操作はメニューから、頻繁に使うが覚えにくいものについてはコマンドパレットを使うなどの方法で効率的な操作をしていこう。
Pandasをインストール
PythonからMicrosoft Excelファイルを読み込んだり編集したりするためのライブラリは複数ある。最初は人気が高い「Pandas」を使う方法を取り上げる。
Pandasは、次のようにpipコマンドを実行してインストールする。
Pandasをインストール
pip install pandas
ここでは上記スクリーンショットのようにpandas以外に依存関係でpytz、tzdata、six、numpy、python-dateutilもインストールされていることがわかる。
Microsoft Excelファイルを新規作成するPythonスクリプトを作成
Pandaを使ってMicrosoft Excelファイルを新規作成するPythonスクリプトを作成する。ここではpandas_create_1.pyというファイルでスクリプトを用意した。
pandas_create_1.pyファイル
import pandas as pd
# 空データを用意
data = {
'': ['']
}
# データフレームを作成
df = pd.DataFrame(data)
# Microsoft Excelファイルに出力
xlsx_path = 'サンプルファイル.xlsx'
df.to_excel(xlsx_path, index=False)
print(f'「{xlsx_path}」に保存しました。'
上記のスクリプトで空のMicrosoft Excelファイルを生成している。空のデータから新規Microsoft Excelファイルを作る内容になっている。
不足しているライブラリを追加インストール
pandas_create_1.pyを実行すると、次のようなエラーが表示されて実行に失敗する。
表示されるエラーメッセージには、「openpyxl」というモジュールが存在しないということが書いてある。PandasのDataFrame.to_excel()でファイルに出力するためにはopenpyxlが必要だが、これがインストールされていないのが失敗の原因であることがわかる。
早速、このモジュールを次のようにしてインストールする。
openpyxlモジュールをインストール
pip install openpyxl
これで準備は完成だ。