前回、「半角文字を全角文字に変換する」という前処理のために使えそうなライブラリを調べ、「jaconv」というパッケージが見つかったものの、Pythonの標準ライブラリには存在しないことがわかりました。
そこで今回は、サードパーティ製のライブラリを公開している「Python Package Index (PyPI)」にjaconvが登録されているかどうかを調べるところから始めたいと思います。
PyPIでライブラリを探す
では早速、jaconvがPyPIに登録されているかどうかを調べてみましょう。PyPIのサイトのトップページの検索ボックスでjaconvを検索してみます。
すると「jaconv 0.2.4」というパッケージが登録されていることがわかりました。では、jaconvのページに移動し、パッケージの内容を確認してみます。
「Usage」を見ると、どうやら半角文字を全角文字に変換できるようです。では早速、インストールしてみたいと思います。
pipコマンドを使ってみよう
パッケージのインストールには、コマンドプロンプトから「pip」というPythonパッケージを管理するコマンドを利用します。インストールには「pip install」に続けてインストールするパッケージ名(今回はjaconv)を指定します。それでは実行してみましょう。
$ pip install jaconv
Collecting jaconv
Downloading https://files.pythonhosted.org/packages/b0/9e/cf1353fb3e81a177bb52ca59a0ebee425f084b7298039a7965c5414d2d62/jaconv-0.2.4.tar.gz
Installing collected packages: jaconv
Running setup.py install for jaconv ... done
Successfully installed jaconv-0.2.4
ご覧の通り、「Successfully installed jaconv-0.2.4」と表示されました。「pip list」コマンドでインストールされているパッケージを表示できるので、本当にインストールできたかどうか確認してみましょう。
$ pip list
Package Version
---------- -------
jaconv 0.2.4
pip 18.1
setuptools 40.6.2
パッケージ一覧の中にjaconvがあることから、インストールできていることがわかりますね! これで、パッケージを利用する準備が整いました。次はjaconvの使い方を調べてみましょう。
Pythonの標準ライブラリの場合、使い方を知る方法として「ライブラリーリファレンス」を参照しましたが、サードパーティ製ライブラリの場合はPyPIのパッケージのページ、もしくはパッケージのホームページを参照します。
今回の場合、PyPIのjaconvのページにある「Usage」のセクションに具体的な使い方が書かれています。さまざまな機能が提供されていますが、半角文字を全角文字に変換する用途では「jaconv.z2h」という関数を利用するのが良さそうです。
では、対話モードから実際に使ってみましょう。まずはjaconvをimportします。
>>> import jaconv
importが完了したら、ドキュメントに従って「jaconv.h2z」という関数を使ってみてください。
>>> jaconv.h2z("ネコが飼いたい")
'ネコが飼いたい'
半角文字が全角文字に変換されました! 当初考えていた前処理用の関数「convert_han_to_zen」を作成するには、関数jaconv.h2zを使えば簡単に実現できそうです。後は、これまでの連載の内容を参考に、皆さん自身で関数convert_han_to_zenを完成させてみてください。
* * *
前回、今回と2回に渡り、「半角文字を全角文字に変換する」という題材で、Pythonの標準ライブラリに含まれないサードパーティ製ライブラリの調べ方と、pipコマンドを利用したインストール方法を紹介しました。
上述したように、ライブラリの使い方を調べたい場合、標準ライブラリはPythonの公式ドキュメント「ライブラリーリファレンス」を見ますが、サードパーティ製ライブラリはPyPIのパッケージのページ、もしくはパッケージのホームページを調べる必要がある点に注意してください。
慣れないうちは、サードパーティ製ライブラリのドキュメントを調べるのは大変だと感じるかもしれません。しかし、サードパーティ製のライブラリを使うと、標準ライブラリにはない機能や、あっても使うのが難しい機能を簡単に利用できるケースが多々あります。便利そうなサードパーティ製ライブラリを見つけたら、pipコマンドでインストールして利用してみましょう!
著者紹介
![]() |
株式会社NTTドコモ
R&Dイノベーション本部 サービスイノベーション部
阿部憲幸
2015年京都大学大学院理学研究科数学・数理解析専攻修了。
同年、NECに入社。
2016年から国立研究開発法人情報通信研究機構出向。
2018年より現職。
自然言語処理、特に対話システムの研究開発に従事。
毎日話したくなるAIを夢見て日夜コーディングに励む。
GitHub:https://github.com/noriyukipy