昨今、「AIエージェント」が話題になっています。特にプログラムを自動生成する「コーディングエージェント」の能力は日進月歩で「プログラマー不要論」まで提起されるようになりました。しかし、コーディングエージェントは、プログラミング以外でも役に立ちます。そこで、今回は、ファイル管理や画像判定、Excel要約など、プログラミング以外の用途で使う方法を紹介します。

  • コーディングエージェントを活用しよう

    コーディングエージェントを活用しよう

コーディングエージェントについて

「コーディングエージェント」(Coding Agent)とは、プログラムの開発などを自律的に実行するAIエージェントのことです。GoogleのGemini CLI、OpenAIのCodex CLI、Claude Codeなどが有名です。

コマンドライン上で、作成したアプリに関する要望を入力することで、コードの生成・実行・テスト・修正・改善までを継続的に繰り返し実行します。つまり、プログラミングの知識がほとんどなくても、論理的に指示ができさえすれば、いろいろなプログラムを自動で作成できるようになったのです。

ちなみに、姉妹連載の「ゼロからはじめるバイブコーディング」では、毎回、いろいろなお題を元にして、自動でアプリを開発する様子を紹介しています。

コーディングエージェントはプログラマー以外も使える

さて、これらのエージェントをプログラミング以外でどう活用できるでしょうか。次のような用途で活用できます。

- 指定フォルダ以下のファイルを検索する
- フォルダ以下にあるファイル一覧の内容を要約する
- ファイル一覧を目的に基づいて自動的に分類する
- たくさんのExcelを読み込ませて、要約レポートを作成する
- 不要ファイルを除いてZIP圧縮する
- JPEG画像に埋め込まれたGPS情報に基づいて、地点ごとにフォルダ分けする

これまで、プログラマーは、コマンドラインツールをいろいろと駆使してこうしたタスクをできるだけ効率的に行ってきました。

しかし、コーディングエージェントを使えば、こうした作業を人間が行う必要はありません。的確な指示を与えることで、エージェントが作業を自動で処理してくれます。

以下では、いくつかの利用例を紹介します。なお、各コーディングエージェントがインストールされているという前提で説明しています。実際のインストールは本コラムの末尾をご覧ください。

利用例 - JPEG画像を地点ごとに分類分けしよう

例えば、JPEG画像を地点ごとに分類分けできます。最初にOpenAIが公開しているCodex CLIを利用してみましょう。ターミナルを起動して、作業用のフォルダを作成し、そこに適当にスマートフォンなどで撮影したJPEGファイルをコピーします。

そして、ターミナルを起動して、「cd (作業用のフォルダのパス)」を実行します。そして「codex」と入力してCodex CLIを起動します。

  • 写真をたくさん入れた作業フォルダを用意してCodexを起動したところ

    写真をたくさん入れた作業フォルダを用意してCodexを起動したところ

画面は英語ですが、何をするのか尋ねられています。ここで、次のような指示(プロンプト)を与えます。指示は日本語で大丈夫です。

このフォルダ以下にあるJPEGファイルを列挙して、
GPS情報に基づいて、地点ごとにフォルダ分けしてコピーしてください。

すると、まず自動でフォルダ以下にあるJPEGファイルを探します。続いて、JPEGファイルに埋め込まれたGPS情報を調べます。その後、JPEG画像を地点ごとにフォルダに分けてコピーしてくれました。

  • JPEG画像をGPS情報に基づいてフォルダ分けしたところ

    JPEG画像をGPS情報に基づいてフォルダ分けしたところ

どれくらいの画像ファイルがあるかにもよりますが、人間がこの作業を手作業で行うなら、1時間以上かかってしまうかもしれません。しかし、コーディングエージェントを使うなら、ほんの数分で分類が完了します。

利用例 - 指定フォルダ以下にある写真を探して説明させる

次に、指定フォルダにある写真に何が映っているのかを探す作業をコーディングエージェントに依頼してみましょう。ここでは、GoogleのGemini CLIを使ってみました。

ターミナルで「gemini」と実行するとGemini CLIが起動します。ここで、次のような指示(プロンプト)を与えます。

このフォルダ以下のどこかに、小皿の上に載せた料理の写真があります。
そのファイルを探して、ファイル名を教えてください。
また、どんな料理なのか説明してください。

上記と同様にたくさんの写真が入ったフォルダで上記のプロンプトを実行したのですが、次の画面のように、料理の写真を見つけ出し、ファイル名と料理名の一覧を作成してくれました。

  • たくさんの写真の中から料理の写真を探し出し、料理名を言い当てた

    たくさんの写真の中から料理の写真を探し出し、料理名を言い当てた

仕事で上司からたくさんの写真ファイルを渡されて、「この中にある○○の写真をまとめて、PDFのレポートにして」などと頼まれることがあるかもしれません。そんなときも、コーディングエージェントを使えば、あっという間に作業が完了します。

利用例 - 指定フォルダ以下にあるExcelの内容を要約したレポートを作成

次の利用例として、指定フォルダ以下にあるExcelの内容を要約して、レポートを作成する作業をコーディングエージェントに依頼してみましょう。ここでは、Claude Codeを使ってみました。

ターミナルを起動して、フォルダを作成し、適当なExcelファイルをいくつかコピーします。そして、ターミナルで「claude」と実行してClaude Codeを起動します。ここで、次のような指示(プロンプト)を与えます。

このフォルダにあるExcelファイルを列挙してください。
そして、Excelファイルの内容を要約して、レポートを作成してください。
  • Claude Codeを起動してプロンプトを書き込んだところ

    Claude Codeを起動してプロンプトを書き込んだところ

すると、次の画面のように、フォルダ以下にあるExcelファイルを列挙し、その内容を要約したレポートを自動で作成してくれました。

  • Claude CodeがExcelの内容を要約したレポートを作ったところ

    Claude CodeがExcelの内容を要約したレポートを作ったところ

内容は概ね正確でExcelファイルの内容をうまく要約してくれました。

ちなみに、Claude Codeには、いろいろな料金プランがありますが、使った分だけ課金されるプランで試してみました。上記のフォルダには8つのファイルがあり、動作ログを見ると、Excelのプログラムの作成と各ファイルの要約とレポートの作成の作業を行っていました。API料金を確認してみると、このタスクにかかった費用は、0.16米ドル(約24円)でした。

結構面倒なファイル管理やExcelの内容要約ですが、数十円で安価に自動化できることを考えると一考の価値ありです。OpenAIのCodexも同等程度の料金で同様の作業が可能です。なお、原稿執筆時点では、Gemini CLIには無料枠がありますので今のうちに試してみると良いでしょう。

コーディングエージェントはLinux系OSで使うのが便利

なお、コーディングエージェントの多くは、ターミナル上でコマンドを入力して利用することを想定しています。というのも、コーディングエージェントは、コマンドライン環境向けに用意された多くの便利ツールを使いこなすことができるからです。コマンドラインツールの多くは、Linux/macOS向けに作られているので、その環境でこそ、エージェントの実力をより発揮させることができます。

そのため、Windowsなら、仮想環境でLinuxを動かす「WSL」(Windows Subsystem for Linux)環境を使うと便利です。仮想環境なので、ホスト側のWindowsに与える影響もほとんど気にしなくてすみます。蛇足ですが、Chromebookでも、設定から簡単に仮想環境でLinux(Debianベース)を動かすことができるようになっています。

このように、最近では、いろいろなOS上で仮想環境上でLinuxを動かすことができるようになっています。ホストOSの機能に加えて、Linuxの機能を手軽に活用できるので、非常に便利です。そして、仮想環境のLinuxを使うなら、コーディングエージェントを導入するのがオススメです。既に紹介したように自然言語で、いろいろな作業を自動化できるからです。

なお、コーディングエージェントの実際のインストール方法ですが、Gemini CLIについては、こちらで、OpenAI Codex CLIについては、こちらで紹介しています。Claude Codeについては、本家のドキュメントを参照してください。

まとめ - コーディングエージェントを活用しよう

以上、今回は、コーディングエージェントを使えば、いろいろな作業を自動化できるということを紹介しました。こんな便利なツールをプログラムの開発だけに使うのはもったいないです。うまく活用して、日常作業を自動化してみましょう。

自由型プログラマー。くじらはんどにて、プログラミングの楽しさを伝える活動をしている。代表作に、日本語プログラミング言語「なでしこ」 、テキスト音楽「サクラ」など。2001年オンラインソフト大賞入賞、2004年度未踏ユース スーパークリエータ認定、2010年 OSS貢献者章受賞。これまで50冊以上の技術書を執筆した。直近では、「大規模言語モデルを使いこなすためのプロンプトエンジニアリングの教科書(マイナビ出版)」「Pythonでつくるデスクトップアプリ(ソシム)」「実践力を身につける Pythonの教科書 第2版」「シゴトがはかどる Python自動処理の教科書(マイナビ出版)」など。