2022年に登場し、生成AIブームの火付け役ともなったChatGPT。同サービスは今も進化を続けており、テキストだけでなく、画像や図表にも対応するなどマルチモーダルAIへと歩みを進めている。
今後、ChatGPTは確実にビジネスにも影響を与え、ワークスタイルそのものを変革していくだろう。そんな時代に活躍する人材になるためにはどうすれば良いのか。
11月6日~17日に開催された「TECH+ EXPO 2023 Autumn for データ活用 データで拓く未来図」に、ELYZA 取締役 CMOで三井住友カード Head of AI Innovationの野口竜司氏が登壇。ChatGPT時代における“文系AI人材”になるポイントについて語った。
「TECH+ EXPO 2023 Autumn for データ活用 データで拓く未来図」その他の講演レポートはこちら
ChatGPTがもたらす本格的AI活用時代
講演冒頭、野口氏が提示したのがいくつかのグラフだ。実はこのグラフ、野口氏がECサイトで購入したファッションアイテムの購入履歴をChatGPTのcode interpreter機能を活用して作成させたものである。
具体的なやり方としては、まずExcelやPowerPoint、ドキュメント、CSV、プログラムコード、画像データなどを活用して、購入したアイテムの名前、ブランド、サイズ、カラー、価格、購入日などをまとめ、プロンプトとともにChatGPTに入力する。すると、Python等のライブラリが動いて処理を行い、瞬く間にグラフを生成してくれるのだ。
さらにChatGPTのすごいところは、例えば「サイズ」のカラムに間違えてアイテムカラーを入れてしまっている場合、それを把握して正しく修正してくれる点である。さらに、明らかに間違えて入力している異常値がある場合、それも除外してくれる。このように、まるで人のような柔軟な判断に基づいて作業を行えるのは、ChatGPTならではと言えるだろう。
ChatGPTに代表される生成AIの登場は、まぎれもなくAI時代の到来を示すものだ。これまでにもAIブームは何度も起こってきたが、結局は一過性で終わってしまっていた。だが、現在起きている第4次AIブームはもはやブームではなく、「本格的AI活用時代」と呼ぶべきなのだ。
野口氏によると、AIは主に4つに分類できるという。
まず、「見る力」を持つ識別系AIだ。AIカメラやOCR、異常検知などに活用されている。次に「予測する力」を持つ予測系AIがある。これは需要予測や顧客予測、パーソナライズなど、ビジネスでも活用が進んでいる。さらに「話す力」を持つ会話系AIはチャットボットなどに用いられており、「動く・作る力」を持つ実行系AIはロボットや生成AIなどに用いられている。
「どのAIもそれぞれ力を伸ばしていますが、中でも比較的に進歩したのが会話系AIと実行系AIです。すでに2年前のAI技術はレガシーなものになっていると言えます」(野口氏)
進歩が著しいのはChatGPTだけではない。テキストから画像を生成するMidjourneryやAdobeの画像生成AIであるFireflyも短期間でバージョンアップし、性能を大きく伸ばしている。特にFireflyは、権利関係をクリアにしたデータだけを学習していることから、ビジネスでも安心して利用できるのが強みだ。
こうしたAIの快進撃は、社会や仕事をどう変えていくのだろうか。
クリエイティブワークがAIによって置き換わっていく
野口氏によると、AIによって置き換えられる仕事内容は以前から変化したという。
「以前はフィジカルの仕事が置き換えられるという話でしたが、今はむしろホワイトカラーの仕事の方が置き換えられるのではと言われています。クリエイティブな仕事も例外ではありません。テキストから画像を生成したり、画像からテキストを生成したりと、AIはその能力を伸ばしており、クリエイティブな仕事も今後の見通しはわからない状況なのです」(野口氏)
だからと言って、それは必ずしも「AIに仕事を奪われる」ことを意味しない。AIによって仕事が置き換わるなら、それをうまく利用することで生産性を高められる可能性もあるからだ。
野口氏によると、MITではホワイトカラーの生産性について実験した。ChatGPTを使うグループと使わないグループに分けて比較したところ、ChatGPTを使ったグループの方が作業時間を37%も削減できたという。さらに、AIとタスクを繰り返すにつれて品質が向上するという効果も表れたとのこと。AIを活用することで作業時間を削減し、品質も向上することが実験で明らかになったのだ。
では、具体的にどのようにChatGPTを活用すれば良いのか。
ここで野口氏は、実際にChatGPTの活用デモを行ってみせた。
現在のChatGPTはテキストだけでなく、先に紹介したようなさまざまなファイルの入力にも対応している。これを「マルチモーダル」と呼ぶ。
例えば、手書きの授業ノートの写真を読み込み、その内容をChatGPTに解説させたり、読み込んだ画像をHTMLとCSSで書き出したりすることも可能だ。
Excelのスクリーンショット画像からVBAのコードも生成できるし、AWSのアーキテクチャ図を読み込んで料金の見積もりも行える。人の写真を取り込み、その人が着ているファッションアイテムの詳細な解説もできる。
ChatGPTはテキストに限らず、アイデアとプロンプト次第でいくらでも有用な使い方が可能なのだ。

