今回はChatGPTに原稿を書いてもらおうと思います。ライターとしては自分の首を絞めるように聞こえるかもしれませんが、うまく利用すれば業務効率の向上とこれまでにない選択肢が派生するかもしれません。→過去の「柳谷智宣のChatGPTプロンプトクリエイティブラボ」の回はこちらを参照。
ChatGPTに適当なプロンプトを投げて、まともな原稿を生成するのは無理です。しかし、扱えるトークン内で小分けに出力させるようにすれば、プロンプト次第でライターの仕事の多くの部分を代替してもらうことができます。
もちろん、課題がないわけでもないのですが、大きな時短になることは間違いありません。執筆時間を圧縮できれば、知識のインプットや一次情報への当たりに費やす時間を多く取れるのでキャリアアップにもつながります。
今回は録音のAIの文字起こしテキストからケバ取り、整形して下原稿を執筆してもらうプロンプトを紹介しましょう。
セミナーの録音をAIで文字起こしをしてケバ取りをする
筆者は日々、取材して原稿を書いているのですが、現場でメモは取るものの、必ず文字起こしを行っています。近年、AIによる音声認識の精度が劇的に向上し、文字起こしの下書きとしては十分なレベルに達しました。
従来は音声を聞き、一時停止し、タイピングして、再生するといった作業を繰り返していましたが、今では文字起こししたテキストを見ながら、音声を聞き、修正しています。ほとんど止まらないので、ほぼ再生時間で文字起こしが済むのでとても助かっています。
しかし、その間はずっとキーボードを操作しっぱなしです。ほとんどが、「あー」とか「えっと」といったケバ取りをしています。
まずは、ケバ取りをしましょう。プロンプトでケバ取りをしてください、と投げるとChatGPTは黙って作業を始めますが、うまくいきません。多くの場合、ケバ取りはできますが、勝手に要約されてしまうことでしょう。
「要約しないでください」と言っても、聞いてくれません。そこで、「言葉の順番を変えないでください」というフレーズを入れたところ動作するようになりました。
筆者は文字起こしには「ClovaNote」というサービスを利用しています。LINEが無料で提供しているサービスで、AIにより超高精度の文字起こしが可能です。話者分離性能もトップクラスなので、誰の発言かも自動で区分してくれます。
とは言え、今回はセミナーの音声なので不要な話者の情報は削除するようにしました。また、「ClovaNote」は英字を小文字にしてしまいます。AIのように大文字にする方が多いので、その処理も行ってもらいましょう。
-
プロンプト
ChatGPT 3.5だと途中でケバ取りをやめてしまうことが多いので、ChatGPT 4を利用しましょう。また、ChatGPT 3.5では10分の文字起こしを入れるとトークン制限でエラーになってしまいます。
また、ChatGPT 4には10分を超える音声の文字起こしを入力し、処理もスタートできるのですが、途中で生成が止まり、続行するをクリックしてもエラーになってしまうことが多発しました。扱えるトークン数がオーバーしているように見えます。
ChatGPT 4で5~6分の文字起こしであれば、問題なく最後までケバ取りしてくれます。文字の順番をいじらないように指示しているので、勝手な要約はしていません。「ま、」は削除していませんが、これはケバではなく「確かに、」のような使い方もあるので、わざと残しているのだと思います。
もちろん、さらにプロンプトを追加し、「ま、」や相槌、噛んだ言葉、頻繁に重複する副詞などを削除することも可能です。
-
出力
今回の出力であれば、音声を聞きながら最終チェックするのも聞き流すだけで良さそうです。少し再生ピッチもあげてもいけそうなので、さらなる時短になります。それどころか、取材から日数が経っておらず記憶が残っているのなら、聞き直さずにこのまま原稿の執筆ができそうです。
ちなみに、今回は5~6分の音声で文字起こしをしましたが、通常セッションの取材は20分~1時間あります。正面からChatGPTで処理したいなら、テキストを分割しましょう。手間がかかりますが、これはトークン数の制限のためです。
現在、ChatGPT 4は4000~8000トークン程度を扱えるようですが、APIの仕様としては12万8000トークンに対応しているので、そのうち1時間半分の文字起こしをまるっと投げて、綺麗にケバ取りできるようになるでしょう。その時のために、自分が望むテキストを得るプロンプトを今のうちからブラッシュアップしておくことをオススメします。
ChatGPTに文字起こしから原稿を執筆してもらう
次に、ケバ取りしたテキストからセッションもレポート原稿を執筆してもらいましょう。ChatGPTには文字数指定が効きにくいうえ、すぐに要約して来るので、しつこく「詳細に」執筆するようにプロンプトに入れましょう。
-
プロンプト
いい感じになりました。文字起こし部分1513文字の入力に対して、1162文字の出力が得られたので、漏れなく原稿に入れ込んでいることがわかります。ケバ取りで残っていた、言いよどみや誤字脱字なども修正されています。流石に「チャットGPTは2021年9月までのデータで学習」といった内容のミス(現在は2023年4月まで)には対応しきれていません。
媒体表記が決まっている場合などは、表記ルールを記載しておいてもよいでしょう。テキストエディタやWordの置換機能で修正してもいいのですが、ChatGPTもなかなか賢く処理してくれるので、まとめて頼んでしまう方が効率的です。
ChatGPTに触ったばかりの人は、何かを入れると数千文字の原稿がまるまる出力されると思うようですが、そんなことはありません。原稿を執筆する際は、プロンプトに書いてほしい情報を入れ、細切れに出力させるのです。今はトークン数の制限で、1回の出力は正味500~1000文字程度となります。
とは言え、ウェブ原稿であれば、4~5回の生成で行けますし、単行本も100~200回くらいの生成で文字量は十分です。
今回はレポート原稿なので文字起こしという元データがありますが、通常の原稿を書く時も同じです。箇条書きでも話し言葉でも、情報をとにかく入れて、出力フォーマットをプロンプトに入れれば原稿を作成できます。ブログを書きたいけれど、時間がないと悩んでいるならぜひChatGPTを活用しましょう。