これまでとは少し異なるアプローチで日本語入力を高速化できるのが「音声入力」の活用だ。AI技術が発達した現在では、音声入力も立派な入力方法のひとつと考えられる。もちろん、Windows 11にも音声入力機能が標準装備されている。今回は音声入力を上手に活用して、日本語入力を高速化するためのノウハウを紹介していこう。
音声入力の実行手順
Windowsに標準装備されている機能なのに意外と活用されていないのが「音声入力」だ。話すスピードで日本語を入力できれば、「十分に高速な入力環境を実現できる」といえるだろう。タッチタイピングが苦手でも問題はない。最近はAIが進歩しているので、音声認識の精度についても「想像していた以上に使えるレベル」と実感できるはずだ。
唯一の弱点は「職場の環境」を選ぶこと。自宅勤務、もしくはデスクがパーティションで区切られているなど、声を出すことに抵抗がない職場環境が必要条件になる。とはいえ、この問題もヘッドセットを使うことで解決できるかもしれない。口元にマイクを設置すれば、隣の席には聞こえない、ささやくような小声でも音声入力は機能してくれる。よって、声を出しづらい職場でも音声入力を使用できる可能性はある。
前置きはこれくらいにして、さっそく音声入力の使い方を紹介していこう。音声入力を始めるときは「Windows」+「H」キーを押せばよい。
すると、以下の図に示したような操作パネルが表示されるので、文字を入力する位置へカーソルを移動してから「マイク」ボタンをクリックする。もしくは、再度「Windows」+「H」キーを押してもよい。これで音声入力がオンの状態になる。
あとは入力したい文章を発声していくだけ。AIが音声を認識し、文章を自動入力してくれる。以下の図はメールの文面を音声で入力した例だ。「本メール」と入力したかった部分が「phoneメール」になっているなどの不具合はあるものの、簡単な操作で音声入力を実現できることを確認できるだろう。
肝心となる音声認識精度も十分に実用に耐えられるレベルといえる。上図では、あえて誤変換された文章を掲載したが、一般的な文章であれば、かなりの確率で正しい日本語を自動入力してくれる(もちろん、話者との相性はあるが……)。
音声入力を一時的に中断するときは、もういちど「マイク」ボタンをクリックすればよい。すると、ボタン表示が「青色」から「白色」に変化し、音声入力がオフになる。
音声入力の再開するときは、再び「マイク」ボタンをクリックしてオンにする。そのほか、「Windows」+「H」キーで音声入力のオン/オフを切り替えることも可能となっている。
句読点やカッコ、記号、改行などの入力
続いては、音声入力を利用するときに覚えておきたいルールを紹介していこう。音声入力時に多少の問題となるのが、句読点や記号などの入力だ。
まずは、句読点の入力から解説していこう。句点(。)は「くてん」、読点(。)は「とうてん」と発声すると入力できる。
ただし、必ずしも思い描いていた結果になるとは限らない。以下の図のように「とうてん」が通常の文字として認識されてしまい、「当店」と入力されてしまうケースもある。そのほか、句点が「九テン」と入力されてしまうケースもあった。
句読点を確実に入力するには、その前後に間を空けて話す必要がある。先ほどの例の場合、「つうじょうめにゅーだけでなく とうてん しゅんのしょくざいを……」といったイメージで発声すると、句読点が正しく認識されやすいようだ。
文章の改行も音声で指示できる。改行を挿入するときは「改行」や「次の行」、「新しい段落」と発声すればよい。同様に( )の入力も音声で実行できる。この場合は、「カッコ」や「カッコ開く」、「カッコ閉じる」などと発声すればよい。
そのほか、さまざまな記号を音声入力することもできる。各記号の発声方法等詳細は、Windowsのサポートページに載っているので、いちど参照しておくとよい。
ただし、句読点をはじめ、記号類の音声入力はかなり難しい……というのが筆者の正直な感想だ。というのも、発声した内容を“通常の文字”として認識されてしまうケースが多いからだ。確実に“記号”として認識させるには、その前後に十分な間を空けて話す必要がある。それでも思い通りに記号を入力できないケースが数多く見受けられた。
音声入力をスムーズに進めるには?
このように、通常の文章だけであれば音声入力は「十分に使えるレベル」に達しているが、句読点や記号類を含めて入力しようとすると、急に雲行きが怪しくなってしまう。それ以前の問題として、文章の途中で「とうてん」とか「かっこひらく」といった発声を行うこと自体、どう考えてもスムーズな入力方法とはいえない。
ということで、ここからは音声入力の弱点を補うテクニックを紹介していこう。まずは改行の入力について説明する。改行は段落の最後にのみ入力する記号(目に見えない記号)となるので、この部分だけキーボードで入力しても構わない。その手順は「Enter」キーを押すだけ。すると、改行が入力され、音声入力が自動的にオフになる。
同様に、句読点もキーボードから入力できるが、その時点で音声入力はオフになってしまう。このため、文章を細切れに音声入力することになり、あまり実用的とはいえない。
このような場合に活用できるのが「句読点の自動化」だ。音声入力パネルに配置されている「歯車」のアイコンをクリックする。
すると、以下の図のような設定画面が表示される。ここで「句読点の自動化」をオンにすると、AIが自動的に句読点を挿入してくれるようになる。設定を変更できたら「歯車」アイコンを再クリックして設定画面を閉じる。
以下の図は、普通に文章を発声して日本語を音声入力した例だ。適所に「、」や「。」が自動挿入されているのを確認できるだろう。
もちろん、AIが自動挿入する句読点なので、必ずしも思っていた位置に「、」や「。」を打ってくれるとは限らない。それでも、自分で「とうてん」や「くてん」と発声することに比べれば、格段に快適な環境になるはずだ。
むしろ、「句読点の位置は適当で構わない」と考えたほうがよいかもしれない。というのも、音声入力した文章には少なからず誤変換などが含まれているからだ。このため、後ほど修正作業を行う必要がある。
どうせ後で修正作業を行うのなら、「細かいことは気にせず、文章の全体像の完成に注力する」という方針で音声入力を進めていくべきだ。その後、文章を読み返しながら自分の手で修正を加えていく。このような手順にすることで「全体の作業時間を大幅に短縮させる」のが、音声入力の効果的な活用法といえる。
以下の図は、音声入力した文章を自分の手で修正した例だ。文章の大筋が完成していれば、こういった修正作業は短時間で済ませられるだろう。
普通にキーボードを使って文章を入力する場合、入力ミスや誤変換をそのつど修正しながら文章を作成していく人が多いだろう。その気持ちは十分に理解できるが、これでは「文章を考える作業」が何回も寸断されてしまう。その結果、文章全体を完成させるまでに多大な時間を要してしまう。
一方、ささいなことを気にしないで音声入力を進めていった場合は、文章の大筋を短時間で完成させられる。その後、文章を読み返しながら、句読点の位置を調整する、改行やカッコを挿入する、誤変換を修正する、といった作業を行っていく。こういった進め方のほうが最終的には短時間で日本語入力を済ませられるケースが多い。これが音声入力を効率よく活用するためのノウハウといえるだろう。
「音声入力起動ツール」とは?
最後に、「音声入力起動ツール」について補足しておこう。音声入力の設定画面にある「音声入力起動ツール」をオンにすると、音声入力機能が常駐するようになる。
この場合、Wordやメールなどの「文字入力が可能なアプリ」をアクティブにするだけで、小型の音声入力パネルが自動表示されるようになる。あとは「マイク」アイコンをクリックするだけ。これですぐに音声入力を開始できる。
ただし、「音声入力起動ツール」がオフの状態でも「Windows」+「H」キーで即座に音声入力を開始できるので、さほど大きなメリットはない。
念のため、「音声入力起動ツール」をオフに戻すときの操作も紹介しておこう。この場合は「…」をクリックし、「音声入力起動ツール」のスイッチをオフにすればよい。これで通常の音声入力パネルに戻る。
以上が、Windows 11に用意されている音声入力機能の概要だ。この機能を便利に活用できるかどうかは「各自の使い方次第」と考えられる。上手に活用すれば、日本語入力をかなり高速化できるはずだ。
特にタッチタイピングが苦手な人ほど、効果は大きいと思われる。あとは滑舌よく、噛むことなく、スムーズに文章を発声できるように努力するだけだ(多少の発声ミスはAIが自動補完してくれる)。これについては、やはり練習を重ねていくしかないだろう。
















