コードの実行確認などを行っていると、時折エラーが出る。これを解決するためにそのエラーメッセージやコードの該当箇所をコピー&ペーストして共有するということがしばしば起こる。
どの環境で行っているのか?などを含めた全体の状況を視覚的に伝えるにはキャプチャー画像もいいのだが、テキスト情報が無い画像のみだと困ることも当然ある。コードはテキストデータであるためコピペすれば実行できる。なければ、実行できない。
ソフトウェア開発を行うPaul Parksさんが投じた"I Hate Screenshots of Text"(私はテキストのスクリーンショットが嫌いだ)というブログがHackeNewsでちょっとした話題になっている。
勤務中に大量のコードのスクリーンショットが送られてくる環境にあるPaul Parksさん。同僚から改行なしで途中で切れているコードや同様に見切れたエラーログのキャプチャ画像が送信してくるのだが、募るストレスのあまり、アニメーションGifで思いっきりその心情を表現している。
HackerNewsでは、スクリーンショットとテキストの双方を送信すべき、スクリーンショットを送る側の共感と礼儀正しさが不可欠など様々な意見が集まっている。Appleのシステムに統合されたOCR機能やApple Intelligence、Google LensとGemini連携などAIを用いた近年のスクリーンショット画像の進化やWindowsのSnipping Toolに期待する声、OSやコミュニケーションツール、それぞれのプラットフォーム上でのアイデアを示している。なかにはローカルLLMに投げ込めばいいという意見も。スクリーンショットからソースコードが抜き出せれば問題は解決するという意見だ。
そういえば筆者は、Text Extractorでソースコードを抜き出したことが無い。どんな塩梅なのかここで試してみよう。既報の記事を参考に[Win]+[Shift]+[S]のキーボードショートカットからText Extractorを呼び出し、動作するPS1ファイルのスクリーンショットを撮り、テキストを貼り付ける。果たしてその結果は?
残念ながら、動作しない。日本語含めて、おおむね取得できるのだが、スペースやブラケットが抜けたり、URLの途中に余分なスペースがインサートされたりしている。これでは、OCRの正誤を見つけ出してから、コードの正誤をみつけなければならないので、ストレスは増してしまう。
やはり、人にお願いをするのであるから、キャプチャ画像とソースコードの両方を添えて、短くても状況を文章で添えるのがよさそうだ。惜しんだひと手間が、相手に多大な迷惑とストレスを与えてしまう。

