私の仕事には分かりきっていることを説明するという部分が大きいのですが
企業や医療機関などの団体から出た告知、
ニュースリリースなどが下地になることが多いです。
人名や地名、専門用語などで
コピー&ペーストを繰り返すことになりますが
できない場合もあります。
それが画像だと、
キーボードから入力することになります。
PDFでもテキストになってない場合もありますね。
ただ、これらに含まれる文字を
テキストとしてコピーする方法もあります。
それがOCRの技術です。
OCRについては今更ですが、
あらためてお書きしておきますと、
日本語では「光学文字認識」と呼ばれます。
PCやスマートフォンなどのプログラムにより
テキストデータにすることが可能になります。
このプログラム、アプリは有料、無料とあるんですが、
アルファベットなどの欧文はともかく、
日本語の文字種は無数にあり、
また、分かち書きや文法上のゆらぎの幅が大きいため
精度のほうはそこそこといったところでした。
私もいくつかのOCRソフトを使用してきましたが、
今、使用しているのは「Googleドライブ」です。
なかなか完全にとはなりませんが、
試した中では、一番優れているのではないかと思っています。
使用法は簡単。
Googleのアカウントがあれば誰でも使えます。
Googleドライブのページで、
含まれている文字をテキストデータにしたい画像などをアップロード。
ページ上のその画像を右クリックして
「アプリで開く」→「Googleドキュメント」で完了です。
必要があれば、Googleドライブ内での編集も可能です。
ただ、精度が高いとはいっても、
間違いはありますし、
キーボードからの入力時以上のチェックが欠かせません。
派手に間違えているよりも
似た文字で間違えていることのほうが
間違いに気付きにくいですので、
気をつけなければなりません。
たとえば、以前、とあるイベントの告知文を作成した時に、
「太鼓」が「大鼓」になってしまっていました。
キーボードからの入力ではあり得ない間違いです。
そのほか、字形が込み入っている隙間の少ない漢字には注意が必要です。
以上、オンライン環境にある時限定ですが、
私にとっては画像の文字をコピーしたい時などに
欠かせないGoogleドライブで使用できるOCRのお話でした。