「ORC」タグアーカイブ

PDFelementを使用して画像ファイル内の文字をテキスト化する方法

OCR機能を持つソフト「PDFelement」を使用して画像ファイル内の文字列をテキストファイル化する方法です。

「PDFelement」には無料トライアル版もあるので画像ファイルからテキストファイルやExcelファイルへの変換は無料トライアル版でも十分可能となってます。

「PDFelement」のダウンロード

「PDFelement」を使用して画像ファイル(png)の文字をテキストファイル化する手順

今回は以下の画像ファイル(png)をテキスト化してみます。

  1. PDFelementを起動し、「ファイルを開く」を選択します。
  2. ファイルの種類がpdfになっているので「すべてのファイル」へ変更して変換したい画像ファイルを選択します。
  3. プロ版機能の購入案内画面が表示されるので「無料トライアルを続ける」を選択します。
  4. 変換したい形式のファイルを選択します。今回はtxtファイルへ変換したいので「テキストへ」を選択します。
  5. 再びプロ版機能の購入案内画面が表示されるので「無料トライアルを続ける」を選択します。
  6. pdfファイルへの保存確認が表示されるので保存したい場合は「はい」を、不要であれば「いいえ」を選択します。
  7. 名前を付けて保存画面が表示されるので保存後のファイル名を指定して「保存」を選択します。
  8. 正常に変換されると以下に様に「正常に変換されました」と表示されます。「開く」ボタンを選択すると変換後ファイルを開くことが出来ます。
  9. 変換後ファイルを開くと以下の様に画像内も文字がテキスト化されてるのが確認出来ます。やや精度は微妙なので見直しは必須ですが、文字数が多い画像ファイルなどをテキストファイル化したい場合などには結構使えそうです。