PDFからテキストを抽出し、Word文書に書き込む方法

今回は、Power Automate Desktopを使って、PDFからテキストを抽出し、それをWord文書に書き込む方法を紹介します。このフローを使うと、PDFの内容を簡単にWordに転記できます。

ずんだもん
ずんだもん

四国めたん
四国めたん
なんでそのチョイス…

フローの全体概要

このフローでは、次の3つのアクションを行います:

  1. PDFからテキストを抽出する
  2. Word文書を起動する
  3. 抽出したテキストをWord文書に書き込む

それでは、各ステップを詳しく見ていきましょう!

ステップ1: PDFからテキストを抽出する

まず、指定したPDFファイルからテキストを抽出します。このアクションは次のように設定します:

  • アクション名: PDFからテキストを抽出
  • ファイルパス: C:\Users\high6\Desktop\2024_message.pdf
  • 保存する変数名: ExtractedPDFText

この設定により、PDFファイル内のテキストが抽出され、変数ExtractedPDFTextに保存されます。

ステップ2: Word文書を起動する

次に、空のWord文書を起動します。このアクションは以下のように設定します:

  • アクション名: Wordを起動する
  • インスタンス名: WordInstance

この設定により、新しいWordインスタンスが作成されます。

ステップ3: 抽出したテキストをWord文書に書き込む

最後に、抽出したテキストをWord文書に書き込みます。このアクションは次のように設定します:

  • アクション名: Word文書に書き込む
  • インスタンス名: WordInstance
  • 書き込むテキスト: ExtractedPDFText
  • 書き込み位置: 文書の先頭

これにより、PDFから抽出したテキストがWord文書の先頭に書き込まれます。

ずんだもん
ずんだもん
結果はこちらなのだ

四国めたん
四国めたん
改行するところが原文とは違うけれど、文章自体は読み取れてるわね

ずんだもん
ずんだもん
それと、↓こういう手書きの文字も読み取れないみたい

四国めたん
四国めたん
そこまでの精度を求めるなら、高性能OCRソフトを導入したほうがよさそうね

まとめ

このフローを実行することで、PDFファイルからテキストを抽出し、それを自動的にWord文書に書き込むことができます。Power Automate Desktopを使えば、手動での転記作業を効率化でき、ミスも減らせます。ぜひ、このフローを他の文書管理にも応用してみてください。

コメント

タイトルとURLをコピーしました