今回は、Power Automate Desktopを使って、PDFからテキストを抽出し、それをWord文書に書き込む方法を紹介します。このフローを使うと、PDFの内容を簡単にWordに転記できます。
ずんだもん
今回読み取るPDFは、「国税庁レポート2024」の「納税者の皆様へ」なのだ
四国めたん
なんでそのチョイス…
フローの全体概要
このフローでは、次の3つのアクションを行います:
- PDFからテキストを抽出する
- Word文書を起動する
- 抽出したテキストをWord文書に書き込む
それでは、各ステップを詳しく見ていきましょう!
ステップ1: PDFからテキストを抽出する
まず、指定したPDFファイルからテキストを抽出します。このアクションは次のように設定します:
- アクション名: PDFからテキストを抽出
- ファイルパス:
C:\Users\high6\Desktop\2024_message.pdf
- 保存する変数名:
ExtractedPDFText
この設定により、PDFファイル内のテキストが抽出され、変数ExtractedPDFText
に保存されます。
ステップ2: Word文書を起動する
次に、空のWord文書を起動します。このアクションは以下のように設定します:
- アクション名: Wordを起動する
- インスタンス名:
WordInstance
この設定により、新しいWordインスタンスが作成されます。
ステップ3: 抽出したテキストをWord文書に書き込む
最後に、抽出したテキストをWord文書に書き込みます。このアクションは次のように設定します:
- アクション名: Word文書に書き込む
- インスタンス名:
WordInstance
- 書き込むテキスト:
ExtractedPDFText
- 書き込み位置: 文書の先頭
これにより、PDFから抽出したテキストがWord文書の先頭に書き込まれます。
ずんだもん
結果はこちらなのだ
四国めたん
改行するところが原文とは違うけれど、文章自体は読み取れてるわね
ずんだもん
それと、↓こういう手書きの文字も読み取れないみたい
四国めたん
そこまでの精度を求めるなら、高性能OCRソフトを導入したほうがよさそうね
まとめ
このフローを実行することで、PDFファイルからテキストを抽出し、それを自動的にWord文書に書き込むことができます。Power Automate Desktopを使えば、手動での転記作業を効率化でき、ミスも減らせます。ぜひ、このフローを他の文書管理にも応用してみてください。
コメント