質問
PDFファイルに関して以下処理をサポートするようなノードがあるか確認させてください。
1. PDFファイル内の特定ワードの抽出
2. 上記ワードの含まれるページまでと、それ以降でPDFファイルを分割して連携
回答
PDFファイル内の特定ワードを抽出する、
およびPDFファイルを分割して連携するといった機能につきまして、
HULFT Square には該当する機能の実装はございません。
なお、一例となりますが、PDFファイル内のワード抽出処理につきましては、
Googleドライブコネクターを利用した以下のような実装が考えられます。
- GoogleドライブにPDFファイルをアップロードし、
Google ドキュメントから開いてテキストを抽出してテキストファイルとして保存 - HULFT Squareのリソース>コネクションより、
コネクターに「Google Workspace」、種類に「GoogleドライブOAuth認証設定」を選択し、
Googleドライブへのコネクションリソースを作成。 - スクリプトを作成し、Googleドライブの以下コネクターにて抽出したテキストファイルを取得
[クラウド] > [Googleドライブ] > 「ファイル/フォルダ読み取り」 - Mapperにてテキストファイルに含まれている特定ワードを抽出
PDFファイルの分割処理につきましては、
Adobe Acrobat等の外部サービスの利用をご検討いただければと思います。
コメント
0件のコメント
記事コメントは受け付けていません。