【GAS】Google Driveで画像ファイルをOCRする

今回はGAS（Google Apps Script）に関して書いていきます。

以前もGASに関する記事を書いています（以下リンク）。

miya-moto-memo.hatenablog.com

上記の記事で、GASを活用したOCR処理の効率化に関して書いています。
プログラムも載せていますが、プログラムの具体的な説明はしませんでした。

今回の記事で、プログラムを具体的に説明していこうと思います。
ただ、プログラムはけっこう長いので何記事かに分けて書いています。
プログラムを具体的に説明する記事は、今回が2記事目です。

関連記事をリストにまとめると、以下のようになります。

全体

GASを活用してGoogle DriveでのOCR処理を効率化（自動化）

プログラム詳細説明

【GAS】Google Driveの指定したフォルダ配下のファイル一覧を取得
【GAS】Google Driveで画像ファイルをOCRする ← 今回の記事
【GAS】Googleドキュメントの中身を調整する（文字サイズ/文字色/余計な文言を除去）

ということで、今回は「Google Driveで画像ファイルをOCRする」部分に関して書いていきます。

それでは本題へ。

今回説明するところ
やりたいこと
プログラム事前準備
プログラム
「Drive API」の詳細
- Drive.Files.copy（指定したファイルをコピーする）
おわりに
関連記事

今回説明するところ

miya-moto-memo.hatenablog.com

上記リンクに全体のプログラムが載っていますが、この記事では部分的にピックアップして説明していきます。

フローチャートでいうと、以下（赤枠部分）に関して説明していきます。
※createDocFromImg

やりたいこと

以下の操作をプログラムで処理されるようにします。

STEP

画像ファイルを右クリック → アプリで開く → Googleドキュメント

STEP

Googleドキュメントが開く（画像がOCR処理されている）

プログラム事前準備

プログラムを実行する前に、前提となる情報をいくつか書いておきます。

OCR処理対象のファイルを決める

OCR処理対象のファイルを決めます。

画像ファイルの中身はこんな感じです。
※画像はChatGPTで適当に作った文章で、それを写真で撮った画像です。

ファイルIDを控えておく

プログラムを実行する前に、ファイルIDを指定する必要があります。
ファイルIDは以下の手順で取得できます。

「画像ファイルを右クリック」→「共有」→「リンクをコピー」
コピーされたURLからファイルIDを控えておく

Drive APIを有効化する

Drive APIを有効化します。
バージョンは「v2」と「v3」があり、今回は「v2」を選択します。

プログラム

// ファイルID
const fileId = "ファイルIDを指定";

/**
 * メイン処理
 */
function main() {
  const resource = {};
  const option = {
    "ocr": true,
    "ocrLanguage": "ja",
  }
  Drive.Files.copy(resource, fileId, option);
}

上記のプログラムを実行すると、Googleドキュメントが作成されます。
作成されたGoogleドキュメントを開くと、OCR処理された状態を確認できます。

「Drive API」の詳細

上記のプログラムから、「Drive API」に関する処理をピックアップして具体的に説明します。

Drive.Files.copy（指定したファイルをコピーする）

Drive.Files.copyの詳細
「Drive.Files.copy」で、指定したファイルをコピーできます。
リファレンスをリンクしておきます。

developers.google.com

タイトルを指定してみる

// ファイルID
const fileId = "ファイルIDを指定";
// ファイル名
const title = "お試し実行";

/**
 * メイン処理
 */
function main() {
  const resource = {
    title: "OCR_" + title,
  };
  const option = {
    "ocr": true,
    "ocrLanguage": "ja",
  }
  Drive.Files.copy(resource, fileId, option);
}

タイトルを指定してプログラム実行すると、以下のようになります。

おわりに

ということで、「GASでGoogle Driveの画像ファイルをOCRする」に関してアレコレ書いてみました。

今回OCR処理した画像は1ファイルでしたが、OCR処理したいファイルが増えれば増えるほど大変になります。
それをGASで処理できると、かなり楽になるかなと思います。

前回の記事では「フォルダ内のファイル一覧を取得する」を紹介しています。
それと組み合わせると、まとめてOCR処理することができます。

プログラムを具体的に説明する記事は今回が2記事目です。
おそらくあと1記事、投稿することになるかなと思います。

この記事が参考になれば幸いです。

関連記事のリスト、改めてリンクしておきます。

全体

GASを活用してGoogle DriveでのOCR処理を効率化（自動化）

プログラム詳細説明

【GAS】Google Driveの指定したフォルダ配下のファイル一覧を取得
【GAS】Google Driveで画像ファイルをOCRする ← 今回の記事
【GAS】Googleドキュメントの中身を調整する（文字サイズ/文字色/余計な文言を除去）

GAS（Google Apps Script）に関してはいくつか記事にしています。
気になる記事があればぜひ。

GASの活用事例

GASを活用してGoogle DriveでのOCR処理を効率化 - 派生記事

みやもとメモ

「Notion」「Google Apps Script」「ブログカスタマイズ」などについて書いていきます。