みやもとメモ

「Notion」「Google Apps Script」「ブログカスタマイズ」などについて書いていきます。

目次
目次

【GAS】Google Driveで画像ファイルをOCRする

この記事をシェアする

今回はGAS(Google Apps Script)に関して書いていきます。

以前もGASに関する記事を書いています(以下リンク)。

miya-moto-memo.hatenablog.com

上記の記事で、GASを活用したOCR処理の効率化に関して書いています。
プログラムも載せていますが、プログラムの具体的な説明はしませんでした。

今回の記事で、プログラムを具体的に説明していこうと思います。
ただ、プログラムはけっこう長いので何記事かに分けて書いています。
プログラムを具体的に説明する記事は、今回が2記事目です。

関連記事をリストにまとめると、以下のようになります。

ということで、今回は「Google Driveで画像ファイルをOCRする」部分に関して書いていきます。

それでは本題へ。

今回説明するところ

miya-moto-memo.hatenablog.com

上記リンクに全体のプログラムが載っていますが、この記事では部分的にピックアップして説明していきます。

フローチャートでいうと、以下(赤枠部分)に関して説明していきます。
※createDocFromImg

フローチャート(今回説明するところ)

やりたいこと

以下の操作をプログラムで処理されるようにします。


STEP
画像ファイルを右クリック → アプリで開く → Googleドキュメント
STEP
Googleドキュメントが開く(画像がOCR処理されている)

プログラム事前準備

プログラムを実行する前に、前提となる情報をいくつか書いておきます。

OCR処理対象のファイルを決める

OCR処理対象のファイルを決めます。

OCR対象のファイル

画像ファイルの中身はこんな感じです。
※画像はChatGPTで適当に作った文章で、それを写真で撮った画像です。

画像ファイルの中身

ファイルIDを控えておく

プログラムを実行する前に、ファイルIDを指定する必要があります。
ファイルIDは以下の手順で取得できます。

  • 「画像ファイルを右クリック」→「共有」→「リンクをコピー」
  • コピーされたURLからファイルIDを控えておく
ファイルIDの取得手順

Drive APIを有効化する

Drive APIを有効化します。
バージョンは「v2」と「v3」があり、今回は「v2」を選択します。

Drive APIを有効化

プログラム

// ファイルID
const fileId = "ファイルIDを指定";

/**
 * メイン処理
 */
function main() {
  const resource = {};
  const option = {
    "ocr": true,
    "ocrLanguage": "ja",
  }
  Drive.Files.copy(resource, fileId, option);
}

上記のプログラムを実行すると、Googleドキュメントが作成されます。
作成されたGoogleドキュメントを開くと、OCR処理された状態を確認できます。

プログラム実行
Googleドキュメントが作成される
画像がOCR処理される

「Drive API」の詳細

上記のプログラムから、「Drive API」に関する処理をピックアップして具体的に説明します。

Drive.Files.copy(指定したファイルをコピーする)

Drive.Files.copyの詳細
「Drive.Files.copy」で、指定したファイルをコピーできます。
リファレンスをリンクしておきます。

developers.google.com


タイトルを指定してみる

// ファイルID
const fileId = "ファイルIDを指定";
// ファイル名
const title = "お試し実行";

/**
 * メイン処理
 */
function main() {
  const resource = {
    title: "OCR_" + title,
  };
  const option = {
    "ocr": true,
    "ocrLanguage": "ja",
  }
  Drive.Files.copy(resource, fileId, option);
}

タイトルを指定してプログラム実行すると、以下のようになります。

指定したファイル名で作成される

おわりに

ということで、「GASでGoogle Driveの画像ファイルをOCRする」に関してアレコレ書いてみました。

今回OCR処理した画像は1ファイルでしたが、OCR処理したいファイルが増えれば増えるほど大変になります。
それをGASで処理できると、かなり楽になるかなと思います。

前回の記事では「フォルダ内のファイル一覧を取得する」を紹介しています。
それと組み合わせると、まとめてOCR処理することができます。

プログラムを具体的に説明する記事は今回が2記事目です。
おそらくあと1記事、投稿することになるかなと思います。

この記事が参考になれば幸いです。

関連記事のリスト、改めてリンクしておきます。

関連記事

GAS(Google Apps Script)に関してはいくつか記事にしています。
気になる記事があればぜひ。

GASの活用事例


GASを活用してGoogle DriveでのOCR処理を効率化 - 派生記事

TOPへ戻る HOMEへ