紙で受け取った資料のテキスト化(文字起し)が必要な時、あなたならどうするだろうか。フリーソフトを探したり、手打ちしたり、場合によっては画像スキャンでごまかしてしまったりなんてことも。
実はこれGoogleで可能。
まさかと思った方はこの記事を読んで試してみてほしい。今回は「Googleドライブ」と「Googleドキュメント」を使用した画像データのテキスト化を紹介していく。
Googleドキュメントでテキスト変換できるもの
そもそもGoogleの機能を使ってテキスト変換できる条件はどうなっているのか調べてみた。
・形式
→JPEG、PNG、GIF、PDF(複数ページのドキュメント)の各ファイル
・ファイルサイズ
→2 MB 以下
・解像度
→テキスト高さ 10 ピクセル以上
・向き
→正しい向きにする。画像の向きが間違っている場合は、回転させてから Google ドライブにアップロードする。
・言語
→言語は検出されない。
・フォントと文字セット
→最適な結果を得るには、Arial や Times New Roman のような一般的なフォントを使用する。
・画質
→明るさが均一でコントラストがはっきりしたシャープな画像が最適。
(参考:Google公式ページ)
細かく条件が設定されているのがわかる。しかし、この条件さえ満たせばフリーソフトを探す手間も、手打ちしまくって腱鞘炎を患うこともなく、普段使っているGoogleで画像データのテキスト変換が可能なのだ。
実際に画像をテキスト変換してみよう
STEP1:横書きテキストの変換
1.まずはWordで作成した文書の画像データを用意。※今回はPDFを使用。
2.このデータをGoogleドライブにアップする。
3.アップしたファイルを右クリック→「アプリで開く」→「Googleドキュメント」を選択
4.Googleドキュメントで開くと、PDFファイルの文書がテキストとして表示されている。
※PDFの場合、画像表示はなく文書がそのままテキスト化される。
STEP2:縦書きテキストの変換
手順はSTEP1同様。今回はPNGファイルで検証。
こちらをGoogleドキュメントで開くと、
縦書きであることを自動で判断してテキスト抽出してくれている。縦書きは縦書きのままと思いきや、横書きでテキスト変換される仕様。
しかし、縦書きで変換されても活用に困るのでこれは結果オーライ。今回はWord入力画面のスクリーンショット画像を使用したため、改行の“↲“が“」”として変換されている。しかし、印刷済文書の写真ファイルにはそもそも改行マークは入ってこないため問題ないであろう。
STEP3:手書き文書のテキスト変換
次は手書き文書にチャレンジ。スマホで撮影した写真のjpegデータを使用してみる。
横書き、縦書きと同様にGoogleドキュメントで開いてみると、
完璧である。これはそもそも手書き文字がどれほど綺麗に書けているかにかかっているのだが、綺麗に文字が書けていれば問題なくテキスト化が可能と判明。