InDesignでPDF(インタラクティブ)生成時にテキストが勝手に画像化されてしまう現象について

2017年12月05日 更新 | タグ: アクセシビリティ, 技術情報

PDF版 早見表作成裏話で、InDesignで「PDF生成時、テキストが勝手に画像化されてしまうことがある」ということを書きました。その実証実験です。

このページは、同じテーマでの発見があった際、書き足してゆきます。

選択できない文字列=画像化された文字列

InDesignで矩形のパスを作り、文字を流し込んだテキストフレームをそのパスに貼り付けます。そのパスに対して、「ベベルとエンボス」をかけると、そのテキストがPDFにした時に画像化される、という現象です。

PDFへの書き出しは、「PDF(インタラクティブ)」です。閲覧しているのは、Adobe Acrobat Proです。

次の画像を見てください。これはcmd+A(いわゆる全選択)をした状態です。文字列が選択範囲を作っている箇所が「ベベルとエンボス」がかかっていない場所です。上半分は「ベベルとエンボス」がかかっている部分で、文字列を選択できていません。

Adobe AcrobatでPDFを開いた画面。2つの矩形中にそれぞれ文字列があり、片方の矩形では、文字列が選択されているが、片方の矩形では文字列が選択されていない。

なぜこうなるのか?

次の画像がわかりやすいです。「ベベルとエンボス」を強烈にかけた事例です。左上の文字は白く、右下の文字は暗くなっています。文字も「ベベルとエンボス」の効果の影響を受けています。おそらくこの視覚効果を維持するために、テキストデータ化できない、ということになっているのではないでしょうか。

InDesignの画面。矩形パスに強烈にベベルとエンボスをかけることで、文字の一部も色の濃淡の変化を受けている

全部画像と判断された時のAdobe Acrobatの対応

すべて「ベベルとエンボス」がかかっているPDF(おそらく「テキストデータが一切存在しない」とAcrobatが認識したPDF)をAcrobatで開くと、次のようなダイアログが出ます。

Acrobatのダイアログ。スキャンしたページの警告。このページには、画像のみが含まれています。テキスト認識を実行して、このページのテキストにアクセスできるようにしますか? いいえと、はいのボタン。

ここで「はい」とすると、しばらく時間を置いたのち、テキストデータが抽出できるようになります。……が、以下のとおり、フォントにもよるとは思いますが、少々あやしい抽出精度のようです。

Acrobatのテキスト抽出の結果を、メモ帳にペーストしたもの、ひらがなの「し」を、アルファベットの「J」に誤検知していたりする。

とりあえず、今回は以上です。

171205 いきなり加筆:InDesignでテキストが勝手に画像化される効果とそうでないもの

勝手に画像化される効果

画像化されない効果

このエントリーをはてなブックマークに追加

障害当事者がアクセシビリティチェックをしています この製品は障害者が制作に関わっています

ページの終端です。ページの先頭へ