本ページでは、WEB-Transer@Enterprise/@クラウドに収録されている「PDFダイレクトファイル翻訳」についてのよくあるご質問を掲載しております。
※弊社のパソコン用翻訳ソフト(PC-Transer/翻訳ピカイチなど)をご利用の方や、本ページよりも詳細な情報が必要な方はサポートブログの記事も合わせてご覧ください。
(CROSS OCRやキャプチャ翻訳などを使用した対策案をご紹介しております。)
元の文字の上に翻訳された文字が重なっている
透明テキストPDFファイル(透明PDF)を翻訳した際に発生します。
透明テキストとは、スキャナが画像を読み取ると同時に文字認識した字を「透明な文として」元の原稿(画像)の上に被せたものです。
透明テキストPDFファイルを翻訳すると、元の透明文字は翻訳後に黒い文字の訳文で置き換えられ、非常に読みにくいファイルが出来上がってしまいます。
PDFファイルの透明テキストをコピーできる場合は、Microsoft Wordに貼り付けて「Officeアドイン翻訳」で翻訳することができます。
ほとんど訳されず、元の文の単語が繋がった文字列になっている
Adobe Acrobat以外のPDF作成ソフトで作られたファイルや、海外のフォントが埋め込まれたファイルの場合、文中のスペースを認識できないことがあります。
スペースを欠いた長大な文字列は文としての解析ができないため、この部分は翻訳されず単に長い文字列として出力され、細切れになっている一部の場所だけが翻訳されたファイルが作成されます。
V5.3ではPDF設定にある「単語間の区切りを検出する」を有効にすると正しく文を認識し翻訳できるようになります。
それ以前のバージョンでは対応策がありませんが、Microsoft Word(2013以降)をお持ちの場合は、PDFファイルをWordで開くことで「Officeアドイン翻訳」にて翻訳することができます。
PDFダイレクトファイル翻訳の制限事項について
PDFダイレクトファイル翻訳は、原文のPDFファイルからテキストを抽出し、翻訳結果のPDFファイルを作成します。翻訳結果ではフォントの種類、サイズ、レイアウトなどを原文と同様に配置します。
ただし、PDFファイルが作成された環境やPDFの状態によっては、翻訳できなかったり、翻訳結果のレイアウトが保てない場合があります。
■ 以下の場合は翻訳できないことがあります。
- セキュリティ保護(ファイル変更禁止、コピー禁止など)機能が使われているPDFファイル
- 文字部分が画像化されている(スキャナで取り込まれた)PDFファイル
- しおり機能が使われているPDFファイル
- フォームが使われているPDFファイル
- Adobe Acrobat5.0以前の環境でFlate(Zip)以外の圧縮方法(LZWなど)で作成されたPDFファイル
- Windows以外のOSで生成されたPDFファイル
■ 以下の場合はレイアウトが保てないことがあります。
- 複雑なレイアウトで構成されているPDFファイル(DTPソフトなどから作成されたPDFファイル)
- 表が多用されているPDFファイル
■ 文字が画像データであるPDFファイルは翻訳できません。
■ 透明テキストデータであるPDFファイルは、画像の上にテキスト文が表示されます。