▲DTPデータからPDFを書き出す、もしくは紙の文書をスキャンし、InftyReaderでWordデータとして出力する。その後、Word上で●→DTPデータWordデータDTPデータから書き出したPDFをWordで開き、体裁を整える。文字の不具合を修正、体裁を整える。なおInftyReaderは、Word以外にLaTeX、XHTML(MathML)などの形式でも出力可能。1/2PDFデータhttp://www.meisho-do.co.jpWordデータMeisho-do Creative Report Vol.76August 18,2023■組版データのWord変換 Wordは最大シェアのテキスト作成アプリケーションです。誰でも簡単に扱うことができ、DTPのテキスト原稿はほとんどがWord形式で入稿されます。 一方、できあがったDTPデータをあらためてWordへ変換してほしいという要望が、特に教科書、教材、学術書を制作されているお客様より以前から多く寄せられていました。Wordデータにすることで手元で編集し、二次利用するのがその主な目的です。 これまでDTPデータをWordに変換する一番効率的な方法と考えられていたのは、まずDTPデータからPDFを書き出してそれをWordで開き、Word上で体裁を整えるという工程でした。当社のMCR Vol.45およびVol.70でも詳しく紹介しています。 しかし、この方法では数式などの複雑な文字組みは再現できず、体裁を整えるのに一からWordで組版するのと変わらないほどの手間がかかることがあります。 そのため当社ではよりよい変換方法を探してきましたが、専門的なOCRソフトを活用することにより、今まで以上に効率良く、また数式を含む組版データなども正確に変換できることが分かりました。■InftyReaderの活用 今回紹介します「InftyReader」は、数式を含む文書を処理できるOCRソフトです。 InftyReaderの変換工程は下図のようになっています。変換元の文書はフォーマットを問わず、紙の文書からでも変換が可能です。実際の変換結果はウラ面をご覧ください。 文字スタイル、段落スタイルは移行できませんので、Word上で調整する必要があります。また、表組みや図版が混在していると正しく変換できません。しかし、数式部分は非常に高い精度でWordの数式エディタに変換されます。 シンプルなレイアウトの紙面であれば、InftyReaderでかなり正確な文書変換が行えます。複雑なレイアウト紙面については、例えば元の文書を適宜トリミングし、再整列するなどの事前調整を行うことによって、精度の高い変換結果が得られます。 当社では出版印刷業界内で認知度の低いソフトウェアなども活用して、データ制作の問題解決に取り組んでいます。組版データの加工や再利用について要望がありましたら、是非ご相談ください。DTPデータプリント出力PDFデータスキャニングInftyReaderInDesignなどで作成されたDTPデータ、または紙の文書を専門的なOCRソフトを活用してWordデータに変換する方法をご紹介します。InftyReaderを使った変換工程従来の方法数式を含む文書(紙、PDF)をWordデータに変換する
元のページ ../index.html#147