明昌堂クリエイティブレポート
70/158

■■DTPデータ抽出の問題点 新聞、雑誌やカタログなどの紙メディアから、ニュースサイトやSNS、オンラインショップなどのインターネットメディアまで、現在の情報発信方法は多岐に渡っています。発信者としては、ひとつのコンテンツをなるべく多くのメディアに、効率良く展開することが理想ではないでしょうか。 マルチメディア展開を考えていくと、必ずたどり着くのがデータベース化です。データベース化を行うためには、コンテンツの内容を「タイトル」「見出し」「スペック」などの項目に細分化し、リスト化することが必要になります。 しかし、紙メディアの場合は紙面を完成させることが先に立ち、なかなかデータベースまで手が回らないのが現状ではないでしょうか。Webコンテンツであれば、HTML自体が構造化されたテキストなので比較的二次利用しやすいのですが、DTPは自由にデザイン、レイアウトができる反面、一旦紙面化されてしまうとそのデータは転用しづらくなってしまいます。

大見出し

 

中見出し

  

小見出し

本文あいうえおあいうえおあいうえおあいうえおあいうえおあいうえおあいうえおあいうえおあいうえおあいうえおあいうえあいうえおあいうえおあいうえおあいおあいうえおあいうえおあいうえ

■専用プログラムによるデータ抽出 当社ではDTPデータからのテキスト抽出をより効率的に行うため、データ抽出専用プログラムを導入しています。 このプログラムは、InDesignのデフォルトである索引抽出機能や目次抽出機能では補えない、「段落スタイル」「文字スタイル」「フォント名」「文字サイズ」「レイヤー」「正規表現」といった項目を検索条件に指定することができます。そのため、これまで手作業で行っていたInDesignファイルからの抽出作業を、ほぼ自動で行うことが可能です。 汎用性も高く、裏面で紹介しているように様々な商品で活用できます。 そのほかにも以下のような特長があります。①データベース構築 カタログ、ガイドブック、辞典など、データベース化を前提として作られていないデータからでも、CSV形式でテキストを抽出することで、データベースを容易に構築できるようになりました。②派生商品を効率的に制作 当社の自動組版技術を併用することで、オリジナルのコンテンツからこれまでより効率的に派生商品を制作することが可能です。学習教材やガイドブック、商品カタログ等に活用できます。③画像データ抽出 画像リンク情報(ファイル名)も抽出データにひも付けできます。紙メディアから電子書籍やインターネットメディア、eラーニングコンテンツなどへ効率的に転用できます。④インデックス(索引)作成 特定のスタイルの文字を、ノンブル情報と同時に抽出。これまで行っていたマーカー指定などが不要になり、索引を効率的に作成することができます。HTMLの場合それぞれの要素がマークアップにより明確に区別されているが、InDesignは独自のタグがテキストに挿入されていてリスト化しづらい構造になっている。1/2http://www.meisho-do.co.jpMeisho-do Creative Report Vol.38July 03,2017HTMLInDesignInDesignDTPデータの多くは、二次利用を考慮した作りになっていません。当社が導入しているデータ抽出プログラムは、InDesignファイルからCSV形式など二次利用しやすいデータを効率的に抽出します。既存のInDesignファイルから二次利用データを抽出する

元のページ  ../index.html#70

このブックを見る