標準情報(TR) TR X 0020:2000

ニュース情報交換のための文書型定義

Document Type Definitions for News Distribution



序文

この標準情報(TR)は,1998年度の日本新聞協会 SGML等利用研究 及び1998〜1999年度における(財)日本規格協会 情報技術標準化研究センター(INSTAC) の電子出版技術調査研究をもとに工業標準化の促進に関連して特に重要と判断される 技術情報をまとめ,標準情報(TR)タイプIIとして公表するものである。

1. 適用範囲

この標準情報(TR)は,報道機関, そのサービスを受ける一般の視聴者・購読者及び それらに介在するデータベースなどが扱うニュース情報を, 標準一般化マーク付け言語SGML(ISO 8879又はJIS X 4151) によって記述し, 集配信するために必要な文書型定義を規定する。記述された ニュース情報の集配信は, ニュース情報の集配信モデルに基づく。

2. 引用規格

次の規格及び標準情報(TR)に含まれる規定内容は, この標準情報(TR)の文中での引用によって,この標準情報(TR)の規定の一部となる。 表示された版は,この標準情報(TR)の出版の際に有効であったものとする。

ISO 8879:1986 Standard Generalized Markup Language (SGML)

備考 JIS X 4151-1992 文書記述言語 SGMLが, ISO 8879:1986及びISO 8879/Amendment 1:1988の内容に 技術的追加及び編集上の変更を加えたものである。

TR X 0008:1999 拡張可能なマーク付け言語 (XML) 1.0

備考 Extensible Markup Language (XML) 1.0, World Wide Web Consortium Recommendation http://www.w3.org/TR/REC-xmlが, この標準情報(TR)に一致している。

3. 定義

JIS X 4151及びTR X 0008:1999の定義をこの標準情報(TR)に適用する。この標準情報(TR)で用いる それ以外の主な用語の定義は, 次による。

3.1 ニュース情報

見出し, 記事, 及び関連する図表, 写真等で構成される情報に, 配信側・受信側に必要な情報を添付したもの。記事には, 文章の形態をとるもの, プロ野球の得点経過・個人記録表,選挙の立候補者名簿などの特定の体裁をとるフォーマット電文がある。

 備考 この標準情報(TR)では, その本体において, 記事及び関連の図表を扱い, フォーマット電文については, プロ野球電文を附属書Dに示す。

3.2 字解

ニュース情報の交換において, SGMLの宣言で示した文字符号にない文字について解説すること。

4. ニュース情報の構成

4.1 基本構成

全体の階層が浅い場合には, 個々の要素をキーとしてデータベースの検索が容易であるが, 大きなくくり(“記事部属性”の“xx”など)での検索が難しくなり, 下位構造の変更の柔軟性に欠ける。この点を考慮して階層を深くし, 柔軟性を高めることによって, 今後予想される構造変更に対応しやすくさせるために, 第1階層を“記事部”,“記事部属性”,“配信情報部”の3要素で構成する。

4.2 記事部

記事部は,“見出し”,“記事”,“図”及び“表”によって構成する。

4.2.1 見出し

“見出し”には, “主見出し”,“副見出し”などがある。これらは, type属性値に記述することによって分ける。見出しの肩, 脇などの表現は, 繰り返しによって吸収する。

4.2.2 記事

“記事”には, “リード”,“本記”,“解説”,“抄録”などがある。これらは, type属性値に記述することによって分ける。

“概要”及び“抄録”は, 本文の一部を電光掲示などに使用することを意識している。しかし, これらは常に発生する要素ではなく, すべてが繰り返し発生することもあるので, “記事”の属性値として扱う。

4.2.3 図および表

図版及び表の記述については, ファイル名を記載して外部ファイル参照とする。

4.2.4 共通に発生する要素

各要素を構成する要素の中で, 共通に発生する要素は, 次に示すとおり, まとめて別の名称で扱う。

a) %TEXT

“見出し”,“記事”,“注釈”などの日本語表記を行う箇所では, “字解”が発生し得るので, “%TEXT”という共通の要素を作成して, その下に“ルビ”及び“字解”をもたせる。

“欧文”は記事中に出てくる英文テキスト,“強調”は組版等を行う際の飾りを意識したテキストとする。

b) %飾り

箇条書きの情報を記述する“リスト”, 他文献又は外部の著作物などの引用文を記述する“引用”, 参照先のテキストを記述する“参照”, 体裁整形済み情報(詩, 川柳などのフォーマットを考慮したもの)を記述する“整形済”, 及び“%TEXT”をまとめて, “%飾り”とする。

4.2.5 コピーライト

“コピーライト”は, “著作権”,“著者”,“日付”,“発信地”,“発信社”及び“%TEXT”によって構成する。記事,記事部,又は段落に付けられる。

4.3 記事部属性

“記事部属性”以下の第2階層は, “発行メディア”,“ジャンル”,“重要度”,“編集情報”,“日付情報”及び“編成種別”とする。

“発行メディア”は, 発行元を記す。例えば, 本紙, 英字新聞, 他メディアへの出力先などをここに入れる。

“ジャンル”は, 記事又は見出しの分類を記述するもので,“ジャンル1”及び“コメント”によって構成する。“ジャンル1”に記事又は見出しの分類を表記し,“コメント”に“ジャンル”に関するコメントを記述する。

“重要度”は, 記事の重要性に従って, “スクープ”,“フラッシュ”,“ラテ禁”などの扱い方を記述する。

“編集情報”は, 編集者への注意喚起, 連絡事項などを記述する。下位に,“注釈1”,“注釈2”及び“行数”を要素としてもつ。

“日付情報”の下位に,“解禁日時”,“発生日時”,“期間限定”及び“メモ”の要素をもたせる。“日付情報”は, 記事の日付に関する情報を記述する。“日付情報”は,“発生日時”,“解禁日時”,“期間限定”及び“メモ”を含む。

“編成種別”は, ニュース情報を流通させるために必要な記事の編成に関する情報を記述する。“編成種別”は,“分割情報”,“電文種別”及び“記事ID”を含む。“分割情報”は, 一つの記事がいくつかのデータに分割されたときの順番, 総本数などを示す。

5. 要素一覧

ニュース情報の交換における要素及びその意味を, 次に示す。

5.1 共通識別子及びその機能

共通識別子又は実体名

意味

NSK-NEWS

ID属性値に電文のIDを記述

記事部

記事全般に関する情報

見出し

見出し文を記述し,type属性値に見出しの種類を記述(“主見出し”,“副見出し”など)

ID属性値に図のファイル名を記述

ID属性値に表のファイル名を記述

記事

type属性値に記事のタイプを記述(“リード”,“総合リード”,“本記”,“一報”,“解説”,“雑観”,“サイド”,“骨子”,“要旨”,“全文”,“詳報”,“概要”,“抄録”など)

段落

段落の内容を記述

コピーライト

著作権に関する情報

著作権

著作権があるかないかを記述

著作権日

著作権が発生した日付を記述 (備考1参照)

著作権者

著作権をもつ人又は社の名前を記述

著者

著者に関する情報

所属

著者の所属する部署,機関,団体,組織などを記述

氏名

著者の氏名を記述

経歴

著者の経歴を記述

日付

記事部,記事又は段落を発信した日付を記述 (備考1参照)

発信地

記事部,記事又は段落を発信した地名を記述

国名

記事部,記事又は段落を発信した国名を記述

発信社

記事部,記事又は段落を発信した社名,団体名などを記述

記事部属性

記事部の属性に関する情報

発行メディア

発行する,又は発行したメディアを記述(例えば,共同通信社のときは“共”)

ジャンル

ジャンルに関する情報

ジャンル1

ジャンルを記述(“社会/裁判....”など)

コメント

ジャンルに関するコメントを記述(“オウム関連”など)

重要度

記事がどういう扱いかを示す重みを記述する(“スクープ”,“フラッシュ”,“ラテ禁”など)

編集情報

編集者への注意喚起又は連絡事項を記述

注釈1

見出し編注部を記述

注釈2

末尾編注部を記述

行数

本文行数を記述

日付情報

記事部の日付に関する情報

発生日時

記事部の発生日時を記述 (備考2参照)

解禁日時

記事部の解禁日時を記述 (備考2参照)

期間限定

記事部の有効期間(表示可能期間)を記述 (備考2参照)

メモ

縛りなどの連絡事項を記述

編成種別

記事部の編成に関する情報

分割情報

分割情報を記述(A完@など)

電文種別

電文の種類を記述(“通常”,“訂正”,“再訂正”,“訂正とおわび”,“記事取り消し”,“差し替え”,“再差し替え”,“追加”,“挿入”,“削除”など)

記事ID

記事のIDを記述(“政治01”など)

%飾り

文字修飾に関する情報

リスト

リスト(箇条書き)情報を記述

ヘッダ

リストの見出し文を記述

アイテム

リストの内容を記述

引用

引用文を記述

参照

参照先を記述

整形済

体裁整形済み情報を記述

%text

実際のデータを記述

ルビ

後続文字列のルビ(ふりがな)をyomi属性値に記述

字解

後続文字の解説文を記述

強調

後続文字列が強調文字であることを表現

欧文

後続文字列が欧文であることを表現

配信情報部

配信に関する情報を記述

備考1. 日付運用ルール
a) 開始日から終了日までを指定する場合YYYY-MM-DDからYYYY-MM-DDまで
b) 開始日から記事有効日までを指定する場合YYYY-MM-DDから
c) データ発生日から記事有効日までを指定する場合  YYYY-MM-DDまで
d) 日付当日だけを指定する場合YYYY-MM-DD

備考2. 日時運用ルール
a) 年月日及び時分で指定する    YYYY-MM-DD hh:mm

5.2 要素ツリー


6. 文書型定義

4.に示す構造をもつニュース情報の文書型定義は, 次のとおりとする。

<!-- JSA (Japanese Standards Association) 2000 Permission
     to copy in any form is granted for use with comforming SGML 
     systems and appilications as defined in ISO 8879:1986,
     provided this notice is included in all copies. --> 
<!-- Public document type definition. Typical invocation:
  <!DOCTYPE JIS/TR News PUBLIC "JIS/TR X 0020:2000//DTD News//JP"> 
-->

<!-- 構成要素が未決定のタグについては #PCDATA で表記する。 -->
<!ENTITY % text                        "(#PCDATA|強調|欧文|ルビ|字解)*">
<!ENTITY % 飾り                        "(%text;|引用|参照|リスト|整形済)+">
<!ENTITY % 日付                        "CDATA">
<!-- 期間:運用ルール         次の4とおりの形式に従う。
        1.YYYY-MM-DDからYYYY-MM-DDまで    開始日から終了日まで
        2.YYYY-MM-DDから           開始日から記事有効日まで
        3.YYYY-MM-DDまで           データ発生日から記事有効日まで
        4.YYYY-MM-DD               日付当日だけ                     -->
<!ENTITY % 期間                        "(#PCDATA)">
<!-- 基本文書要素 -->
<!-- 新聞協会標準新聞記事:属性        id      電文ID
                                      Ver     DTDのバージョン
     ただし,電文IDは,“一日単位でIDがリセットされることが前提”。
     電文IDは共同電文の主ヘッダの電文ID,"T012"などの4桁の英数字が入る。 -->

<!ELEMENT NSK-NEWS                - -      (記事部属性,記事部,配信情報部)>
<!ATTLIST NSK-NEWS               id       CDATA           #REQUIRED
                               Ver      CDATA           "1.00">


<!-- 記事部構成要素 -->
<!ELEMENT 記事部                - -     (見出し*,記事*,図*,表*)>
<!ELEMENT 見出し              - -     %text>
<!ATTLIST 見出し                  type    CDATA           #REQUIRED>
<!ELEMENT 記事                  - -     (段落|コピーライト)+>
<!ATTLIST 記事                  type    CDATA           #REQUIRED>

<!-- 記事部属性構成要素 -->
<!ELEMENT 記事部属性              - -     (編成種別*,編集情報*,ジャンル,
重要度?,発行メディア?,日付情報,コピーライト?)>

<!ELEMENT 編成種別              - -     (分割情報,電文種別?,記事ID)>
<!ELEMENT 記事ID                - -     (#PCDATA)>
<!ELEMENT 分割情報              - -     (#PCDATA)>
<!ELEMENT 電文種別              - -     (#PCDATA)>
<!ELEMENT ジャンル              - -     (ジャンル1,コメント?)>
<!ELEMENT ジャンル1            - -     (#PCDATA)>
<!ELEMENT コメント              - -     (#PCDATA)>
<!ELEMENT 重要度                - -     (#PCDATA)>
<!ELEMENT 発行メディア          - -     (#PCDATA)>
<!-- 注釈1と注釈2について
	注釈1に“見出し編注部”,注釈2に“末尾編注部”を入れる。 -->
<!ELEMENT 編集情報                - -     ((注釈1?,注釈2?,行数)|#PCDATA)*>
<!ELEMENT 注釈1                  - -    (#PCDATA)>
<!ELEMENT 注釈2                  - -    (#PCDATA)>
<!ELEMENT 行数                    - -    (#PCDATA)>

<!ELEMENT 日付情報              - -     (発生日時|(解禁日時|期間限定|メモ)?)>
<!-- 解禁日時,発生日時は,年月日 時分タイプで記述する。-->
<!ELEMENT 解禁日時              - -     (#PCDATA)>
<!ELEMENT 発生日時              - -     (#PCDATA)>
<!ELEMENT 期間限定              - -     (#PCDATA)>
<!ELEMENT メモ                  - -     (#PCDATA)>

<!-- 配信部構成要素 -->
<!ELEMENT 配信情報部            - -     (#PCDATA)>

<!-- %本文構成要素 -->
<!ELEMENT 段落                  - -     (%飾り|コピーライト|段落)+>

<!-- 図構成要素 -->
<!ELEMENT 図                   - O     EMPTY>
<!ATTLIST 図                   id      CDATA           #REQUIRED>

<!-- 表:属性        id  表idを表記してsgmlファイル外に実体を保持する。 -->
<!ELEMENT 表                   - O     EMPTY>
<!ATTLIST 表                   id      CDATA           #REQUIRED>
<!-- リスト:属性
        style   リストの種類を表記。
                        none    何も付与しないリスト
                        dot     ドット付きリスト
                        number  番号付きリスト       -->
<!ELEMENT リスト                - -     (ヘッダ|アイテム)+>
<!ATTLIST リスト                style   (none|dot|number) none>
<!ELEMENT 整形済                - -     CDATA>
<!ELEMENT コピーライト          - -     (著作権,著者?,発信日?,発信地?,
発信社?,(%text;)?)>
<!ELEMENT 著作権    - O	(#PCDATA|(著作権日?,著作権者))>
<!-- #PCDATAに著作権があるかないかを記述。 -->
<!ELEMENT 発信日	- O	%日付 >
<!ELEMENT 発信社	- O	(#PCDATA)	>
<!ELEMENT 発信地 	- O	(国名|#PCDATA)	>
<!ELEMENT 国名      - O	(#PCDATA)	>
<!ELEMENT (著作権日|著作権者)    - O	(#PCDATA)		>
<!ELEMENT 著者		- O	(所属?,氏名,経歴?)		>
<!ELEMENT 所属		- O	(#PCDATA)			>
<!ELEMENT 氏名      - O	 %text		>
<!ELEMENT 経歴      - O	(#PCDATA)       >
<!ELEMENT 説明      - -     %text>
<!-- リスト構成要素 -->
<!ELEMENT ヘッダ                - -     %text>
<!ELEMENT アイテム              - -     %text>
<!-- %text構成要素 -->
<!ELEMENT ルビ                  - -     CDATA>
<!ATTLIST ルビ                  yomi    CDATA           #REQUIRED>
<!ELEMENT 字解                  - -     CDATA>
<!ELEMENT 強調                  - -     CDATA>
<!ELEMENT 欧文                  - -     CDATA>
<!-- %飾り構成要素 -->
<!ELEMENT 引用                  - -     CDATA>
<!ELEMENT 参照                  - -     CDATA>