[ 目次 | 4. | 6. ]

5. 多言語化と印刷

大久保彰徳
(株)リコー
インターネットの普及とともに、文書を多言語環境で流通させたいという要請は様々な場面で求められている。多国語による電子情報の流通とともに、従来の紙への印刷による情報の流通・流布は、依然として重要な役割をもつと思われる。

しかし現実には、コンピュータによる多言語化の環境がまだ十分に整っていないということと、さらには各文化圏で長い年月を経て築かれてきた印刷文化が、多言語化という異種の文化を取り込みで新たな表現の形式を獲得するという課題に必ずしもうまく適応できていないことなどがあり、今後の課題も多い。以下多言語化の課題を多言語化の問題点と多言語印刷の問題点に分けて説明する。
 

5.1 多言語化の問題点

(1) 多言語表記

コンピュータによる多言語化の扱いには単一言語を文書単位で扱い、それらの言語を複数を集めて併記することによる多言語の扱いと、一つのフレーズに多言語を含む場合では、コンピュータの扱いも異なり後者の方が遙かに実現に難しい。

多言語併記では複数言語を扱うとはいえ、個々の文書は独立しておりそれぞれの文書ごとに指定が可能である。このような方法で段落毎の指定に従って印刷することができる。

多言語混在の文書では、一つの文の中で複数言語が用いられるもので一つの基本となる言語の上に、一つまたは複数の言語が用いられるもので現在このような文書に対する言語の指定の方法がない。従って任意の言語について適切な印刷指定をする事が困難である。

(2) ブラウザの多言語化

APPFではかつてブラウザの多言語化が重要であるとして、ブラウザを多言語対応するための開発を進め、その成果を1998年のペルー会議で発表し各国への配布を行った。一方で商用ブラウザの多言語化は、Webの国際化に伴い急速に進んだ。代表的なブラウザであるInternetExplorerやNetscapeNavigatorなどはすでに多言語対応がすんでおり、文書単位の多言語の扱いは可能である。

しかし、一つの文書の中に多言語を含む場合についてはブラウザの問題とともにHTMLの指定方法がないため多言語対応が実現しておらず、文書中での多言語の識別ができない。多くの場合OSの多言語化の問題があり英語以外の言語との多国語実現は困難である。

(3) 言語タグの指定

言語の識別のために言語タグを用いるが、通常文章中の要素については言語指定ができるようになっていない。例えば、日本語で記述した文中にフランス語が入った場合は、正確に指示する事はできない。なお、伝統的に英語については、デフォルトで含まれている。特殊な例としては、NewsSGMLの様に要素毎に言語指定できるようにしたものもある。

また言語タグの指定は、一般には国別コードで行うが一カ国で数種類の言語が使われている場合や、同じ(名前の)言語を複数国で使われる場合があるので国別コードだけでは対応できない事が考えられ言語コードとして指定する必要があろう。

(4) 文字コードの問題

文字コードの国際的な標準化のためにUnicodeに基づくISO/IEC 10646-1 1995 国際符号化文字集合(UCS)第1部 体系及び基本多言語面 が開発され、多言語の対応ができるようになっている。しかし多くの国ではその制定以前に文字コードを国家規格等により指定されており現実にはその文字コードが各国で使われており混在する状態である。

またデファクトの文字コードも現実には多く使われており、日本でも国家規格であるJISコードとは別に、シフトJISコード、EUCコードなど数種類の文字コードが実装されている。また、メーカなどが制定した固有の文字コードを使っている言語もある。

(5) 文字と文字コードの関係

文字と文字コードが一体一に対応していない言語もある。この場合一体一に対応している言語との間で混在をする時には処理が非常に困難になる。その場合には全字形について文字コードでの表現が基準になろう。

文字要素について文字コードが割り当てられている場合、その組み合わせによる文字構成を表現する場合は専用のツールを使う必要があるなど一般に容易ではない。

そのような文字要素を用いる場合には、FEPを用いて編集が行われることがあり、その場合には文字コードが文脈依存になるなどの問題もあり、その場合には文字検索機能が制約されるなどの問題もある。

2. 多言語印刷の問題点

(1) フォントの問題

フォントは、ビットマップフォントとがあるがこれらの組み合わせについてはレンダリング上の問題がある。また合成フォントでは組み合わせの問題があり、例えばクメール文字では組み合わせが非常に複雑であり、文字が基本文字の前後左右につきベースラインの位置についても従来のベースラインだけでは位置関係が正確に表現できないものもでている。

(2) 文字要素の問題

文字要素には、縦組み、横組みの問題、その中での混在の問題、左から右、右から左への文字方向の問題、さらには約物の扱いなど従来の印刷文化のなかで培われた表現の問題が電子化と多言語化により複雑な組み合わせが要求されるようになっているが、こうした問題を解決できる適当なレンダリングシステムは出来ていない。

(3) ロケール

年号表記など、各国の文化的背景により異なる扱いが必要な記述もある。例えばその場合に変換をするのか、併記するのかなどによっても扱いが異なる。

(4) 印刷システムの問題

組版規則については、漢字圏の中でもかなり多くのバリエーションが見られる。句読点やルビの位置などが異なったり、禁則処理についても異なる扱いが要求される場合がある。

HTMLによる印刷成形は、CSSで規定しているが多国語の場合のフォーマット処理については、上記の対応はまだ未解決の問題が多い。

用紙サイズは、ISOで国際的に決められているが、国によりそれ以外のものも帰営している場合がある。米国のレターサイズ、リーガルサイズや我が国のJISのB系列もISOには規定されていない。

(5) その他

電子文書の優れた点は検索にある。もちろんWeb上の文書も同様である。しかしこの検索は文字コードに依存するため、問題を生じる。表記方法と入力方法との関係が確立していない場合、または表記方法と文字コードとの関連が一意的についていない合成フォントを使う場合など、検索がスムーズに出来ない。また日本語の表記では、かな、カタカナの間での問題また音引きなどを含む表記の問題、さらに漢字や外国語表記間の問題、など簡単には解決出来ない問題への対応も考慮される必要がある。

こうしたいくつかの問題を解決しないと、多言語混在環境の印刷はたとえ実現できたとしても見た目がおかしなものとして、本格的には使われないものに終わる恐れもある。

現在、こうした課題を解決するために当委員会を含めいくつかの試みが行われているが本格的な試みはまだであり、これからの成果に期待したい。

なお、多言語組版に関しては、日本規格協会INSTACの電子出版技術調査研究委員会WG2で扱っている、漢字圏の印刷システムの分析、検討およびアジアの非漢字圏の分析、検討によるところが大きい。



[ 目次 | 4. | 6. ]