[ 目次 | 3.
| 5. ]
4. APフォントライブラリの現状
上村圭介
オリジナルデータの概要
APフォントライブラリは、APフォントライブラリは、東京外国語大学アジア・アフリカ言語文化研究所が作成した文字データを元にして構築されている。
このデータは、同研究所から1999年10月に国際大学グローバル・コミュニケーション・センター(GLOCOM)に譲渡され、現在は国際大学GLOCOMが文字データの変換などの作業を行なっている。
譲渡された文字データは次の通りである。
-
アラビア文字
-
モンゴル文字
-
タイ文字
-
クメール文字
-
デーバナーガリー文字
-
ベンガーリー文字
-
チベット文字
-
ラオス文字
-
ビルマ・モン文字
-
タミル文字
-
カンナダ文字
-
マラヤラム文字
-
テルグ文字
この中で、今年度はクメール文字のためのフォントセットを作成作業を行なった。後述するように、このフォントは未完成のものであり、このままの状態では実用に耐えるものではないが、次のURLから入手することができる。
変換の方法
昨年度の作業では、ビットマップからアウトラインへの変換の際に、フリーで提供されているUNIX系OSのソフトウェアを利用した。しかし、このソフトウェアは、1024×1024のマトリクスによって構成されるグリフデータを変換することに最適化されているため、AA研の96×96のマトリクスのデータを変換しても、その後で大幅な補正が必要であることが分かった。
そこで、今年度は次の二つの商用ソフトウェアを利用してデータの変換を試みた。
-
ScanFont(Pyrus NA, Ltd.)
-
FontLab(Pyrus NA, Ltd.)
ScanFontは、点の集まりであるビットマップデータからアウトライン(輪郭)を生成するためのソフトウェアである。FontLabは、ScanFontなどで作成したアウトライン化フォントデータの補正や補助情報を整理するためのソフトウェアである。
変換の結果と問題点
上記の方法によるフォントライブラリ作成作業にあたり、次の問題が明らかになった。
-
AA研文字データのビットマップからアウトラインデータへの変換
-
グリフの補助情報(字種、論理幅、垂直位置など)の変換または作成
-
既存コード表のコードポイントへの割り当て
一つめの問題点は計画当初から予測されていたものである。元データは、96×96ドットのマトリクスによって表現されているが、実際には文字の天地左右にかなりの余白が確保されているため、実質的にはその半分以下の密度のデータとなっている場合が多い。このため、アウトライン化処理をしたデータは無補正のままだと、本来直線や曲線であるべき筆画が破線として処理されるなど、変換後のデータの品質が著しく低下する例が見られる。
2点目は、補助情報をどのように扱うかという問題である。AA研文字データは、
の補助情報を含む(昨年度報告書参照)。
AA研フォントのグリフの例を次に示す。

2本の垂直線は、このグリフの論理幅の右端と左端をそれぞれ表す。また、グリフパターンの中央よりやや下を突き抜ける水平線は、このグリフの垂直位置を表している。
ただし、AA研フォントのこれらの属性を、作成したアウトラインフォントデータに取り込むための作業は、未着手である。既存のアウトラインフォント形式でも同様の補助情報は保持しているため、AA研フォントがもつ属性の値を何らかの方法によって変換することは可能であるが、今年度はそこまで到達しておらず来年度以降の作業となる。
また、3点目としてコード表へのマッピングが挙げられる。クメール文字のコードポイントは、現在国家標準によって定められているものがないため、de
facto標準である、LimonフォントまたはABCフォントのコードポイントに、AA研文字データを割り当てている。サンプルデータについては、コードポイントの割り当ては概ね完了したと言える。しかし、LimonまたはABCにあるグリフが、AA研文字データにない場合、あるいは、その逆でAA研文字データにあるグリフがLimonまたはABCにない場合があり、これらのグリフをどのようにマッピングするか(あるいはマッピングしないか)は検討が必要である。現在は、一対一で対応しないこれらのグリフについては、マッピングを見送っている。
今年度は、アウトラインの補正を重点的に行なう予定であったが、オリジナルデータの情報量の制約から、実際には補正で補いきれる作業ではなかった。今後はアウトラインの補正作業は一次的に留保し、フォントとして使う際に必要なコード表へのマッピングと補助情報の付与という二つの作業を優先して行なう必要があるだろう。
今年度の成果
言語文化資産の継承という点からも、譲渡を受けたデータを広く一般にアクセス可能にしておくことは重要である。そこで、アウトラインデータとは別に、AA研から譲渡されたフォントデータを暫定的に一覧できるライブラリを構築した。フォントデータの一覧は、クメールだけでなくAA研から譲渡されたすべてのデータについて作成されており、
からアクセス可能である。
[ 目次 | 3. | 5.
]