行政の世界で乱立している文字コード

 コンピュータが漢字を扱えるようになったのは今から50年近く前のことだ。当時、文字コードとしてJISコード(第1水準と第2水準で約6000字、後に第3水準と第4水準が追加され約1万字となる)が制定された。

 さらに、住基ネットの構築で住基ネット統一文字(約1.9万字)、戸籍のシステム化で戸籍統一文字(約5.5万字)が制定され、行政においては3つの文字コード体系が乱立することになる。

 この乱立状態を解消するために3つの文字コードの和集合が作られ、文字情報基盤文字(略してMJ、約5.8万字)として整理された。

 ちなみに、文科省文化庁が定めた常用漢字、人名用漢字、表外漢字があるが、これらはアナログ文字の体系でありデジタルな文字コードの体系ではない。

 各自治体ではMJ以外にも独自の文字(外字)を作って補っているのが実情だ。そこで自治体情報システムの標準化事業では、このMJを基本として不足文字を追加した「行政事務標準文字」(略してMJ+、約7万字)を使うことになった。

 ところが、ここで問題が起きてくる。フォントファイルは6.5万字が限界であり7万字も扱えず、これを拡張するためにはOSレベルの改修が必要となる。

 ほかにも、IVS対応(異体字セレクタを使用)が難しいベンダーもあり、MJ+の+部分は国際標準化されていないため、(デジタル庁はこれで外字が無くなると言うが)PUP の領域、つまり外字として扱わざるを得ないという問題も発生した。

 さらに、デジタル庁は改製不適合戸籍(文字がデジタル化できず紙のまま管理している戸籍)の存在を知らなかったことが後に発覚し、戸籍の文字を整理する方針は先送り(無期限の経過措置)となった。

 このような事情から当面の対応は苦肉の策にならざるを得ず、デジタル庁がMJ+(約7万字)から不要な文字を削除して6.5万字以内に収まるよう「基本フォントファイル」を提供して対応することになった。