未来のいつか/hyoshiokの日記

hyoshiokの日々思うことをあれやこれや

補助漢字の思い出

日本工業規格補助漢字(JISX0212)とよばれている規格がある。

http://www.webstore.jsa.or.jp/webstore/Com/FlowControl.jsp?lang=jp&bunsyoId=JIS+X+0212:1990&dantaiCd=JIS&status=1&pageNo=0

文字コードとかレガシーエンコーディングの話をはじめるとやれJISX0208だISO-2022-JPだなんだと急にわけのわからない規格の話がでてきていかんいかんというお叱りを受けそうなのではあるが、ちょっとご容赦願いたい。

JISX0208というのがいわゆる日本語の文字コードの規格で、1978年に最初の版が出版され、83年、90年、97年と改正された。非常によく利用されている規格である。

http://www.webstore.jsa.or.jp/webstore/Com/FlowControl.jsp?lang=jp&bunsyoId=JIS+X+0208%3A1997&dantaiCd=JIS&status=1&pageNo=0

でもって補助漢字なのだけど、正直なところほとんど利用されていない。というか意識して利用している人(いったいどんな人なのだろう?)以外ほとんど利用されていないのじゃないかと思うほど、なかったことになっている。Unicodeには補助漢字の文字はすべて採録されているので、Unicodeを前提にすれば今でもつかえる。

JISX0208の90年改正というのは、83年の改正を受けてのものなのだが、主に二つの問題の解決を目指した。

一つは文字が足りないという要求に対し何らかの解決策を出すということ。もう一つは、83年改正の混乱を収拾することにあった。

83年改正の混乱というのはGoogleで検索していただければいろいろでてくる。http://software.nikkeibp.co.jp/software/special/jiscode/nc.html
78年版から83年版の改正では22組のコードポイントを入れ替え、相当数の字形を変更した。つまり、78年版のプリンタで印刷したものが83年版になると字形が変わってしまうのである。森鴎外の鴎の字の偏部分が区であるが、正しくは區である。(機種依存文字補助漢字で書くと森鷗外となる)83年版での字形の変更で今まで正しい字形で印刷できたものが、できなくなって現場は大混乱に陥ったのである。20年以上の前の話である。国語の書き取りのテストをしようとすると正しい文字が出てこないので、国語の先生は困ってしまったのである。
その混乱を収拾することが一つ。
もう一つが、JISX0208では足りない文字を追加しろという要求である。漢字表が有限集合である以上常に文字が足りないという問題がある。メインフレーマーは独自の漢字コード表を持っていて、各社数百字から数千字のいわゆるベンダー定義文字を利用していた。
各社のコード表を眺め、足りない文字を調査し、選定する。その候補の文字を大漢和字典その他権威ある字書等にあたって確定する。これを数千文字について延々と繰り返すのである。ある意味、字書の編纂に似ていなくもない。

JISX0208の90年改正委員会はそんなような委員会だったと思う。(記憶があいまい)

ここから非常に個人的な印象なのだが、当時の国産メインフレーマーは各社JISX0208をベースとした独自コードを持ち、プロプライエタリなソリューションを持っていたので、83年改正の混乱を収拾することには熱心だったが、補助漢字を作って普及させることにはそれほど熱心ではなかったと思う。むしろ、独自の漢字コードによってユーザーのデータをロックインすることで他社製品へのスイッチングコストを高くするという戦略をとっていたように見える。建前は標準化なのであるが、本当のところ本音レベルではJISX0208を改正して文字を追加して使いやすくするというのは望んでいなかったように思える。そのような綱引きによってJISX0212補助漢字が生まれたという風にわたしは理解している。

結局のところJISX0212が普及しないのは、なかったことにされているのは、メインフレーマーによる積極的なサボリ戦術だったのであるが、Unicodeに全部文字が含まれちゃったので、Unicodeが普及するにつれて、結果として補助漢字の文字が利用できるようになってきたのである。

先日のレガシーエンコーディングオフラインミーティングで冗談半分に芝野さんから「hyoshiokが諸悪の根源の元だ」とか言われちゃったのは、JISX0208の90年改正とJISX0212補助漢字の制定の委員会の末席に座っていたからである。とほほ。