OSSにおけるレガシーエンコーディングの変換機能
LE-talk-jaというメーリングリストが開催された。OSSのUnicode対応で生じている日本語文字コード変換で新たに生じた問題を解消するために、統一したコード変換の実装、変換ガイドラインの作成を行う。このプロジェクトは情報処理推進機構の2005年下期オープンソースソフトウェア活用基盤整備事業http://www.ipa.go.jp/software/open/2005/result.html の支援を受けている。
詳細は当該メーリングリストで議論するとして、下記の問題について解消をめざす。
- 「〜」が文字化けする。
- WAVE DASH vs FULLWIDTH TILDE 問題。
- cp932/eucJP-ms と iso-2022-jp との間で文字コード変換が出来ない。
- sjis と euc-jp 間で相互に文字コード変換が出来ない。
- US-ASCII と JIS X 0201 ラテン文字 で 0x5C/0x7E の Unicode との対応付けが異なる事による問題。
- 従来変換可能であった機種依存文字 (Windows) が Unicode 化によって変換出来なくなった。
- EUC-JP で入出力を行うような Web アプリケーションで機種依存文字が文字化けしてしまう場合がある。
本開発では、以下のOSSが作業対象。
OSC2006でも発表します。あ、今みたら満員御礼だ。参加の皆様ありがとうございます。(ぺこり)http://www.ospn.jp/osc2006/modules/eguide/event.php?eid=53
なおプロジェクトのホームページ(sourceforege.jp)はhttps://sourceforge.jp/projects/legacy-encoding です。