- Unicode-シフトJIS変換テーブルです。各種ユーティリティの作成にお役立てください。
- このファイルの内容および書式・仕様は予告なく随時変更します。ダウンロードした方にも更新情報はお伝えしておりませんので、必要に応じて適宜このページから最新版をダウンロードするようにしてください。
- このファイルは著作権を放棄しております。ダウンロード、変改、再頒布、転載などは自由に行ってかまいません。
- 逆にこのファイルの内容の正当性について青蛙亭主人は一切の保障をいたしません。運用は自己責任で行ってください。
- uni2sj.zipを解凍するとuni2sj78.csv、uni2sj83.csv、uni2sj90.csvの3ファイルができあがります。見てのとおり、Unicode(UTF-8)から78年、83年、90年のJIS(シフトJIS)への変換テーブルとなっています。
- 各ファイルは16進数で記述されたCSVファイル(カンマ区切りファイル)であり、書式は以下のとおりです。なお、1行目にはフィールド名は記されておらず、いきなりデータが始まります。
- Unicode……実際にはUTF-8です。
- シフトJIS
- 末尾にもう一つカンマが入っています。
- UTF-8化したのは、現実にはUTF-8を処理するのがほとんどだからです。念のためUnicodeからUTF-8への変換方法を書いておきます(この逆はわかると思いますので割愛します)。
- Unicode→UTF-8
- Unicodeが0000-007F……下位1バイト
- Unicodeが0080-07FF……Unicodeを2進数に直した値を00000xxxxxyyyyyyとするとき、2進数で110xxxxxを1バイトめ、10yyyyyyを2バイトめとする
- Unicodeが0800-FFFF……Unicodeを2進数に直した値をxxxxyyyyyyzzzzzzとするとき、2進数で1110xxxxを1バイトめ、10yyyyyyを2バイトめ、10zzzzzzを3バイトめとする
- ダウンロードは、「右クリック→対象をファイルに保存」でなさることをお勧めします。
|