日本 イ ソ 株式会社
技術統括室
田丸健 郎
Google | Official Blog “Unicode over 60 percent of the web” Feb 03, 2012
一般 使用さ い
世界 主要言
語 全
い
○ ○ 語版 例:日本語
言語 関
係 い
0 20 40 60 80 100 120
Safari iPad Firefox 19 Chrome 25 Internet Explorer 9
対応言語数
0 20 40 60 80 100 120
Windows 3.1 Windows 95 Windows 98 Windows XP Windows 7 Windows 8 対応言語数
109 言語 対応
開
大幅 変更
入力
キ イ
補助 IME
表示
ン
描画 ン ン
処理
変換 文 変換
109 言語 選択
表示言語
入力言語
選択 能項目
表示言語
入力方式
Web ン ン 言語
日本語キ
英語キ
ン キ
複数 言語 同時 録
能
入力 言語 応
動的 替え こ
能
物理キ も同
様 替え こ
出来
101 キ 日
本語 英語を 替
JIS X 0208 + メーカー拡張MS-DOS 2 - , MS OS/2 1.x, MS-Windows 2.x, 3.0
Windows 3.1, NT 3.1/3.5, 95, NT 3.51/4.0
Windows 98, NT 4.0 SP4, 2000, Me, XP
Windows 8, Windows Server 2012
Windows Vista, 7
Unicode 6.0
文 文 列 処理
ン ン 描画 表示
OpenType Font (ISO/IEC 14496-22:2009)
文 入力
Windows IME
各言語 キ イ
OS ン っ 異
対応
JIS 第 水準 第 水準
JIS Codepage 932)
を含
Unicode
文
IVS を含 単語 変換 限
組織毎 入力 能文
を 御 使用 文 を管理 こ 出来
JIS X 0208 文 使用を
許
JIS X 0208 JIS X 0213:2004 文
使用を許
IVS を含 全 文 入
力を許
変換候補 表示 使用さ ン
拡張さ IME 辞書 対応 文 を
表示 対応 ン 変
更 必要
AJ1 Hanyo-Denshi 対応 ン
IPAmj 明朝
Unicode IVS/IVD 限
ン い文
表示 出来 い
→ 対応 ン 使用
ン イ
表示候補数を変更 能
約58,000字 外字
非漢字 659字 第四水準 2,436字
第三水準 1,259字 JIS X 0213
JIS X 0208
第二水準 3,390字
第一水準 2,965字
非漢字 524字
外 無い世界
実現 向け
基
非漢 659
第 水準漢 2,436
第 水準漢 1,259
第 水準漢 3,390
第 水準漢
2,965
非漢 524
JIS 2004
形 変更さ
MS 対応を 行っ 文
122
JIS X 0213:2004
JIS X 0208:1997
303 (2004) (2000:302 )
通産省に 定め れた 最初の文字コード規格
規格票例字体 約250字に変更
第 2水準漢字に2文字 追加 人名用漢字
表外漢字字体表
• 印刷標準字体
• 簡易慣用字体
Unicodeの対応
1978
1983
1990
2004
6,802
6,877
6,879
11,233
使用
JIS
ここ !
類 冊数 出現文 数 出現漢 数
単行本 540 88,189,211 53.9% 24,858,027 51.9%
刊誌 120 32,971,129 20.2% 9,560,173 19.9%
週刊誌 150 23,477,267 14.4% 7,688,151 16.0%
辞典 事典 12 18,849,349 11.5% 5,818,082 12.1%
合計 822 163,486,956 100.0% 47,924,433 100.0%
※ 漢 出現頻度調査 2011 凸版印 株式会社
区 漢 数 形数
Unicode /
AJ1-6
JIS X 0208 47,542,535 99.2% 5,774 67.3%
JIS X 0208 以外 70,049 0.1% 1,426 16.6%
AJ1-6 140,028 0.3% 393 4.6%
記以外 171,821 0.4% 983 11.5%
豪快 47,924,433 100.0% 8,576 100.0%
※ 漢 出現頻度調査 2011 凸版印 株式会社
出現 漢 99.6% Adobe Japan 1-6 包含さ い
Unicode ン
定年 文字数 詳細
1.1 1992 34,233 • JIS X 0208 JIS X 0212 を含 Unicode ン 2.0 1996 38,950
• を技術仕様 採用 こ 時 文 未定義 あ 3.1 実装
• ン 文 移動 (Unicode 1.1 互換性消失)
• (技術仕様 JIS X 0213:2004 対応)
2.1 1998 38,952 • 通貨記号追加 多少数 記号定義変更
3.0 1999 49,259 • CJK 統合漢 拡張 A 漢 6,582 文 追加
3.1 2001 94,205
• 303 文 を追加
• JIS X 0213:2000 一部対応 言語 追加
• CJK 統合漢 拡張 B 追加
• CJK 統合漢 拡張 B 漢 42,711文 追加
3.2 2002 95,221
• JIS X 0213:2000 びJIS X 0213:2004 正式対応
• 異体 1 ~ 16 追加
• JIS X 0213:2004 追加 10 文 在
• CJK 互換漢 追加さ JIS X 0213:2000 漢 59 文 び追加丸付 数 (~
㊿) 非漢 を追加
4.0.0 2003 96,447 • 異体 17 ~ 256 追加
5.0.0 2006 99,089 • BMP(基本多言語面) 領域 文 追加
• 領域 キ 文 追加
6.0 2010 109,449 • ISO/IEC 10646:2010
• 絵文字の追加
収録 情報量 限 あ
単一 ン 全 文 を収録 い
イン 16 ビ
最大収録数: 65,535
イ 最大 イ 4G イ
出版物 多 JIS も
Adobe-Japan1 ン 収 範
文 を使用 い
け 文 議論
円滑 文 情報 流通
大 い 実装 容易
文化 保
用途 限定さ 文 整理 ン
時間 OS ンを越え 同 文 を表示出来 い
168 形変更 JIS90 & JIS 2004
外
作成者 意 表示
作成者 意
異 ン 表示
第 水準 第 水準 不足 多 文
広 使用さ い 文 あ
JIS 世界 符号化さ い
い
第 水準漢 3,390
第 水準漢
2,965
戸籍統一文
56,040
民基本 帳ネ ワ 統一文
21,039
JIS 漢
10,050
常用漢