• 検索結果がありません。

EPUB11田丸pdf 最近の更新履歴 epubcafé

N/A
N/A
Protected

Academic year: 2018

シェア "EPUB11田丸pdf 最近の更新履歴 epubcafé"

Copied!
57
0
0

読み込み中.... (全文を見る)

全文

(1)

日本 イ ソ 株式会社

田丸健 郎

JEPA #11 EPUB EPUB3 2012/7/24

(2)

符号化文 集合 重要性

文 歴史 イ ソ

符号化文 集合 符号化方式

規格 歴史

JIS 符号化方式

Unicode 符号化方式

表示 永続性問題 い

Office 2007/2010 & Unicode IVS

(3)

安定 符号化文 集合

ICT 機器間 相互運

用性確保 根幹 基

本要件 一

(4)
(5)

Intel Pentium 66MHz 4~8MB

第二世代 マイクロソフト 標準キャラクタ セット

JIS90, 10646

第三世代 補助漢字をUCS拡張

補助漢字をUCS拡張

AMD K6-2 / MIPS R10000 / Pentium II 266MHz 32 ~ 64MB

第四世代 国語審議会答申に基づく

最新規格への対応

JIS2004

Core2Duo 1GHz ~ 1GB ~

第一世代 Shift JIS

(JIS78 or JIS83) + 拡張

Z80互換CPU 16 ~ 32KB

(6)

1982 12 MS-DOS 2.0 明会 発表

1983 MS-DOS 2.0 対応

半角 1Byte 全角 2Bytes

1

st

Byte 半角 全角を判断

2

nd

Byte Delimiter(‘¥’ )

文 集合 JIS78( JIS83) を基本

拡張文 を 容可能

拡張性 乏 い

(7)

1992 12 Version 1.0 完成

1993 5 Windows 3.1 対応

符号化方式 JIS

文 集合

最新規格 (JIS90) を採用

各 拡張文 を け 含 重複 含

文 を 10646 ッ ン

外 領域を

イ ソ 標準キャ セッ 仕様を凍結

将来 改変 拡張 い

将来 文 拡張 UCS

(8)

1997 12 発表

http://www.microsoft.com/japan/presspass/detail.aspx?newsid=1260

1998 7 Windows 98 対応

UCS 拡張

JIS X 0212 – 補助漢

JIS X 0221 日本語 記号

連 機能追加

UI 使わ 半角 撲滅

UI 向け MS UI )

(9)

2005 7 発表

http://www.microsoft.com/japan/presspass/detail.aspx?newsid=2353

2007 1 Windows Vista 対応開始

JIS2004 対応

国語審議会 答申 基 く例示 体 変更 追加漢 を 映

追加漢 Surrogate Pair

移行 互換性 ッ

Windows XP 向け JIS2004対応 Windows Vista 向け JIS90対応

連 機能追加

日本語 ClearType ン イ UI 採用

対応 行わ

(10)
(11)

う 含 い

文 集合 を規定

JIS Unicode U+xxxx

理 イン ッ を使用

(12)

文 集合を 交換可能 共通 定義さ 方式

Web 用途 符号化方式

を使用

通信 イ 要件 合わ ッ 長

7 16

特 文 扱い ッ 使用出来 い文

対応

‘iso-2022-jp’ UTF-8 UTF-16

(13)

符号化文 集合

UTF-8

Shift-JIS

iso-2022-jp

文字 ー が一体 定義、使用さ いた

文字 符号化方式が 別々に議論さ ように

符号化文字集合 符号化方式

(14)

包摂規準

イ 異 い 一

文 扱う 規準

JIS X 0213 200 規準

イン差

ン イン 違い

(15)
(16)

当用漢

常用漢 表

表外漢 体表

改定常用漢 表

• 1949 11 16 日内 告示

• 1,850

複雑 一部 簡略化さ

• 1981 10 1 日内 告示

• 1,945

当用漢 95 追加

• 2010 6 7 日内 告示 訓令

• 2,136 -5 +196

• 168 例示 変更さ

• 2000 12 最終答申

• 1,022 標準

• 22 簡易慣用

JIS X 0213:2004改正

標準 簡易慣 用 体 採用

(17)

非漢 659

水準漢

2,436

水準漢

1,259

水準漢

3,390

水準漢 2,965

非漢 524

JIS 2004

変更さ

MS 対応を

122

JIS X 0213:2004

JIS X 0208:1997

303 (2004) (2000:302 )

通産省に 定め れた 最初の文字コード規格

規格票例字体 約250字に変更

第 2水準漢字に2文字 追加 人名用漢字

表外漢字字体表

印刷標準字体

簡易慣用字体

Unicodeの対応

1978

1983

1990

2004

6,802

6,877

6,879

11,233

使用

JIS

ここ !

(18)

形 変更

追加面 文

使用 2000

Windows Vista, Windows

Server 2008 JIS 2004

UI 使用

JIS90,

JIS04 両方を使用可能

(OpenType)

JIS X 0208:1990

Windows Vista, Windows 7, Windows 8, Windows Server 2008, Windows Server 2008 R2

搭載さ い OpenType ン 両方 体を い

JIS X 0213:2004

(19)

JIS X 0213:2004 168 形を変更

イ 形変更 122

漢字

MS 明朝 MS

漢字 漢

(20)
(21)

区 点 面 文 を管理

94( x 94 x n [x, y, z]

8,836 /

符号化 こ 区点面 [x, y, z] 変換 仕様

21

Shift_JIS

iso-2022-jp

(22)
(23)

言語 国を超え 相互運用性 相互接続性 実現を

文 表示 イン 見

About the Unicode Standard

The Unicode Standard is a character coding system designed to

support the worldwide interchange, processing, and display of the

written texts of the diverse languages and technical disciplines of

the modern world. In addition, it supports classical and historical

texts of many written languages.

(24)

Unicode

定年 文字数 詳細

1.1 1992 34,233 • JIS X 0208 JIS X 0212 を含 Unicode 2.0 1996 38,950

を技術仕様 採用 時点 未定義 3.1 実装

移動 (Unicode 1.1 互換性消失)

• (技術仕様 JIS X 0213:2004 対応)

2.1 1998 38,952 通貨記号追加 多少数 記号定義変更

3.0 1999 49,259 • CJK 統合漢 拡張 A 6,582 追加

3.1 2001 94,205

303 を追加

• JIS X 0213:2000 一部対応 言語 追加

• CJK 統合漢 拡張 B 追加

• CJK 統合漢 拡張 B 42,711 追加

3.2 2002 95,221

• JIS X 0213:2000 JIS X 0213:2004 正式対応

異体 1 16 追加

JIS X 0213:2004 追加 10

• CJK 互換漢 追加さ JIS X 0213:2000 59 び追加丸付 (

) 非漢 を追加

4.0.0 2003 96,447 異体 17 256 追加

5.0.0 2006 99,089 • BMP(基本多言語面) 領域 追加

領域 追加

6.0 2010 109,449 • ISO/IEC 10646:2010

絵文字の追加

(25)

称 最大値

符号長

( )

UTF-8 U+10FFFF 1 4

UTF-16 U+10FFFF 1 2

UTF-16BE U+10FFFF 1 2

UTF-16LE U+10FFFF 1 2

UTF-32 U+10FFFF 4

最大値 65,535

(26)

BMP

U+0000 U+FFFF U+10000 U+10FFFF

Plane 0 (Basic Multilingual Plane)

Plane 1 (Supplementary Multilingual Plane) U+10FFD

U+20000 U+2FFFD

Plane 2 (Supplementary Ideographic Plane) U+30000

U+3FFFD

Plane 3 (Tertiary Ideographic Plane) U+E0000

U+EFFFD

Plane 14 (Special-Purpose Plane)

http://unicode.org/roadmaps/index.html

(27)

BMP

U+D800 U+DFFF

U+DC00 U+D8FF

U+0000 U+FFFF U+10000 U+10FFFF

Shift_JIS 手段 対応

値 位 位 判断 可能

(28)

U+DC00

U+DFFF

0x00 0x3F

1,024

64

65,536

N

面 面 面 15 16

上位 ロ ー (U+D800 ~ U+DBFF)

1,024

下位 ロ ー (U+DC00 ~ U+DFFF)

1,024

合計拡張数 1,048,576文字

=

X

(29)

基底文 結合文 合成済 文

合成列

見 目 文 文 組 合わ

見 目 異 意味的 文

文 組 合わ

見 目 定義 異 文

(30)

文 見 目 意

味共 全く

文 列を比較

時 期待さ 結

果 ?

API を使

用 ?

ё

ё

е ̈

+

+

U+304C

U+304B U+3099

=

U+0451

U+0435 U+0308

=

正規等価

(31)

見 目

見え

比較 場合

結果 ?

う 扱う

Α

A

U+2780 U+2460

U+0391

U+0041 LATIN CAPITAL LETTER A

GREEK CAPITAL LETTER ALPHA

DINGBAT CIRCLED SANS-SERIF DIGIT ONE

CIRCLED DIGIT ONE <circle> 0031 1 ~ ~

(32)

見 目 若干異

意味的 ㎜ U+339C

U+33A3

U+33E6

U+2460

U+30AB

U+3302

m U+006D

m m ³ U+00B3

7 U+65E5

1 U+0031

U+FF76

m

U+006D

U+0037

互換等価

(33)

合成済文 合成列 扱い

正規分解

(Canonical Decomposition)

正規分解 正規合成

(Canonical Decomposition, followed by Canonical Composition)

互換分解

(Compatibility Decomposition)

互換分解 正規合成

(Compatibility Decomposition, followed by Canonical Composition)

ǻ U+01FB LATIN SMALL LETTER A WITH RINKG ABVE AND ACUTE

00E5 å 0301 ́

å U+00E5 LATIN SMALL LETTER A WITH RING ABOVE

0061 a 030A ̊

(34)

分解

合成

ǻ

ǻ

ǻ

ǻ

ǻ

ǻ

a ̊ ́

å ́

ǻ

ǻ

å ́

a ̊ ́

(35)

悩 い文 処理

保 送信

比較 並び替え

゛ イ

゙ イ

U+FF8A

U+FF9E

U+FF72

U+FF85

U+FF98

U+30CF U+3099 U+30A4 U+30CA U+30EA

U+30EA U+30CA

U+30A4 U+30CF U+309B

U+30A4 U+30CA U+30EA

U+30D0

゛イ

バイナリ

(36)

意味

イ 整合性

意味 整合性

想定 難 いソ 側 作成側 送付元 実装

意図

表示 印 を含 比較 集約さ 実装

課題

必要 場合 列を変換

可能 を保 送信

(37)
(38)

化 イ 保 送信可能

作成者 意図 表示

作成者 意図

異 ン 表示

時間 OS を越え 文 を表示出来 い

JIS90 & JIS 2004

JIS20xx…

味噌

U+5473, U+5641

(39)

定義文 (User Defined Character)

JIS X 0201 JIS X 0208 い文 使

用 一般化

ン 異 一貫性 無い

割 当 相互運用性 如

特定 効 文 列 キ

(40)

一般 意味 異 形

辺、 、 、部 ?

、 、 、 、 ?

多く 場合 外

対応

(41)

渡 氏 絵 作 だ

渡 氏 絵 傑 作 だ

渡 氏 絵 作 だ

(42)

ここ 内容 Windows Vista

Windows 7 Windows Server 2008

Windows Server 2008 R2 未対応

(43)

基本 文 形を指

定 事 可能

見 目 異 文 あ

基本 文 意味

一意性を確保

9089

基本 文 U+9089

IVD

Ideographic Variation Database

IVS

Ideographic Variation Selector Ideographic Variation Sequence

(44)

渡 氏 絵 傑 作 だ

E010A E0103

渡 氏 絵 作 だ

U+6E21 U+9089 U+6C0F U+306E U+7D75 U+306F U+5091 U+4F5C U+3060

U+6E21

U+9089 +

U+E010A U+6C0F U+306E U+7D75 U+306F

U+5091 +

U+E0102 U+4F5C U+3060

(45)

BMP

U+0000 U+FFFF U+10000 U+10FFFF

Plane 0 (Basic Multilingual Plane)

Plane 1 (Supplementary Multilingual Plane) U+10FFD

U+20000 U+2FFFD

Plane 2 (Supplementary Ideographic Plane) U+30000

U+3FFFD

Plane 3 (Tertiary Ideographic Plane) U+E0000

U+EFFFD

Plane 14 (Special-Purpose Plane)

http://unicode.org/roadmaps/index.html

IVS Plane 14 を使用

(46)

BMP

U+D800 U+DFFF

U+DC00 U+D8FF

U+0000 U+FFFF U+10000 U+10FFFF

JIS X 0213 一部 IVS

割 当 い

U+E0100 ~ U+E01EF (239)

(47)

基本多言語面 文

基本多言語面 文 IVS

IVS

16

16 16 16 16

16 16 16 16

16

基本多言語面

16

32 (16 x2)

(48)

IVS 異体 対応

文 入力

文 出力 表示 印

Windows

汎用電子 成果

AJ1

(49)
(50)

Office 2007/2010 Unicode IVS 未対応

新機能 追加対応 原則新 い ン

IVS を使用 増加

必要性 増 互換性 相互運用性 問題

対応

Office 2007/2010 Add-in 提供

(51)

Office 使用

OOXML

WordprocessingML

SpreadsheetML

PresentationML

DrawingML

VML

SharedML

(52)

使用 い ン 表示出来

文 異

IVS を扱え いこ 表示

セ を 文 認識 表示

編集 保 こ IVS 情報 失わ

(53)

Plug-in Office

動的変換

IVS 符号化さ い文

PUA を使用 表示 編集を可能

U+E000 ~ U+F8FF (6400 )

Plane 15 U+F0000 ~ U+FFFFD (65534 )

Plane 16 U+10000 ~ U+10FFFD (65534 )

(54)

1. Microsoft.Office.Tools.AddInBase.Application.DocumentOpen

取得

2. Microsoft.Office.Tools.AddInBase.Application.ActiveDocument を編集

開い を動的 検査 替え IPAmj明朝固 PUA 変換

3. Microsoft.Office.Tools.AddInBase.Application.DocumentBeforeSave

を取得

4. IVS IPAmj 明朝固 変換 復元

IVS、IPAmj明朝 固有文字を含む キ メン

IVS、IPAmj明朝 固有文字をPUAに 変換

ー ーによ 編集

作業 PUAIPAmjの文字をIVS、明朝固有文 字に変換

キ メン の保存

(55)
(56)

JIS JIS 水準 4 水準

を扱え い Unicode 唯一 選択肢

外 使用 相互運用性を損 い 将来

ソ 更新を 困難

IVS 異体 問題を 解消出来

Office IVS Add-in 移行 提供

(57)

© 2009 Microsoft Corporation. All rights reserved. Microsoft, Windows, Windows Vista and other product names are or may be registered trademarks and/or trademarks in the U.S. and/or other countries. The information herein is for informational purposes only and represents the current view of Microsoft Corporation as of the date of this presentation. Because Microsoft must respond to changing market conditions, it

should not be interpreted to be a commitment on the part of Microsoft, and Microsoft cannot guarantee the accuracy of any information provided after the date of this presentation. MICROSOFT MAKES NO WARRANTIES, EXPRESS, IMPLIED OR STATUTORY, AS TO THE INFORMATION IN THIS PRESENTATION.

参照

関連したドキュメント

The inclusion of the cell shedding mechanism leads to modification of the boundary conditions employed in the model of Ward and King (199910) and it will be

It is suggested by our method that most of the quadratic algebras for all St¨ ackel equivalence classes of 3D second order quantum superintegrable systems on conformally flat

We show that a discrete fixed point theorem of Eilenberg is equivalent to the restriction of the contraction principle to the class of non-Archimedean bounded metric spaces.. We

He thereby extended his method to the investigation of boundary value problems of couple-stress elasticity, thermoelasticity and other generalized models of an elastic

Keywords: continuous time random walk, Brownian motion, collision time, skew Young tableaux, tandem queue.. AMS 2000 Subject Classification: Primary:

Kilbas; Conditions of the existence of a classical solution of a Cauchy type problem for the diffusion equation with the Riemann-Liouville partial derivative, Differential Equations,

Answering a question of de la Harpe and Bridson in the Kourovka Notebook, we build the explicit embeddings of the additive group of rational numbers Q in a finitely generated group

Next, we prove bounds for the dimensions of p-adic MLV-spaces in Section 3, assuming results in Section 4, and make a conjecture about a special element in the motivic Galois group