平成 25 年度文字情報基盤
運用検討 SWG 委員名簿
(2014 年 2 月 6 日現在)主査
楠 正憲
内閣官房 社会保障改革担当室 番号制度推進管理補佐官
委員
牛込 英樹
富士通株式会社 ミドルウェア事業本部データマネジメント・
ミドルウェア事業部第五開発部 マネージャー
梅原 忍
財団法人地方自治情報センター 住民基本台帳ネットワークシ
ステム全国センター システム担当 上席マネージャ
大山 水帆
川口市情報政策課 課長
田丸 健三郎 日本マイクロソフト株式会社 技術統括室/イノベーションセ
ンター 本部長
平林 元明
株式会社日立製作所 公共システム事業部 公共イノベーショ
ン事業推進本部 主管
平本 健二
経済産業省 CIO 補佐官
安田 雅義
新宿区総合政策部情報政策課
吉本 明平
日本電気株式会社 公共ソリューション事業部 マネージャー
事務局
田代 秀一
情報処理推進機構 国際標準推進センター長
小林 龍生
情報処理推進機構 国際標準推進センター専門委員
沼田 秀穂
情報処理推進機構 国際標準推進センター専門委員
池田 佳代
情報処理推進機構 国際標準推進センター専門委員
武藤 圭祐
情報処理推進機構 国際標準推進センター
資料 1
文字情報基盤導入ガイド(案)
ドラフト (2014 年 2 月 6 日版) 1. 本ガイドの目的 本ガイドは、平成 25 年 6 月 14 日の閣議決定「世界最先端 IT 国家創造宣言」1のⅢ.3.(1)節「利 便性の高い電子行政サービスの提供」に示された、「文字の標準化・共通化に関しては、今後整 備する情報システムにおいては、国際標準に適合した文字情報基盤を活用することを原則とす る」との方針に沿ったシステム構築・運用を行うための具体的な技術的指針を示すとともに、 文字情報一覧表2、関係国際規格等、導入に当たって参照すべき資料を明確とすることを目的と している。 2. 文字情報基盤について 文字情報基盤とは、2002 年度~2008 年度に実施された「汎用電子情報交換環境整備プログ ラム」の成果を出発点とし、2010 年度に内閣官房情報通信技術(IT)担当室(現 IT 総合戦略 室)、総務省、法務省、経済産業省、文化庁などの関係府省や専門家、産業界関係者が参加する 文字情報基盤推進委員会を、独立行政法人情報処理推進機構(以下「IPA」と呼ぶ)を事務局と して設置し、検討が開始された事業である。 住民基本台帳ネットワークシステム統一文字(以下「住基統一文字」と呼ぶ)、戸籍統一文字 に収録された漢字を整理し、各文字体系との対応関係等をまとめた文字情報一覧表と、文字フ ォント(IPAmj 明朝フォント)を整備するとともに、それらの文字符号の国際標準化を推進し ている。 図 1 に、現在の文字情報基盤検討体制を示す。文字情報基盤ワーキンググループは経済産業 省に設置され、IPA が事務局を務めている。 1 閣議決定「世界最先端 IT 国家創造宣言」 http://www.kantei.go.jp/jp/singi/it2/kettei/pdf/20130614/siryou1.pdf 2 文字情報基盤文字情報一覧表:http://mojikiban.ipa.go.jp/1311.html - 1 -政府情報システム 刷新等WG IT総合戦略本部 新戦略推進 専門調査会 パーソナルデータ に関する検討会 各府省CIO 連絡会議 電子行政オープン データ実務者会議 電子行政 分科会 人材育成 分科会 ・・・ 情報セキュリティ 政策会議 情報共有基盤推進委員会 委員長 須藤修(東京大学情報学環長) 有識者 武田英明(共通語彙基盤WG座長)、林史典(文字情報基盤WG座長) 関係団体 JISA(ソフト業界)、JEITA(ハード業界) オブザーバ 内閣官房(IT総合戦略室、社会保障改革担当室)、総務省(行政管理局) 協力依頼 報告 共通語彙基盤WG <実施内容> • 情報連携用語彙基盤DBの構築 • APIカタログの整備 • 情報連携用ツールの整備 【主査】武田英明 (NII教授) 【関係省庁】(課長級) IT室、社保室、内閣府防災、 総務省、国交省、国会図書館 • 各委員会、WGの設置主体 は経済産業省、事務局はIPA • 各WGの下には、具体的な検 討を行なうSWGを設置。 塗りつぶし部分は関連する会議体 文字情報基盤WG <実施内容> • 導入ガイドの作成 • 文字情報DBの構築 • フォント整備 • 標準化の実施 <メンバー> 右表のとおり 氏名 位置付け 所属 座長 林 史典 有識者 聖徳大学教授 委員 三上 喜貴 有識者 長岡技術科学大学教授(副学長) 委員 氏原基余司 有識者 文化庁 委員 大山 水帆 自治体 川口市 委員 梅原 忍 関係団体 LASDEC 委員 【課長級】 関係省庁 総務省自治行政局 住民制度課 委員 【課長級】 関係省庁 総務省総合通信基盤局 高度通信網振興課 委員 【課長級】 関係省庁 法務省 民事局 オブザーバ 【課長級】 関係省庁(利用) 内閣官房IT室 オブザーバ 【課長級】 関係省庁(利用) 内閣官房 社保室 オブザーバ 【課長級】 関係省庁(利用) 総務省行政管理局 情報システム管理室 委員 - SWG座長(文字情報) 委員 - SWG座長(運用) 委員 - SWG座長(技術) 図 1 文字情報基盤の検討体制(2013 年度~) 2.1. 文字情報基盤で提供する成果物等 文字情報基盤の事業成果物として、IPA は、以下のものを公開している3。 (1) IPAmj 明朝フォント 文字情報基盤で整備された文字(戸籍統一文字の漢字:55,270 文字、住基統一文字の漢 字:19,563 文字を整理した結果)約60,000 文字を収録したフォントであり、IPA フォント ライセンス v1.0 により、無償公開されている。 ISO/IEC 10646 に準拠して符号化されている。符号化方式の詳細は 2.2 節、国際標準化 状況は 2.3 節を参照のこと。 (2) 文字情報基盤 文字情報一覧表(MJ 文字情報一覧表) 文字情報基盤で整備された文字について、 文字図形、各種文字コードとの対応関係 読み、画数、部首等の漢字属性情報 SVG フォーマットによる文字図形イメージ情報 等を収録し、文字の「見える化」を図る一覧表である。クリエイティブ・コモンズ・ライセ ンス 2.1「表示、継承」により無償公開されている。文字情報一覧表の項目一覧は、本ガイ ドの【別添】を参照のこと。 (3) 報告書等 3 文字情報基盤成果物等はhttp://mojikiban.ipa.go.jp/ から公開されている。 - 2 -
平成 22 年度調査事業の成果報告書 文字情報基盤事業の在り方に係る検討結果等 平成 24 年度文字情報基盤導入実証実験成果報告書 自治体現場への導入実験の結果報告書、実験に用いたデータ(コード変換表等)等を公 開) 関連委員会の議事概要 を公開。 2.2. IPAmj 明朝フォントの符号化方式 IPAmj 明朝では戸籍統一文字、住基統一文字を包含する全約 6 万文字を図 2 のように国際符 号化文字集合 ISO/IEC106464 Universal Coded Character Set (以下 UCS と呼ぶ)に準拠して
符号化している。
• マイクロソフトOffice 2013 • Apple iWork (Pages 5.0,
Numbers 3.0, Keynote 6.0) • 一太郎2014 徹(てつ) (2014年2月発売予定) 等がIVS技術に対応 ほぼ全ての情報機器で利用可能 市販の最新の情報機器の多くで利用可能 一部のOS・アプリケーションで対応が始まっている ISO/IEC 10646 UCS
(Universal Character Set)
IPAmj明朝フォント Ver.002.02 6,092文字 24,210文字 26,237文字 2,275文字 1,684文字 BMP (全65,536文字) CJK統合漢字拡張B,C,D (全47,000文字) IVS 文字情報基盤漢字 (58,814文字) 現在は 符号化対象外 非漢字 (2,014図形/1,684文字) 縦書用文字、リガチャを含む 住基統一(漢字のみ) (19,563文字) 戸籍統一(漢字のみ) (55,270文字) ISO/IECに全文字受理 済(2012年11月)、 符号化作業進行中 図 2 文字情報基盤の符号化状況 図に示すように、全約 6 万文字は、 BMP5と呼ばれる領域へ符号化された文字:約 26,000 文字 拡張領域6と呼ばれる領域へ符号化された文字:約 26,000 文字 IVS7と呼ばれる方式で符号化された文字:約 2,000 文字(→2014 年中に約 6,000 文字) 4 ISO/IEC 10646 Universal Coded Character Set(UCS):2014 4th edition。対応する国内規格は、JIS X
0221:2014。(いずれも 2014 年中に発行予定)
5 BMP (Basic Multilingual Plane): 16 ビットで文字を指定できる範囲で、「基本面」と呼ばれる。すべて
の情報機器はこれに対応している。 6 文字の指定に 32 ビットを要する領域。一部旧式の情報機器は対応していない場合がある。この領域への 符号化は ISO/IEC において順次進められており。「拡張 E」が 2014 年度に出版予定。「拡張 F」の標準 化作業が進行中である。 - 3 -
符号化が未了の文字:約 6,000 文字(→2014 年中に約 1,900 文字) の各領域へ符号化されている。 これら領域毎に、ソフトウェア(アプリケーションソフトや OS、ミドルウエア等)の対応状 況が異なる。特に IVS は、最新の標準に基づくものであり、2014 年 2 月時点で、PC 用の市販 ワープロソフト等はほぼ対応が完了しているが、基幹業務系ソフト等の対応はまだ開始された ばかりである。 2.3. 国際標準化状況 文字情報基盤で整備された約 6 万文字は UCS に従って符号化を行っているが、図 3 に示す ように、2014 年末において約 1,900 文字が国際標準化機構(ISO/IEC JTC1)における符号化 作業中のものとなる。これらについては符号化作業完了まで2~3年を要するものとみられる (遅くとも 2020 年までには完了の見込みである)。 2013年度 2014年度 ISO/IEC 10646:2014(予 定)を受けたUCS実装 2012年10月、ISO/IEC JTC1/SC2/WG2/IRG へ提案し、 受理済み 2015年度以降 約1900文字 全約 5 万文字のうち、 符号化 実装が未了の文 字 約500文字 約3700文字 符号化完了! 現在IVD登録作業中の IVS実装 6,100 1,900 2013.12月 Unicode consortiumが登録を受理し、 パブコメ中 (~2014.3月) 2013.11月 IPAmj明朝フォントv.002.02公開 6,800 2,400 図 3 文字情報基盤の符号化作業状況 3. 文字情報基盤導入にあたっての基本方針 文字情報基盤を情報システムへ導入するにあたっては、以下の点に配慮する必要がある。 1) 国際標準と矛盾しない技術を用いること 2) 既存システムとの共存性、導入コストの低さなど、経済合理性を考慮すること 3) 技術の進展、標準化の進展に沿った適切な手順を踏むこと 上記1)は、国際標準と矛盾しない技術を用いることにより、市場に在る一般的情報機器の 活用が可能となること、機器間、組織間での文字情報の交換に係る変換等のコストが不要とな ること、等から、電子行政システムの構築・運用に係るコストダウンにつながることが期待さ
7 IVS(Ideographic Variation Sequence / Selector ) : 「字形選択子」と呼ばれるもので、字形が類似して
おり、符号的には区別されない文字について、その字形を指定するための符号。
- 4 -
れる。国際標準として参照すべき事項については、8 章を参照のこと。 上記2)については、行政機関においては人名漢字等を処理するための様々なバージョンの 情報機器が稼働しており、これらを一度に置き換えることなく、それらと新規システムとの共 存を図る方策をとることにより、移行に係るコストの低減を図ることが必要である。 上記3)については、文字情報基盤の国際標準化が現在進行中であること、また、情報機器 の対応についても過渡的状況にあることから、これらの進展の各段階での機器間での相互運用 性、共存可能性を十分配慮した導入計画を立てることが求められる。 また、最終的には、行政で用いられる各種情報システム間での文字情報の交換を、UCS に基 づく一貫した様式で行うシステムへ移行するべきであることを視野に入れる必要がある。 4. 利用する文字の範囲について 実際に業務で使用する文字の範囲等については、当該業務に係る法令等に従うことが必要で あるが、一般的には、業務効率や相互運用性を考慮し、業務内容に応じた適切な大きさの文字 範囲を使用するよう検討することが必要である。 表 1 に、適用場面ごとに想定される文字/文字図形の範囲と符号化方式の例を示す(要検討)。 文字の絞込みの定義に係る国際標準については、8.3 節「文字集合の絞込みに係る定義」を参照 のこと。 表 1 適用業務と文字の範囲(参考) 文字情報基盤 で整備された 文字図形(字 体レベル8) 文字情報基盤 で整備された 文字図形(UCS レベル9) JIS X 0213 JIS X 0208 常用漢字 文字/文字図形集 合の定義 IVD Moji_Joho collection MJ 文字情報一 覧表に含まれる UCS 符号位置 8.3 節参照 8.3 節参照 JIS X 0213:2012 附属書 12 組織内に 閉じた 業務 戸籍業務 ○(*A) △ 住民記録業 務 ○ (*A) △ 法人関連業 務 ○ (*A) △ 生徒名簿等 (字形に正確 さが求められ る場合) ○(*A) △ 生徒名簿等 (日常業務) ○ △ 8 UCS に加え、IVS 等を指定し、細かな文字図形を区別する利用法。
9 UCS のみを指定し、IVS を指定しない利用法。この場合、フォントの当該 UCS 符号に対するディフォル
ト図形として実装された文字図形が表示される。
- 5 -
一般的な書 類作成 △→○ (*B) ○→△(*B) 災害等緊急 時対応シス テム △→○(*B) ○ 外部への 通知等 一般向け広 報文書 △ ○ ○ 正確な人名 表記を要す る通知文等 ○(*C) △(*C) 情報公開等 △(*C) ○(*C) ○ ○ ○ 外部から の申請 等 一般的な申 請等 △→○ (*B) ○→△(*B) 正確な人名 表記を要す る申請等 ○(*D) △(*D) (*A)必要に応じ、文字情報基盤で整備された文字図形以外の文字図形を、「外字」等として利用す ることが有り得るが、できる限り文字情報基盤の文字範囲に収まるよう、調整することが望 ましい。 (*B)市場にある一般的情報機器の対応状況に応じ、変化する。 (*C)JIS X 0213 範囲以外の文字については、図形イメージによる表示、伝送を検討する。 (*D)JIS X 0213 範囲以外の文字については、表示を図形イメージによるものとするほか、Web 上に漢字入力を支援するサービスを設けることを検討する。 5. システム間接続の運用の基本方針 5.1. 文字図形の厳密な一致性が不要な場合 一般事務向けのシステム等では、文字図形について厳密な一致性は求められず、JIS X 0213 や UCS で採用されている包摂あるいは統合の考え方(文字図形の差がわずかである文字につい ては同一の符号を与えるという考え方)に従い、文字情報を交換することが適当である。 この場合は、2つのシステムに異なるデザインのフォントが実装されている場合にも、UCS の符号のみを交換すれば十分である。 ただし、同じ UCS を使用しているシステムでも、一方が JIS X 0208 相当の文字集合のみを サポートしており、他方が JIS X 0213 相当の文字集合を使用しているといった場合等、使用す る文字図形集合の大きさに差がある場合においては、大きな集合から小さな集合への(N 対1 の)対応関係をまとめた「縮退マップ」の採用(5.3 あるいは、文字を図形イメージ情報として 伝送する(8.4 参照)等の必要が生じる。 5.2. 人名等文字図形の厳密な一致性が求められる場合 人名を扱う行政事務等では、使用する文字図形に対し、戸籍に記載された文字図形との間、 - 6 -
あるいは過去に使用した文字図形との間等での高度な図形的一致性が求められる場合がある。 この場合、異なるシステム間での文字情報交換について、以下のような手法が考えられる。 (1) 文字情報基盤文字情報一覧表を媒介とした対応付け 文字情報基盤で整備された文字図形は、戸籍統一文字及び住基統一文字の文字図形との間で 1 対 1 の対応関係を持つよう作られている。人名に用いられる漢字を処理するための既存の情報 システムは、人名が戸籍由来であることから、戸籍統一文字、住基統一文字に同定可能な字形 を持つ独自フォントを採用していることが多い。 その結果、これらシステムで用いられている多くの文字図形は、文字情報基盤が整備した文 字図形に同定可能である。 そのため、固有の文字体系を持つシステムの持つ文字図形を、一旦文字情報基盤の文字図形 に同定し、その対応関係を明らかにしておけば、これを媒介にして、他のシステムで用いられ ている文字図形と、容易に対応することが可能となる。 このような対応法を用いることにより、N 種類の文字体系について、それらと文字情報基盤 の文字図形との対応関係を記述した N 通りのマップを作るだけで、N×N のシステム間を接続す ることが可能となり、対応付けの効率が飛躍的に高められる。 また、ある文字体系と文字情報基盤との対応関係のマップは、当該文字体系の提供者がその 責任において作成することができ、そのマップと他の体系について他の体系の提供者が作った マップを組み合わせて使用することで、最終的な文字対応をとることができることから、文字 の対応マップ作成に係る責任分界が明確となる。結果、責任分界の面でも、文字情報交換に係 るシステム構築の容易性が拡大する。 このような対応付け方法の有効性は、IPA の実施した実証実験においても確認されている10。 将来的には文字情報基盤の文字図形は、全て UCS および IVS によって参照できるようになる 予定であるが、現在は ISO/IEC JTC1 での規格化手続きの進行中であり、2014 年度末におい ても約 1,900 文字については国際標準化された符号による指定はできない。そのため、変換マ ップ等において文字情報基盤で整備された文字図形を識別するためには、将来的には UCS+IVS を用いることが推奨されるが、当面は「MJ 文字図形名」を用いることが必要となる。 相互に合意した組織の間では、これらの文字を UCS で規定された「私用面」へ割り当てた、 いわゆる「外字」のコードを交換することも有り得る。ただし、その場合においては、「合意し た組織」外へ、当該外字コードが流出しないよう、十分な配慮を行う必要がある。また、外字 を使用した文書を保存する際には、外字コードが不変なものでないことを十分配慮する必要が ある。 (2) その他の方法(図形イメージ情報の交換) 文字情報基盤の文字へ同定できない文字図形については、字形そのものを図形(イメージ) 情報として交換する必要がある、その技術的方法は、8.4 に示した。 各交換方式の特徴を表 2 に示す。 対象業務における文字図形の厳密性への要求、アプリケーションの対応状況等に応じ、適切 10 文字情報基盤を自治体等のシステムで活用する実証実験の結果については、 http://mojikiban.ipa.go.jp/category/03/03002に掲載されている。 - 7 -
な方式の採用を検討することが求められる。 表 2 交換手段の特徴 交換方式 相互運用性 対応ソフトの豊富 さ(一般アプリケ ーション) 対応ソフト の豊富さ(基 幹システム) 伝えられる文字 図形の厳密さ UCS(BMP) ◎ ◎ ◎ △ UCS(BMP+拡張領域) ◎ ◎ ○ ○ UCS+IVS ◎ △→○ ×(*B) ◎ 文字図形情報の交換 (MJ 文字図形名の活用) ○ △(ブラウザ等) ×(*B) ◎ 文字図形情報の交換 (独自文字図形の利用) ○ (*A) △(*A) (ブラウザ等) ×(*B) ◎ 外 字の 利用 (UCS 私 用 面11の利用) ◎/× (*C) ◎ ○ ◎/×(*C) (*A)文字の図形的形状を伝えることができるが、その文字を特定するための情報を伝えること はできず、検索や意味の解釈に支障をきたす場合がある。 (*B)システム内では外字へ変換するなどの作りこみは可能。 (*C)当該外字の利用について相互に合意した組織においては厳密な文字図形情報を伝達できる が、当該外字コードを当該組織外に流出させた場合においては、文字化け等の障害を起こ す。 また、外字コードを含んだ文書を保存するにあたっては、外字コードが不変なもので ないことを十分配慮する必要がある。 5.3. 縮退変換の活用 2 つのシステムの扱える文字集合の大きさが異なる場合、大きな文字集合を小さな文字集合に マップさせる、「縮退変換」を行うという考え方がある。 例えば、災害時の対応等、被災者支援等のために、文字図形の厳密な識別よりも、市販の情 報機器等を活用する即応性、利便性、検索性などが優先される場合がある。 市販情報機器では行政機関等が用いている人名漢字を扱えない場合も多く、変換に大きな手 間を要したり、文字化け等が起きることが東日本大震災の経験でも多く指摘された。 このような場合に備え、人名などを扱うために用意された大きな文字セットを、JIS X 0208 等の最小限の文字セットへ縮退変換するためのテーブルをあらかじめ用意することが求められ る。 また、災害対策といった特殊な場合でなくとも、通常業務においても、業務効率やシステム 構築コストの関係から、文字図形の数を抑制することは重要である。 文字情報基盤が整備した文字図形と 1 対 1 に同定できない文字のうち、通常業務で多く用い られている文字等については、8.4 のような図形情報による交換だけでなく、文字情報基盤が整 備した文字への縮退変換マップの整備等も検討する(7.1 参照)。 11 UCS の私用面(15 面、16 面 : 0F0000-10FFFF)には、相互に合意した組織の間で「外字」を登録 し、私的に(外部へ流出させずに)使用することが認められている。 - 8 -
なお、一旦、小さな文字図形集合に縮退された情報を大きな文字図形集合に再変換した場合、 大きな文字図形集合における識別粒度が保証されないことに留意する必要がある。 6. 導入の手順 最終的には、文字情報基盤が整備した文字図形の全てが UCS および IVS により扱えることを 目指している。 また、究極的には、文字情報基盤が整備した文字図形を使う全てのシステムが IVS に対応す ることが望まれる。 しかし、これらは、標準化およびソフトウェアの対応状況の進展に応じ、段階的に進めてゆ く必要がある。 当然、その過程のどの段階においても、既存システムと新規システムとの間の相互運用性は 維持しなくてはならない。 また、将来的には文字情報基盤が整備した文字図形以外の文字図形を全く使用しないことに するという選択肢も有り得るが、本ガイドでは、そのような選択肢は想定せず、こういった文 字については、図形(イメージ)情報として 8.4 に示したような方式に則って交換可能とするこ とを目標とする。 システム構築は、同一組織内に閉じたシステム間における情報交換と、組織を超えた情報交 換とに分けて考える必要がある。「組織を超えた」情報交換においては、例えば「外字」フォン トを共有する(8.5 参照)といったことを想定しない方法を検討する必要がある。 これらを一覧にまとめると表 3 の様になる。 表 3 各組織・各段階における導入の方針 短期 中・長期 組織内部(内部実装) 特に内部実装を変更する必要 は無い。 IVS を含む UCS が使用可能な システムの導入を図る 行政組織間・自治体間(文字 情報の交換) 図 4 に示す「交換表現」によ り、状況と必要に応じ、UCS、 IVS、図形情報等を交換する。 システムには、「交換表現」 に対応した変換システムを装 備し、交換された情報を内部 表現へ変換する。特に相互に 合意のとれた組織間では、私 用面に割り当てたコードの交 換も検討する。 文字情報一覧表に記載された 文字図形は、すべて IVS を含 む UCS 表現を用い、その他の 図形文字は図形(イメージ) 情報として交換する 組織外(開放系への情報発 信) 使用する部分文字レパートリ (8.3 参照)を明記する。 符号化方式(Shift-JIS など) を明記する。 符号化範囲外にある文字図形 使用する部分文字レパートリ (8.3 参照)を明記する。 IVS を含む UCS の符号化方式 を用いる IVS が使用できない環境へ向 - 9 -
は図形(イメージ)情報とし て発信する。 文字図形を厳密に識別する必 要のない外部組織等への情報 公開、災害対応等のために縮 退変換マップを活用する。縮 退のためのマッピングテーブ ルは原則公開する。 けた発信のため、必要に応じ て図形(イメージ)情報の伝 送を併用する。 文字図形を厳密に識別する必 要のない外部組織等への情報 公開、災害対応等のために縮 退変換マップを活用する。縮 退のためのマッピングテーブ ルは原則公開する 組織外(開放系からの入力) 使用可能な部文字レパートリ (8.3 参照)を制御する。 別途、手動による入力手段 (GUI による選択入力等)を 提供する。 MJ 文字図形のすべての図形 文字を識別入力可能とする。 別途、手動による入力手段 (GUI による選択入力等)を 提供する。 符号化文字 私用領域(外字) システムA 符号化文字 私用領域(外字) システムB UCS+IVS 図形情報 MJ文字図形名 符号化文字の集合としては JIS X 0208, JIS X 0213, UCSなどが想定される。規 格により例示字形が異なる 場合があることに留意する。 既存システムの私用領域(外 字)にある文字には、UCS、 IVS、MJ文字図形に対応する ものもあることに留意する。 UCS+IVSに変換 MJ文字図形名に変換 文字図形情報として交換 該当システムの私用領域に対応付け 該当システムの私用領域に対応付け UCSから該当システムの符 号化文字に変換する際、縮 退対応(複数のUCSを単一 の該当システム符号位置に 対応)させ、再度該当シス テムからUCSへの対応付け を行うと、双方向での情報 の保全は保証されてないこ とに留意する。 複数のシステム間で文字情報基盤のカ バーする文字の文字情報を交換する際 には、対応するUCS符号+IVS又は、 MJ文字図形名を用いる。 それ以外の文字については、送信側、 受信側で合意した方式により図形(イ メージ)情報を伝送する。 交換表現 UCS+IVSに変換 <8FBB, E0102> <8FBB, E0103> 文字情報基 盤がカバー する範囲 図 4 文字情報交換のイメージ 7. 今後整備するべき事項 7.1. 行政システムの構築等で参照するための一覧表等 - 10 -
文字情報の円滑な交換を支援するため、文字情報基盤として、以下のような情報を検討し、 整備、公開するものとする。 (1) 文字情報基盤文字情報一覧表に含まれる UCS 符号位置を列挙した一覧表 (2) 文字情報基盤が整備した文字図形のうち、対応する UCS 符号位置を持たないものすべて の MJ 文字図形名の一覧表 (3) 「交換表現」(図 4 参照)のリファレンスとなるスキーマ類 (4) 文字情報基盤が整備した文字図形を、以下のように分類して掲載した一覧表および、それ らの文字図形を直接参照するための URI A) UCS に対応するデフォルトグリフ12 MJ 文字図形の通常のオープンタイプフォント実装において、IVS を用いなくても該当文 字図形が表示される範囲の文字図形 B) UCS に対応するデフォルトグリフ以外の文字図形 MJ 文字図形で対応する UCS が存在するもののうち、IVS を用いなければ該当文字図形 が表示できない文字図形 C) 対応する UCS 符号位置を持たない MJ 文字図形 MJ 文字図形一覧表において、現在、対応する UCS 符号位置を持たない文字図形(ISO における標準化作業過程にあるもの。「拡張 F」として規定されることが想定される)。 これらの一覧表を参照することにより、IVS に対応しないシステムでの内部表現のために IVS 文字を外字として作成し、使用する場合、符号位置を持たない文字図形をシステム内 で外字として使用する際等の参考とすることができる。 (5) 変体仮名文字の文字図形 (6) 行政で多く用いられるにもかかわらず、文字情報基盤で整備した対象となっていない文字 図形について、文字情報基盤で整備された文字図形に縮退変換するための変換テーブル。 (7) 文字情報基盤で整備された文字を JIS X 0213 範囲の文字へ縮退対応させるための対応表。 (8) 災害対応等を想定し、文字情報基盤で整備された文字を JIS X 0208 範囲の文字へ縮退対 応させるための対応表。 7.2. 国際標準化活動
現在、Unicode Consortium が管理する、IVD に登録されている Moji_Joho Collection を拡 充し、文字情報基盤が整備したすべての文字図形に対して IVS が一意に定まるよう拡張登録を 行う作業を進めている。 また、残された 1,900 文字については、その符号化提案が国際標準化団体に受理され、符号 化作業が進行中である。 さらに、以下のような標準化を計画している。 (1) ISO/IEC JTC1/SC2/WG2 に対し、文字情報基盤で整備された全ての文字図形に対応する UCS の符号位置を、UCS の部分レパートリとして追加提案する。 (2) 公用文への適用が義務づけられている常用漢字表に含まれる漢字及び、日本語のローマ字 12 デフォルトグリフは、IVS を明に指定しない場合に表示される文字図形である。 http://mojikiban.ipa.go.jp/1292.html 参照 - 11 -
表記に必要となる文字(長音記号付きのローマ字等)についても、併せて部分レパートリ としての提案を行う。
(3) JIS X 0221 の附属書 JA において、Moji_Joho collection を参照することの提案を対応す る国内委員会に行う。
(4) 変体仮名文字の符号化につき、ISO/IEC JTC1 WG2 へ提案する。
UCS の CJK 統合漢字拡張 F の規格化及び IVD Moji_Joho collection の拡張登録が終了すれ ば、文字情報基盤文字情報一覧表に記載されている文字図形のすべてを IVS で記述することが 可能となり、文字図形集合として、Moji_Joho Collection を指定するだけで、文字図形集合を 特定することが可能となり、当該文字図形セットに対応する民間のフォントの活用等を含め、 情報システムの利便性が、いちじるしく向上することが期待される。 7.3. 最終目標に至るまでのロードマップ 国際標準化活動 文字情報基盤事 業 既存システムと の文字情報交換 新規システム内 部実装 2012 年 IRG で拡張 F 審議開始 (済) UCS+図形(イメ ージ)情報 UCS(UTF-16) UCS 実装文字以 外の私用領域へ のマッピング 2013 年 文字情報一覧表 003.01 公開 IPAmj 明朝 002.02 公開 UCS+図形(イ メージ)情報 UCS(UTF-16) UCS 実装文字以 外の私用領域へ のマッピング 2014 年 IVD Moji_Joho collection(第 1 次) 公開 MJ 文字図形相当の部 分文字レパートリの UCS Annex A への追 加を ISO/IEC JTC1 に 提案 IVD Moji_Joho collection の拡張登録 (第 2 次) 文字情報一覧表 バージョンアッ プ IPAmj 明朝バー ジョンアップ IVS を含む UCS +図形(イメー ジ)情報 IVS を含む UCS UCS(UTF-16) UCS 実装文字以 外の私用領域へ のマッピング UCS+IVS の実 装の推奨 2018 年 拡張 F の標準化完了 IVD Moji_Joho collection 追加登録 (第 3 次) JIS X 0221 改正 (Annex JA の増補改 正) 文字情報一覧表 バージョンアッ プ IPAmj 明朝バー ジョンアップ 文字情報基盤事 業の成果物と国 IVS を含む UCS +図形(イメー ジ)情報 UCS+IVS の実 装促進 - 12 -
際標準の整合性 の達成 2020 年 IVS を含む UCS +図形(イメー ジ)情報 UCS+IVS の必 須化 8. (参考)文字情報の交換に係る標準規格等 8.1. 符号化文字集合と文字図形集合13 図 5 に示すように、UCS では細かな字形の差異を区別しないことを原則としており、その結 果、行政の業務上で区別されるべき複数の文字図形に対して同一の符号(文字コード)が与え られる場合がある。 UCS では同一符号を与えられた複数の文字図形から一つを指定する手段として「字形選択子」 (Variation Selector :VS)という特別な符号列を定義しており14、この VS を「文字符号」 に付記することにより、同一の文字符号を持つ文字図形から一つの文字図形を選択して指定す ることができる。この符号と字形選択子(VS)の列を、Ideographic Variation Sequence(IVS) と呼ぶ。
IVS によって指定することのできる文字図形は、Unicode Consortium に登録するむねが UCS で規定されている。Unicode Consortium ではこの文字図形を IVD(Ideographic Variation Database)15として管理している。
文字情報基盤で用いている IVS は、現在、この IVD の中の“Hanyo-Denshi collection”と いう集合を用いているが、情報規格調査会は現在、文字情報基盤が整備した文字図形のうち未 だ IVD に登録されていない文字図形を含めた文字図形全体を、改めて“Moji_Joho collection” として、新規登録する手続きを進めており(図 3 参照)、2014 年中にはその手続きが完了する 見込みである。その結果、文字情報基盤で整備された文字図形のうち、約 1,900 文字図形を除 くすべての文字図形が、国際標準に従って指定できるようになる16。 2014 年度以降に出荷される一般 PC 向けの OS, Web ブラウザ、ワープロ等のソフトウェア のほとんどが IVS に対応しており、今後、IVS に対応した環境は急速に含むと考えられる。 13 本ガイドでは、《符号化文字》という用語を UCS で定義されている”Character”の訳語として、《文字
図形》という用語を ISO/IEC TR 15285 “Information technology – An operational model for characters and glyph”で定義されている glyph の訳語として用いる。なお、UCS の翻訳規格である JIS X 0221 では、《文字》を”Character”の訳語として用いていることに留意する必要がある。
14 IVS の概略については、http://mojikiban.ipa.go.jp/1292.htmlを参照のこと。 15 http://www.unicode.org/ivd/
16 文字情報基盤が参照する IVD の collection は、2014 年度中に“Hanyo-Denshi collection”から
“Moji_Joho collection”へ変更されることになるが、多くの IVS 値は新 collection へ継承されており、 また、旧フォントを前提にして作成された文書ファイル等に対する、新フォントの上位互換性は保たれ る。
- 13 -
UCS符号とVS(字形選択子) を並べて記述すること(この 列をIVSと言う)で、文字図 形を指定することができる。 ※図中のVSの値は説明の ための仮の値であり、実際 の規格とは異なります。
845A
845B
8FBA
8FBB
… … … …UCS符号
… … E0100VS
E0101 E0102 E0100 E0101 … … … … … … UCS符号は、細かな字体 (glyph, 文字図形)の差異は 区別せず、複数の字体を一 つの符号に統合している。 … … 図 5 IVS(字形選択子)について 8.2. エンコーディング方式 (encoding scheme) 8.1 に述べた規定に従って符号化された文字を、通信時やファイル格納時等に実際にコンピュ ータが利用できる形式に変換する方式。どのような方式でビット列化するかを定めた規定であ り、UCS の場合、UTF-8、UTF-16、UTF-32 等が用いられる。 8.3. 文字集合の絞込みに係る定義 UCS には、ローマ字、漢字、ハングル、アラブ系文字、インド系文字、その他多様な文字が 規定されている。その中で、日本の行政業務で必要とするのは一部であり、UCS で規定された 文字全体の中の、どの様な部分集合を、行政向け情報システムの調達等において指定するかを 意識する必要がある17。 UCS では、用途に応じて絞り込まれた文字集合を「UCS の部分文字レパートリ」と呼び、そ の Annex A の章において多数規定している。これらのうち、日本の行政現場の実務に関わるも のとしては、以下のようなものがある。 BASIC JAPANESE(基本日本文字集合)JIS X 0201,ISO/IEC 646 の IRV 及び JIS X 0208 に相当する基本部分集合。 JIS2004 IDEOGRAPHICS EXTENSION(JIS2004 拡張漢字集合)
17 もし、「UCS に対応する」とのみ仕様書に書いてしまうと、仕様に合致した製品の入手は極めて困難な
ものとなってしまう。
- 14 -
JIS X 0213 の第 3 水準及び第 4 水準漢字部分に相当する拡張用の部分集合。 JAPANESE NON IDEOGRAPHICS EXTENSION(拡張非漢字集合)
JIS X 0213 の非漢字部分(ただし,JIS X 0208 にも含まれるものを除く。)に相当する 拡張用の部分集合。
COMMON JAPANESE(通用日本文字集合)
a)に示した BASIC JAPANESE に,日本の市販 PC 等で広く用いられている拡張を加えた 部分集合。Shift-JIS を用いるシステムで、しばしば用いられる。
日本文字部分レパートリのうち,BASIC JAPANESE 及び COMMON JAPANESE は,それ ぞれを単独で又は他の日本文字部分レパートリと組み合わせて用いることが想定されている。
他の三つのレパートリは,単独で用いることは想定されていない。
JIS X 0213 2004 に規定された文字の集合を、UCS における「部分レパートリ」の定義の言 葉で表現した場合、
(1) “BASIC JAPANESE,JIS2004 IDEOGRAPHICS EXTENSION 及び JAPANESE NON IDEOGRAPHICS EXTENSION の組合せ”
と表現することとなる。
その他、非漢字等の必要性や、市販パソコンにおける拡張文字との互換性への必要等に応じ、 (2) “COMMON JAPANESE 及び JIS2004 IDEOGRAPHICS EXTENSION の組合せ” (3) “COMMON JAPANESE,JIS2004 IDEOGRAPHICS EXTENSION 及び JAPANESE
NON IDEOGRAPHICS EXTENSION の組合せ” といった指定が有り得る。
これ以外の組み合わせは、通常業務での必要性が考えにくく、また、市販システム等などと の互換性の観点から推奨されない。
文字情報基盤で整備した文字図形全体の集合を指定する際は、上記 3 種類のいずれかの組み 合わせ指定に加え、IVD における”Moji_Joho collection”の文字図形集合を参照することと なる。
Moji_Joho collection については、ISO/IEC 10646 の国際一致規格である JIS X 0221 の次 期以降の版において参照するようにすることを検討する(7.2 参照)。 ただし、文字情報基盤で整備された全 6 万文字図形のうち、約 1,900 文字については、ISO での標準化作業が進行中であることから、これらが UCS および IVD で指定できるようになる にはしばらく時間がかかる。それまでの間、この範囲の文字図形については、文字情報基盤で 整備した文字情報一覧表で示された MJ 文字図形名の集合として指定する必要がある(7.1 参照)。 8.4. 文字図形イメージの交換 UCS や IVS を持たない文字図形については、情報システム間で、それを図形(イメージ)と して交換する必要がある。図形(イメージ)を交換するための規格として広く知られているものに、 - 15 -
SVG18, PNG19がある。
文字図形に係るデータを、XML 文書等に埋め込む場合、以下のような記法が考えられる。本 記法は JIS X 4166 “XML文書へのグリフ識別子埋め込み”の記法を参考にしたものである20。
XML 一般においては、
<glyph uri=“ [文字図形に係る URI]”/>
(ここで、「glyph」は、指定したグリフをこの場所へ表示することを示すタグとして別途定 義するもの。タグ名を含め、別途、リファレンスとなる定義を規定する(7.1 参照)。)
一般の html ブラウザ向けでの記述では、
<span glyph:uri=“[文字図形に係る URI]”>代</span>
(ここで「代」は、URI で指定された当該グリフを表示できない環境で代替えとして置き換 えられる文字(列)。“glyph”は文字図形を指定するための属性として別途リファレンスとなる 定義を規定する(7.1 参照)。) ここで参照する文字図形が、文字情報基盤で整備された図形であれば、[文字図形に係る URI] の部分に glyph.mojikiban.ipa.go.jp/<MJ 文字図形名> のように記述することにより、指定可能である 21。「MJ 文字図形名」は、文字情報基盤で整 備された文字図形を一意に識別するために設けられた、MJxxxxxx のような、MJ+6 桁の数字か ら構成される識別名である。 文字情報基盤で整備した対象となっていない文字図形を指定する必要がある場合、SVG、PNG 等の標準規格で表現した図形を別途独自に用意し、そこの URI を指定することで図形を交換す ることが可能である。この場合、当該 URI は長期に渡って内容を維持管理する必要がある。ま た、図形情報をデータファイルの形で別途伝送した上で、そのファイル名を指定するといった 手段も有る。この場合は、文字図形に係る情報は、受け手が管理する必要がある。 8.5. 外字の利用
UCS では、特定の範囲(私用面:Private Use Plane, PUP)の文字符号に、利用者が独自の文 字図形を割り振って使うことが認められている。このようにして使用する文字を一般に、「外字」 と呼ぶ。
「外字」の符号は、利用者が任意に与えるものなので、異なる利用者間で符号のみを交換す
18 SVG: Scalable Vector Graphics. W3Cで標準化された図形表記のフォーマット
(http://www.w3.org/standards/techs/svg)
19 PNG: Portable Network Graphics. ISO/IEC 15948:2004 として規定されている。
20 JIS X 4166 は、文字図形の参照を ISO/IEC 10036 に基づいて登録されたグリフ名を参照するものとし
ているが、ここでは一般的 URI で参照するものとして記載した。
21 同 URI は近く IPA から公開予定である(6.1 参照)。
- 16 -
ると、同一符号が両者で異なる文字図形に対応することとなり、いわゆる「文字化け」の原因 となり、情報交換上の混乱を来す。そのため、外字の利用は特定組織の内部あるいは、密接に 連携した組織間のみにとどめ、それら組織外への送信には用いるべきでない。
文字情報一覧表の項目
項目 内容 MJ 文字図形名 MJ 文字情報一覧表内で一意に定めた文字図形の名称 戸籍統一文字番号 6 桁の 10 進数の戸籍統一文字番号を記した。 住基ネット統一文字コ ード 「J+」に続けて 4 桁の 16 進数の住民基本台帳ネットワークシステム 統一文字コードを記した。 入管正字コード 平成 23 年法務省告示第 582 号第二項第四号 正字に示された「工業標 準化法(昭和二十四年法律第百八十五号)に基づく日本工業規格(以 下「日本工業規格」という。)X〇二二一号(以下「国際符号化文字集 合」という。)に規定する漢字(国際符号化文字集合附属書JA日本文 字部分レパートリに該当するものに限る。)及び別表第一に定める漢字 をいう」の 16 進数を記した。 入管外字コード 平成 23 年法務省告示第 582 号第二項第 7 号に示された「国際符号化 文字集合に規定する私用文字として別表第一に定める文字の符号化表 現」の 16 進数を記した。 漢字施策 「常用漢字」は、常用漢字表(平成 22 年 11 月 30 日内閣告示)に示 された通用字体(常用漢字表で括弧が添えられていない漢字)に示さ れた漢字である。「人名用漢字」は、戸籍法施行規則別表第二の「漢字 の表一・二」に示された漢字である。 X0213 X0213 欄には、JIS X 0213:2004 の面区点位置を記した。 X0213 包摂連番 包摂連番欄には、該当する文字に JIS X 0213:2004 の包摂規準を適用 させると符号化できる場合、包摂規準連番を記した。 X0213 包摂区分 包摂区分欄には、「0」「2」の 2 種を記した。「0」は、該当する文字が JIS X 0213:2004 規格票の例示する字体に相当する字 形であること を示す。「2」は、該当する文字が JIS X 0213:2004 の包摂規準を適用 できる字体に相当する字形であることを示す。 X0212 X0212 欄には、JIS X 0212:1990 の区点位置を記した。対応する UCS 対応する UCS 欄には、「U+」に続けて ISO/IEC 10646:2012 の 16 進数の UCS コードを記した。ただし、UCS コード情報の確度や対応 状況が異なるため、「UCS 対応カテゴリー」欄に確度情報を記した。 対応する互換漢字 互換漢字に該当する MJ 文字図形名には、対応する互換漢字欄に、「U+」
に続けて ISO/IEC 10646:2012 の 16 進数の UCS コードを記した。 実装した UCS IPAmj 明朝フォント Ver.002.02 の実装において当該図形に対して割
り当てる UCS コードを記した。 同一の UCS コードを持つ図形が複数ある場合において、フォント実装 において対応付ける図形(デフォルトグリフ)は、下記の優先順位に より決定した。 1. 常用漢字表に掲載されている字形 2. 人名用漢字別表(戸籍法施行規則別表第二漢字の表)に掲載さ れている字形 【別添】 i
3. 住民基本台帳ネットワークシステム統一文字コードと対応す る UCS が一致する字形 4. JIS X 0213:2004 に掲載されている例示字形 5. UCS の J 欄(日本提案の字体)に掲載されている例示字形 6. 法務省告示第 582 号別表 1 に掲載されている字形 7. 康煕字典体 「市区町村が使用する外字の実態調査」の出現頻度 UCS 対応カテゴリー 「 対 応 す る UCS 」 欄 の 確 度 の カ テ ゴ リ ー 分 け を 下 記 (A1,A2,A3,A4,E,F)のように行った。 【カテゴリーA】 平成 23 年度から平成 25 年度までの文字情報基盤整備事業で確認済み のもの。
• A1) ISO/IEC10646 CJK 統合漢字に J ソースがあるもの(JIS X 0213、JIS X 0212 に例示されている文字を含む)。 • A2) 住基ネット統一文字で住基ネット統一文字コードが
3400~9FA5 のもの。
• A3) Unicode Consortium の IVD Version 2010-11-14 の Hanyo-Denshi コレクションとして登録されているもの。 • A4) 文字情報基盤整備事業において個別に確認したもの。 【カテゴリーE】 ISO/IEC 10646:2014(予定)の発行により、対応する UCS コードの確 定が見込まれるもの。 【カテゴリーF】 現在 ISO に提案中であり、対応する UCS コードが存在しないもの。 実装した IVS Unicode Consortium の IVD Version 2010-11-14 の Hanyo-Denshi
コレクションにより実装した IVS を記した。 MJ 文字図形バージョ ン IPAmj 明朝フォント Ver.002.02 および SVG 図形ファイルに収録した 文字図形(MJ 文字図形)のバージョンを記した。 登記統一文字番号(参 考) 8 桁の 10 進数の登記統一文字番号を記した。 部首(参考) 部首欄には部首番号を記した。『康煕字典』の部首の通し番号により、 1 から 214 までである。 内画数(参考) 内画数欄には部首内画数(部首を除いた残りの部分の画数)を記した。 総画数(参考) 総画数欄には文字の総画数を記した。 読み(参考) 読み欄には文字の読みを記した。原則として、音読みは片仮名、訓読 みは平仮名である。 大漢和 大漢和欄には、諸橋轍次『大漢和辞典』(修訂第二版第六刷、大修館書 店、2001 年)及び鎌田正・米山寅太郎『大漢和辞典補巻』(初版、大 修館書店、2000 年)の親字番号を記した。なお、『大漢和辞典』及び 『大漢和辞典補巻』の親文字と漢字字体に差異があるものの同定が可 ii
能なものには、親字番号の末尾に#を付けて示した。 日本語漢字辞典 日本語漢字辞典欄には、新潮社編「新潮日本語漢字辞典」(第四刷、新 潮社、2008 年)の検字番号を記した。 汎用電子整理番号(参 考) 汎用電子情報交換環境整備プログラムの漢字情報テーブルにおけるレ コードの通し番号を記した。 平成明朝(参考) 平成明朝体グリフのグリフ名。平成明朝体グリフは汎用電子情報交換 環境整備プログラムの文字グリフ作業委員会にて制作されたものであ る。 更新履歴 本一覧表において、過去に変更された情報の履歴を記し、変更のあっ た事項毎に MJ 文字情報一覧表バージョン番号を行頭に付した。 iii
文字情報基盤導入テクニカルスタディ(案)
ドラフト (2014 年 2 月 6 日版) 1. 本テクニカルスタディの目的 本テクニカルスタディは、文字情報基盤で整備された漢字の全てに UCS あるいは IVS の符号 が付与されるまでの過渡的期間への対応、及び、同期間終了後のシステム移行等を文字情報基 盤導入ガイド(以下「導入ガイド」と呼ぶ)の趣旨に沿って円滑に進めるために必要な、具体 的な技術情報を共有することを目的とする。 2. 過渡的期間の定義 導入ガイドに示したとおり、文字情報基盤で整備された漢字のうち、約 1,900 文字について は、ISO/IEC JTC1 SC2 WG21(以下 ISO/IEC と呼ぶ)による標準化作業(“拡張 F”標準化作業) の過程にあり、その終了には 2 年~数年を要する。 2014 年末から、この標準化作業が終了するまでの期間を「ISO/IEC 作業期間」と呼ぶこと とする。 「ISO/IEC 作業期間」は、遅くとも 2020 年までには終了する。「ISO/IEC 作業期間」が終了した後は文字情報基盤で整備された漢字の全てが UCS 符号と IVS により活用可能となる。 文字情報基盤で整備された漢字のうち約 6,000 文字図形は、IVS によって指定することが必 要であるが、現状、一部の PC 向けアプリを除き、IVS を使えるシステムの普及は十分でない。 「ISO/IEC 作業期間」終了後も、基幹情報システム等においては、IVS に未対応の情報機器が 相当期間併存することが見込まれる。IVS 未対応の情報機器が併存する期間を「非 IVS 機器併 存期間」と呼ぶこととする。 2014 2015 2016 2017 2018 2019 2020 2021 ISO/I9C作業期間 非IVS機器併存期間 3. 文字情報基盤暫定私用コード 「ISO/IEC 作業期間」が終了するまでの間、文字情報基盤で整備された漢字のうち、約 1,900 文字図形については、UCS 符号が与えられていない。 また、現状では、一部の PC 向けアプリを除き、IVS を使えるシステムの普及は十分でない。 そこで、「ISO/IEC 作業期間」において本テクニカルスタディに基づく文字情報基盤の運用に 合意した組織(以下「合意組織」と呼ぶ)間において、暫定的、かつ私的(相互に合意した者 の間でのみ使用)な符号体系として、UCS の定める私用面(PUP:Private Use Plane)を活用
1 国際符号化文字集合(UCS)規格を策定する組織
1 / 4
した、「文字情報基盤暫定私用コード 1」を定義する。併せて、「非 IVS 機器併存期間」におい て、IVS に未対応の機器でも文字情報基盤で整備した全ての文字を使用可能とするための体系と して、「文字情報基盤暫定私用コード2」を定義する(図 1 参照)。 これらの暫定コードは、UCS の規定に則り、「合意組織」間のみで私的に共有するものとし、 その外部に伝送してはならない。 「ISO/IEC 作業期間」が終了した時点では、「合意組織」間も含め、組織外部に伝送する文字 情報は、原則 UCS+IVS による符号体系によるものとする。組織間情報交換に使用するコード を実際に UCS+IVS へ移行するのは、「ISO/IEC 作業期間」終了からゆとりを持たせ、2019 年 末とする(この時期については、今後の状況に応じ、合意の上で変更することが有り得る)。 3.1. 文字情報基盤暫定私用コード1 文字情報基盤で整備された漢字のうち、ISO/IEC による標準化過程にある約 1,900 文字図 形及び、IVS で指定することの必要な約 6,000 文字図形、及び変体仮名文字図形を、UCS の規 定する PUP である第 16 面(U+100000~U+10FFFF)へ別表のように収容したものを、「文 字情報基盤暫定私用コード1」とする。 3.2. 文字情報基盤暫定私用コード2 「文字情報基盤暫定私用コード1」から、ISO/IEC 作業期間が完了した結果、符号位置が確 定した文字を当該符号位置へ配置したものを「文字情報基盤暫定私用コード2」とする。「文字 情報基盤暫定私用コード2」の詳細は、「ISO/IEC 作業期間」が終了した後、速やかに IPA が 公開する。 IVS Moji_Joho collection 符号化未了 文字情報基盤 暫定私用コード1 U+000000 U+020000 U+0F0000 U+100000 U+00FFFF 基本面 拡張 A~9 拡張F 私用面 (PUP) PUA 文字情報基盤 暫定私用コード2 最終形(UCS+IVS) 現状 (2014年) UCSの 構造 変体仮名 図 1 文字情報基盤暫定私用コードの関係 2 / 4
4. 過渡的期間における文字情報交換の原則 4.1. 「ISO/IEC 作業期間」における情報交換 図 2 に示すように、「ISO/IEC 作業期間」においては、組織間の情報交換については、JIS X 0213:2012 を基本とするが、「合意組織」間では文字情報基盤暫定私用コード1を使用すること ができる。 組織内部においては、文字情報基盤暫定私用コード1を含み、任意のコード体系を使用する ことができるが、当該文字を文字情報基盤の整備した文字図形に同定する作業を行っておくこ とが推奨される。 本テクニカルスタディに基づく文字情報基盤の 運用について相互に合意した組織 • JIS X 0213:2012による交換を基本とする。 • 「ISO/IEC作業期間」中は、文字情報基盤で 整備した範囲の漢字を文字情報基盤暫定私用 コード1で交換することを可とする。 • 文字情報基暫定私用コード1の使用は、 2019年末を持って終了し、以後、全ての漢 字はUCS+IVSにより交換する。 組織A 組織B 組織X JIS X 0213:2012による交換を原則とする。 Web等での表示の際に、必要に応じ、JIS X 0213:2012範囲外の文字を図形イメー ジによって表示することは有り得る。 • 組織内におけるコード体系は自由。 • 文字情報基盤の整備した文字図形への同定作業を 行うことが推奨される。 • 「ISO/IEC作業期間」中は「文字情報基盤暫定私 用コード1」の運用を可とする。 図 2 ISO/IEC 作業期間中における情報交換の原則 4.2. 「ISO/IEC 作業期間」終了後における情報交換
ISO/IEC 作業期間終了後は、文字情報基盤で整備した全ての漢字を UCS と IVS によって指 定可能となる。そこで、2019 年末を以て文字情報基盤暫定私用コード1を廃止する。 2020 年からは、図 3 に示すように、「合意組織」間においても、漢字の情報交換には UCS+IVS を使用するものとする。 非 IVS 機器併存期間中においては、組織内部で文字情報基盤暫定私用コード2を使用するこ とができる。 ただし、この時点では多くの市販情報機器(PC 等)が IVS に対応していることが予想される ため、文字情報基盤暫定私用コード2の使用は、極力基幹情報システム等の内部に限るものと し、通常のオフィス機器での使用や、保存文書ファイルの作成については、UCS+IVS を使用す ることが強く推奨される。 3 / 4
組織内の情報システムにおいて、文字情報基盤暫定私用コード1を使用していた場合、 「ISO/IEC 作業期間」終了後、速やかに、保存された文書等を含め、文字コードを UCS+IVS 又は文字情報基盤暫定私用コード2(ファイルの保存等への利用は推奨されない)へ変換する ことが求められる。 文字情報基盤暫定私用コード2に対応した文字フォントは、IVS を使用する環境との間での文 字表示上の互換性を配慮した実装とする。 非 IVS 機器併存期間が終了した際は、文字情報基盤暫定私用コード2を廃止する。この時点 で文字情報基盤暫定私用コード2を使用して作成された文書ファイル等は UCS+IVS へコード 変換することが求められる。 本テクニカルスタディに基づく文字情報基盤の 運用について相互に合意した組織 • JIS X 0213:2012による交換を基本とする。 • 文字情報基盤で整備した範囲の漢字を UCS+IVSによって情報交換することを可と する。(文字情報基盤暫定私用コード2は原 則使用しない)。 組織A 組織B 組織X • 組織内におけるコード体系は自由。 • 「非IVS機器併存期間」においては、「文字情報基 盤暫定私用コード2」の運用を可とする。ただし、 組織内においても、文書ファイルの保存等は UCS+IVSを用いることが推奨される。 JIS X 0213:2012による交換を原則とする。 Web等での表示の際に、必要に応じ、JIS X 0213:2012範囲外の文字を図形イメー ジによって表示することは有り得る。 図 3 ISO/IEC 作業期間終了後における情報交換の原則 5. 推奨される準備作業 行政機関等が外部へ情報を提供する際に使用する文字コードとしては、JIS X 0213:2012 と することが原則とされており、これに対応するためには、行政機関等が現行システムで使用し ている文字を、JIS X 0213:2012 の文字セットへ縮退対応させる必要が生じる。 また、行政機関などで交換可能な文字セットが拡大された際への対応も必要である。 このための準備としては、現行システムで使用している文字を、文字情報基盤の文字へ同定 し、「MJ 文字図形名」と対応付けを行っておくことが推奨される。 文字情報基盤で整備された漢字のうち、JIS X 0213:2012 文字セット範囲内の文字において は、MJ 文字図形名と JIS X 0213:2012 の面区点位置との1対1対応表が既に IPA から提供さ れている。また、文字情報基盤で整備した全ての文字を JIS X 0213 の文字セットへ縮退対応さ せる対応表については、2014 年度中に整備する(運用ガイド 7.1 章参照)。 なお、自治体の作成した外字と文字情報基盤の整備した文字図形との対応付けには、総務省 自治体クラウドの調査事業の成果物(各自治体へ配布済)を活用することができる。 4 / 4