平成 23 年度文字情報基盤推進委員会
第 3 回 技術検討 WG
議 事 次 第
日時 平成 23 年 10 月 7 日(金)15:00~17:00
場所 文京グリーンコート センターオフィス 13 階 会議室 C
<議事次第>
1. 開会
資料確認
前回議事録確認
2. 文字情報基盤 Web 実証実験事業(案)
3. その他
<配布資料>
資料 0:議事次第 資料 1:委員名簿 資料 2:文字情報基盤 Web 実証実験事業 (案) ---配付資料等の公開ページ:http://ossipedia.ipa.go.jp/article/34/
資料 0
平成 23 年度文字情報基盤推進委員会
技術検討 WG 委員名簿
(2011 年 8 月 2 日現在)委員長
藤沢 淳
キヤノン株式会社ソフトウェア応用第二開発部 部長
W3C SVG WG メンバー EXI WG メンバー
委員
井上 エイド
グーグル株式会社 エンジニアリング マネージャー
加藤 誠
一般財団法人 Mozilla Japan テクニカルアドバイザ
河合 孝志
株式会社日立製作所 公共システム事業部全国公共ソリューシ
ョン本部自治体アプリケーション第二部 課長
田丸 健三郎
日本マイクロソフト株式会社 技術統括室/イノベーションセ
ンター 本部長
オブザーバ
平本 健二
経済産業省 CIO 補佐官
事務局
田代 秀一
情報処理推進機構国際標準推進センター長
小林 龍生
情報処理推進機構国際標準推進センター専門委員
沼田 秀穂
情報処理推進機構国際標準推進センター研究員
池田 佳代
情報処理推進機構国際標準推進センター研究員
資料 1
1 2011年 10 月 07 日 IPA
文字情報基盤 Web 実証実験事業 (案)
1. 目的
文字情報基盤推進事業で整備した約 6 万字の漢字(文字情報基盤漢字:図 1 参照)を、 広く一般国民に閲覧してもらえるよう Web 上に公開し、氏名・住所等の多様な漢字をパソ コンから入力、出力(ディスプレイ、プリンタ)できる環境を準備する。本実験は、文字情 報基盤のメリットを体験できるデモンストレーションという広報的側面と、Web ブラウザ へ伝送し、表示するための技術的手段の検討・実証、そして課題を洗い出すことを目的とす る。 図 1 文字情報基盤漢字資料
2
2
2. 実験シナリオ
対象が一般国民であるため、以下のことを前提とした実験環境を構築する。 (1) 内容 氏名・住所等の多様な漢字の入力が必要となる Web を用いた電子申請をイメージして、 文字情報基盤漢字の実験サイトとする。本事業の目的および 4 章で述べる実験項目を満た す具体的なストーリーを検討して提案すること。 Web ページ構造としては、文字情報基盤推進事業の広報と本実験の趣旨・内容を告知す るトップページの下、各実験項目を満たす実験ページを展開する。 (2) 操作性 わかりやすいユーザーインターフェース 難しい操作は避ける (3) 相互運用性と国際整合性 本実験は相互運用性と国際整合性を担保していることを条件とする。 特定の OS、特定の Web ブラウザに依存しない方式を検討する。 ただし、UTF-8 が動作する環境を本実験の対象とする。 ISO/IEC10646 CJK 統合漢字の規格に準拠することが方針である。 本実験では IPAmj 明朝フォントの UCS 実装を変更しない。本実験では IPAmj 明朝フォント UCS 実装外文字(文字図形)に対して PUA 等の外字領 域への UCS 実装は行わない。 入力・表示された文字列は、相互運用性と国際整合性を維持した上での再利用性に配 慮する。 (4) 用語 文字情報基盤 Web 実証実験事業で使用する主要な用語の定義は以下の通りとするものと する。 No 用語 定義 補足
01 IVD Unicode Ideographic Variation Database:IVS 方式による 異体字識別番号を登録したデータベース。Unicode
Consortiumへの登録制となっている。
本事業が対象とする具体的な字形については、
3
02 IVS Variation selectors and variation sequences:文字が、 形状の異なる複数の異体字を持つ場合、通常のコードスペ ースで符号化する文字符号は原則1つとし、個別の異体字 表記については、文字コードではなく、異体字識別番号に よって識別しようという考え方である。 IPAmj明朝フォントへの実装において IVS を割り当てた文字 を IVS 実装漢字と呼ぶ。 03 MJ 文字情 報一覧表 文字情報基盤推進事業で整備した文字情報の一覧表であ る。成果物の漢字に付けられた固有名(MJ 文字図形名)と 住基ネット統一文字コード、戸籍統一文字番号等、国際符 号化文字集合、JIS コード等との対応関係及び、各種属性情 報、主要な漢字字典を典拠とする参考情報などが一覧表と して記載している。 IPAmj明朝ダウンロードサイト、MJ 文字情報一覧表、検索 システム(試行版)を参照 http://ossipedia.ipa.go.jp/ipamjfont/ 04 IPAmj 明朝 フォント 文字情報基盤推進事業で整備した TrueType ベースの OpenTypeフォーマットによるフォントである。 IPAmj明朝ダウンロードサイト、MJ 文字情報一覧表、検索 システム(試行版)を参照 http://ossipedia.ipa.go.jp/ipamjfont/ 05 IPAmj 明朝 フ ォ ン ト UCS実装漢 字 IPAmj明朝フォントへの実装において ISO/IEC10646 CJK 統 合漢字(UCS)の符号位置を割り当てた漢字を IPAmj 明朝フ ォント UCS 実装漢字と呼ぶ。 06 IPAmj 明朝 フ ォ ン ト UCS実装外 漢字 IPAmj明朝フォントへの実装において UCS の符号位置を持っ ていないグリフであり、文字画像として扱う。 07 文字図形 本実証事業では、IPAmj 明朝フォント UCS 実装外文字は、1 文字1ファイルの文字図形データの状態で、表示にはイン ライン画像として扱う。
4
3. 事業の概要
3.1. 実験環境の構築 OSS オープン・ラボが提供する仮想マシン上に、4 章で述べる実験項目を確認可能な環境 を構築すること。OSS オープン・ラボおよび実験に用いる IPAmj 明朝フォント、MJ 文字 情報一覧表については以下を参照のこと。 ・OSS オープン・ラボ https://www.openlab.ipa.go.jp/modules/information/index.php ・OSS オープン・ラボ 利用者マニュアル https://www.openlab.ipa.go.jp/modules/information/usersmanual.pdf ・IPAmj 明朝ダウンロードサイト、MJ 文字情報一覧表、検索システム(試行版) http://ossipedia.ipa.go.jp/ipamjfont/ 3.2. 実験の実施及び報告書の作成 次章で述べる実験項目に沿った確認作業を実施して結果をまとめる。4. 実験項目
4.1. 文字入力 (1) 実験概要文字情報基盤漢字 6 万字(IPAmj 明朝フォントへの UCS 実装外漢字を含む)を Web ブラウ ザ上で入力できる環境の確認。
IPAmj 明朝フォント UCS 実装外漢字(文字図形)や IVS 実装漢字を含む所望の文 字情報基盤漢字 6 万字が入力できる具体的な Web ベースでのソリューションの確立 所望の漢字に到達できる入力手法の確認 公開中の MJ 文字情報一覧表およびその検索システムも踏まえ、Web ブラウザ上で の入力の役割を整理する。 (2) 実験項目 (a) JIS X0213 範囲の文字入力 大多数の使用者にストレスのない入力方法として、クライアント端末で使用している OS 付属の IME 等を使って IPAmj 明朝フォントの文字入力を行えることを前提とする。 (b) CJK統合漢字拡張B,C,D領域のIPAmj明朝フォントUCS実装漢字およびIVS対応ブ ラウザに対するIVS実装漢字の文字入力
クライアント端末の IME で入力できない(IPAmj 明朝フォントに UCS 実装されて いる)漢字に対する Web ベースでの入力方法を構築。当該入力方法においては、JIS X 0213 範囲における単体での漢字入力も包含する。
5 上記入力方法により、ユーザーが所望する漢字を、1つまたは複数の入力候補漢字か ら選択可能な状態で提示し、ユーザーは簡単な操作で入力確定する。入力候補漢字を 表示する際には、各候補漢字のメタ情報である MJ 文字情報一覧表の文字情報をあわ せて提示する。 (c) IPAmj明朝フォントUCS実装外文字(文字図形)および、IVS未対応ブラウザに対 するIVS実装漢字の文字入力 画像として扱うが、上記(b)とシームレスな Web ベースでの入力方法を確立する。 4.2. 文字出力(表示) (1) 実験概要 一般国民が IPAmj 明朝フォントを普段使用しているパソコンにインストールできない (インストールしない)前提で、実験サイトへアクセスしてくることを想定し、IPAmj 明 朝フォントが PC クライアント端末にない場合でも文字情報基盤漢字の全グリフが表示で きる環境構築について実験を行う。 (2) 実験項目 (a) WebFont方式による表示確認
W3C(World Wide Web Consortium)の CSS3(Cascading Style Sheets3)規格 に定義されている WebFont 方式による表示確認(上記(4.1)実験項目との組み合 わせ実験) IPAmj 明朝フォントの IVS 実装漢字表示の可否、縦組み表示の可否、反応時間等を テスト項目とする。 複数の Web フォント方式を用いて、各テスト項目におけるメリット/デメリットを 整理。 IPAmj 明朝フォント UCS 実装外文字(文字図形)のインライン表示 →適切な文字図形のインライン表示のためのフォーマットを確認する。 (b) OSおよびWebブラウザによる振る舞い違いの確認、およびその吸収方法の確認 OS(Windows、Mac OS X、Linux)および Web ブラウザ(IE、Firefox、Google
Chrome、Safari、Opera)による振る舞いの違いの確認、並びにその挙動の差異吸 収方法の確認。 Web アクセスに使用されたクライアント端末の OS/ブラウザの統計を取る(ログ管 理) (c) Webフォント機能未対応Webブラウザでの対応方法 CSS3 の Web フォント機能に未対応な Web ブラウザでアクセスが来た場合には Web フォント機能に対応した Web ブラウザへのバージョンアップあるいは IPAmj 明朝フォントのインストールのどちらかの対応をメッセージで要求する。
6 4.3. スマートフォン、スレート(タブレット)端末での課題抽出 (1) 実験概要 PC 以外に於いても急速に普及しつつある CSS3 の Web フォント機能を正式採用する Web ブラウザを搭載した主要なスマートフォン、スレート(タブレット)端末での入力・ 表示の状況を確認し、課題抽出も合わせて行う。 (2) 実験項目 (a) 実験環境 4.1 および 4.2 の実験を行うために構築した実験環境をそのまま用いる。 (b) 状況確認対象
米国アップル社 iOS4 以降、Google Inc. Android 2.3 以降、米国マイクロソフト社 Windows Phone 7 以降の OS を搭載したデバイスとする。 パソコン向けに構築した入力・表示の実験環境を用いて、スマートフォン、スレート (タブレット)端末における文字情報基盤漢字の入力・表示課題を明確にする。 【 We b電子申請実証実験イメージ】 We b Fon tサーバー 文字図形サーバー Webサーバーへアクセス HTML要求 OS/ブラウザ情報の確認 Webフォントに対応済みブラウザか、IVS対応済みブラウザかを認識 Webフォントに対応済みでないブラウザがアクセスしてきた場合 <表示要求> WebブラウザのバージョンアップあるいはIPAmj明朝をダウンロードおよびインストールが必要な旨を表示 IVSに対応済みでないブラウザがアクセスしてきた場合 <表示要求> IVS符号化文字について、符号化外文字の扱いとするデータベースにサーバー側で動的に切り替える 文字表示 <表示要求> IMEサーバーに収納している辞書およびCSSを用いて、指定のWebフォントから表示グリフを取り出し表示する。 画像表示 <表示要求> IMEサーバーに収納している辞書、指定の文字図形を取り出しインライン画像表示する。 クライアント端末 We b/ IMEサーバー 図 2 Web 電子申請実証実験イメージ
7 4.4. データ運用 (1) 実験概要 上記 4.1, 4.2 実験結果である Web ブラウザ上に表示された文字列(文字図形を含む)を コピーし他のアプリケーションソフトウエアにペーストする際に、最低限の文字情報が交換 できる相互運用性を確認する。具体的には、IPAmj 明朝フォント UCS 実装外文字(文字図 形)を画像で扱った場合には、テキストエディタ上では MJ 文字図形名を示す文字列を表示 する運用実験を行う。ただし、この文字列コピー&ペースト実験は IPAmj 明朝フォントが インストールされている PC であることが前提条件である。 (2) 実験項目 (a) インライン画像としてコピー&ペーストする場合 Web ブラウザに表示されたインライン文字画像を含む文字列をインライン画像表示 が可能なリッチテキスト形式に対応したアプリケーション(Microsoft Word、 OpenDocumentFormat 等)へコピー&ペーストした際に、ペースト先もインライ ン画像で表示する。 (b) 文字列としてコピー&ペーストする場合 Web ブラウザに表示されたインライン文字画像を含む文字列をインライン画像表示 が不可能なメモ帳等のテキストエディタへのコピー&ペーストした際に、インライン 文字画像は、ペースト先では「MJ 文字図形名」を示す文字列を表示する。 文字列のコピーは、特定のブラウザに依存しないものとする。セキュリティにも配慮 し Web ブラウザにプラグイン(アドオン)等をインストールしないものとする。
5. 事業の実施体制
(1) 実施要員に、本件「文字情報基盤 Web 実証実験」業務の遂行に必要な関連知識、十 分なプロジェクト管理能力を有していること。(2) 実施要員に、ISO/IEC 10646(UCS)、Unicode Consortium、JIS X 0213 や JIS X 0221 などの情報交換用符号化文字集合規格の資料を理解し、実験対象となる OpenType フォント、IVS の仕様内容を正しく説明出来る知識を有する経験者を含めること。 (3) プロジェクト管理等により、作業計画を明確に定め、作業項目毎の工程管理を行い、 作業の遅延等が生じた際は IPA 担当者に報告すること。
6. 事業期間及びスケジュール
契約締結日から 201 年 月 日( )まで (1)実験開始日: (2)実験実施報告書: ※具体的なスケジュールについては別途相談の上決定するものとする。8
7. 納入物件
以下記載資料の電子データを収めた記録媒体(CD-R 又は DVD-R) 一式 (1)実験実施報告書
実証実験実施報告は Microsoft Office2003 互換または Open Office 形式とするこ と