CHISEのセマンティックWiki化の試み
8
0
0
全文
(2) Vol.2010-CH-87 No.8 2010/7/31. 情報処理学会研究報告 IPSJ SIG Technical Report. 例えば、GlyphWiki5) が編集対象とするのは漢字字形のストローク情報であり、テキス. いることが多い。 一方、近年、セマンティック Web と呼ばれる、『賢い』機械処理を可能とするために、. トデータを全く含まない、ベクトル形式の画像データである。座標情報などをテキストデー. メタデータやオントロジー等を付与しようとする流れがある。Wiki においても、こうした. タとして直接編集するのは直感的な作業とはいえないので、GlyphWiki では漢字字形を編. ことを Wiki 的手法によって実現しようとする試みがあり、ここでは機械可読な知識表現を. 集するための専用のエディタを用意している。また、GlyphWiki の閲覧用の表示ではグリ. 生成することを目的とした Wiki を『セマンティック Wiki』と呼ぶこととする。. フに関するさまざまな関連情報が表示されるが、これらの項目は決め打ちされており、利用. 6). (1). では、セマンティック Wiki を. 者が編集することが出来ない。. 記述された Wiki ページの情報に基づいて,メタ情報を示す RDF が自動生成される. つまり、テキスト以外の構造化されたデータの場合、そのデータ形式や表示・編集方法を. タイプ. ある程度固定すれば比較的容易であるが、一般的な Wiki がテキストをさまざまに試行錯. (2). ユーザがタグや簡単な命令文を記述することで,RDF が生成されるタイプ. 誤しながら頁の内容や表示結果を編集できるのと同様なことを非テキスト系の機械可読な. (3). ユーザが RDF/XML 構文を直接記述するタイフ. データに対して実現するためには何らかの工夫が必要であるといえる。. の3種類に分類している。. 3. 目. 最初のタイプは、多くの Wiki やブログ等で見られるもので、利用者が意識することな く、RDF によるメタデータが自動的に生成されるものである。ただ、この種のシステムが. 3.1 素性の種類やデータ形式が限定されないこと. 生成するのは、タイトル、更新日時、リンクなどのような、あらかじめ定義された極めて限. CHISE の文字オントロジーでは、各オブジェクトは、Chaon モデルに基づき、任意の. 定されたメタ情報のみであり、ここで扱うセマンティック Wiki に含めないこととする。. 素性の集合で表現可能である。CHISE-Wiki ではこの自由度を損なうことなく、XEmacs. 2番目のタイプは、通常の Wiki テキストの中に、Wiki 的な簡単なタグを使って知識表. CHISE 上で define-char 形式で定義できることは全て編集可能とすることを目標とする。. 現を埋め込むようなものである。例えば、MediaWiki7) の拡張である Semantic Medi8). 標. 3.2 内部表現の汎用性. の場合、[[述語::目的語]] という記法で、主語 (subject)・述語 (predicate)・目. また、CHISE の文字オントロジーは CHISE 環境を利用する CHISE-Wiki 以外のシス. 的語 (object) の3項関係 (triple) を記述することが出来る。例えば、 「ドイツ」に関する頁. テムと共有するものであるから、編集上の容易さだけを目的に CHISE-Wiki 固有の特別な. の中に. 記法を内部表現として用いることは望ましくなく、ある程度汎用的な内部表現を採用した方. aWiki. ドイツの首都は [[Has capital::ベルリン]] である。. が良いといえる。. と書くことで、 「ドイツの首都はベルリンである。 」という情報を人間向けのテキストと機械. 3.3 なるべく容易に編集できること. 可読な知識表現の両面で記述することができる。. XML 等の構文ミスに悩まされることのないよう、なるべく書きやすい記法で書けること. 3番目のタイプは、自由度や表現力の点ではもっとも強力であるが、初心者にとっては. が望ましい。. ハードルが高いといえる。. 4. 編 集 対 象. 結局、一般的な Wiki の延長線上で知識表現を扱う場合、2番目の手法が現実的だと考え られるが、これはもう少し一般化していえば、編集対象が基本的には文章であり、テキスト. CHISE-Wiki において、Wiki 頁の編集対象となるのは第一に文字素性値であるといえ. の中に少しテキスト以外の構造データが埋め込まれるというような場合、一般的な Wiki の. る。しかしながら、Wiki 頁は人間が読むためのものであるので、そうした実データだけで. 延長線上で扱うことが比較的容易であるということだといえよう。逆にいえば、テキスト以. はなく、文字素性値の表示の仕方や、文字素性の情報を並べる順番、あるいは、頁全体のデ. 外の構造化されたデータを主な編集対象としたい場合、一般的な Wiki の枠組の延長線上で. ザイン等も編集できることが望ましいといえる。また、メモとして、あるいは、読者のため. 扱うことは容易ではないといえる。. の情報として、さまざまなコメントが記述できることが望ましいといえ、理想的には、Wiki. 2. c 2010 Information Processing Society of Japan.
(3) Vol.2010-CH-87 No.8 2010/7/31. 情報処理学会研究報告 IPSJ SIG Technical Report. 頁を構成するあらゆる情報に対してコメントが付加できることが望ましいといえる。. 編集の際においても、同じ整数であっても、10 進数として編集するのか、16 進数として. そうすると、想定される編集対象は. 編集するのか、はたまた、区点として編集するのか、あるいは、康煕部首を表す漢字として. (1). 文字素性値. 編集するのか、表示の場合と同様、素性名によって決定される素性値のセマンティクスに基. (2). 文字素性値に対するコメント. づき、いろんな場合があり得る。整数であれば常に 10 進数として編集するという風に固定. (3). 文字素性の表示の仕方. 化するのは、入力作業をなるべく容易にしようという目標に反するといえ、表示の場合と同. (4). Wiki 頁全体の表示の仕方(文字素性の並べ方). 様に、素性値のセマンティクスに応じたさまざまな入力形式に対応できることが望ましいと. (5). Wiki 頁全体でのコメント(自由記述項目). いえる。. (6). 文字素性名に対するコメント. こうした問題を解決するために、CHISE-Wiki では、型・表示の仕方・編集の仕方等を. の 6 点ということになる。ここで、4. は通常の Wiki における頁記述に相当するものとい. 素性の素性(素性属性)に設定することにする。そして、これらの素性属性を編集すること. え、以下では『Wiki 頁記述』と呼ぶことにする。. により、利用者が追加した素性であっても、その型や表示形式や編集方法を定義することが. このうち、2. の文字素性値に対するコメントはメタデータ素性によって表現でき、6. の. 可能となる。このように、素性値ではなく、素性の素性の値を設定することで、素性値の振. 文字素性名に対するコメントは文字素性属性によって表現できる。3. の文字素性の表示の. るまい方を設定することを『メタ編集』と呼ぶことにする。. 仕方もまた文字素性属性によって表現可能であるといえる。また、5. の Wiki 頁全体での. メタ編集のうち、表示の仕方を示す書式指定は、一般的な Wiki と同様な、タグ付けされ. コメントはそのための文字素性を設けるか、あるいは、Wiki 頁記述に埋め込めば良いとい. たテキストによって設定される。つまり、コメントのような人間向けのテキストと同様な形. える。結局、. 式で編集可能であり、Wiki の容易さを保ったまま、各素性の表示をさまざまな形に編集で. (1). 文字素性値. (2). Wiki 頁記述. (3). 文字素性属性. きる訳である。 素性属性の編集は基本的に素性と同様であり、素性属性の表示や編集の仕方は、素性のそ れらが素性属性を編集することで設定できるように、素性属性の素性を編集することで設定. の3要素があれば良いといえる。. 可能である。. この内、1. と 2. は Wiki 頁固有の情報であり、3. は各 Wiki 頁に共通する情報となる。. 6. Wiki 頁の構成. 但し、Wiki 頁記述に関しては各 Wiki 頁に共通するテンプレートがあった方が良いかも知 れない。. CHISE-Wiki は基本的に文字をエントリーとする Wiki 頁の集合であり、そのエントリー である Wiki 頁は CHISE の文字オブジェクトに対応するものである。Wiki 頁は見出しと. 5. メ タ 編 集. なるオブジェクトの表示と、そのオブジェクトの素性の表示からなる。各素性は必要に応じ. CHISE の文字オントロジーでは、素性値は素性名毎に異なった型(形式)をとり得、そ. て、見やすい形に整形される(図 1)。. の意味も素性名毎に異なり得る。内部表現が同じ整数型であっても、康煕部首番号を示して. CHISE 文字オントロジーでは、関係素性->subsumptive, ->denotational を用いてオ. いるならば康煕部首を表す漢字を表示した方が良いだろうし、JIS X 0208 の符号位置であ. ブジェクト間の抽象・具象関係を表現することができるので10) 、 ?1 実際には別の Wiki 頁. るならば 16 進や 10 進での表示に加えて区点表示もあった方が良いだろう。あるいは、文. を包含する Wiki 頁も考えられるが、包含される Wiki 頁も単一の頁として表示できるもの. 字のリストの場合、漢字構造情報ならば IDS (Ideographic Description Sequence). 9). 風に. 表示した方が良いだろうし、異体字関係の場合なら文字の集合として扱う必要があり、場合. ?1 原則として、字形デザイン差のような比較的小さな差異には ->subsumptive, 字体差や同形異義のような比較的 大きな差異には->denotational を用いる。. によってはその出典情報等と関連付けて表示した方が良いかも知れない。. 3. c 2010 Information Processing Society of Japan.
(4) Vol.2010-CH-87 No.8 2010/7/31. 情報処理学会研究報告 IPSJ SIG Technical Report. 図1. 文字オブジェクトの表示例 図 2 包摂された字体の表示例. とする(図 2)。?1 なお、4 節で述べたように、文字素性属性(文字素性の素性)もまた編集対象となり、文 字素性属性という素性の集合によって表現されるオブジェクトである文字素性も、文字オブ ジェクトと同様に、Wiki 頁となるものとする(図 3)。. 7. URI 表現 7.1 URI における文字表現 一般的な Wiki では Wiki 頁はユニークな ID を持つ。?2 一方、CHISE の枠組ではオ ブジェクトは素性の集合で表現されており、オブジェクトに対するユニークで特権的な ID を除去しようとしている。そのため、URI によってどのように Wiki 頁(= 文字)を表現. ?1 実際にどのように表示するかは頁デザインの問題とする。 ?2 エイリアスが利用可能なものもあるが. 図3. 4. 文字素性の表示例. c 2010 Information Processing Society of Japan.
(5) Vol.2010-CH-87 No.8 2010/7/31. 情報処理学会研究報告 IPSJ SIG Technical Report. するかが問題となるが、原理的には Chaon モデルに基づき素性の集合によって表現すれば. (タグ名 属性リスト 子ノード1 子ノード2 ...). 良いといえる。?1 また、現実的には、ID 素性を利用することで高速な名前解決が実現でき. という形式で表現する。ここで、この後者の形式を『XML 抽象構文木』と呼ぶことにする。. る。いずれにせよ、ある文字に対応する Wiki 頁が唯一のユニークな URI を持つことを諦. この XML 抽象構文木のタグ名はシンボルである。そして、属性リストの属性名は :foo. めるだけで、オブジェクトに対するユニークな ID なしに、ID 素性名と素性値の組(ある. という形式を用いることとする。また、子ノードn は文字列、もしくは、XML 抽象構文木. いは、素性名と素性値の組の集合)によって Wiki 頁を指定することは可能である。. をとるものとし、子ノードを持たないことも認めることとする。例えば、. URI 中における文字の表現は、具体的には、 「ID 素性名:素性値」という形式によって表 10). 現することにする。但し、ID 素性のうち、抽象文字素性 性. 10). 10). =>>foo は「g.foo 」、抽象字形素性. (link (:ref ”http://cvs.m17n.org/”) ”これはリンクです”). =>foo は「foo 」、抽象グリフ素 10). =>>>foo は「gi.foo 」、詳細字形素性. は. <link ref="http://cvs.m17n.org/">これはリンクです</link>. =>>>>foo. は「gi2.foo 」、極詳細字形素性10) =>>>>>foo は「gi3.foo 」(以下、gi 以下の数字を増やす. に相当する。また、. ことにする)、例示字形素性10) =foo は「rep.foo 」、超抽象文字素性10) ==>foo は「a.foo 」 、. (link (:ref (”http://www.unicode.org/cgi-bin/GetUnihanData.pl?codepoint=”. 超々抽象文字素性10) ===>foo は「a2.foo 」 (以下、a 以下の数字を増やすことにする)とい. (HEX))) ”U+” (HEX)). う表現によって表すことにする。. という風に、属性リストの属性値として子ノード列と同様なリストも認めることとする。な. 7.2 URI における関係素性名の表現. お、XML にする場合、. HTML, XML では <, > をエスケープする必要があるので、%<16 進>記法とは別に、関. <link. 係素性の URI 中における表現形式を設けることにする:. ref="http://www.unicode.org/cgi-bin/GetUnihanData.pl?codepoint=<HEX/>">. 関係素性 <-foo の URI 中での表現は from.foo とする。. これはリンクです</link>. 関係素性 ->foo の URI 中での表現は to.foo とする。. とは書けないので、. 8. 文字頁の書式指定と内部表現. <link. Wiki 頁の内部表現としては Wiki 記法そのものを用いることが考えられるが、CHISE 文. /></ref>これはリンクです</link>. ><ref>http://www.unicode.org/cgi-bin/GetUnihanData.pl?codepoint=<HEX. 字オントロジーは CHISE-Wiki だけでなく CHISE 環境全体で用いるものであり、CHISE-. と書くこととする。. Wiki 固有の Wiki 表記を採用した場合、その書式指定に関する情報を CHISE 環境全体で 1)2). 用いる上で難点があるといえる。CHISE 文字オントロジーでは階層的素性名記法. 実際には、通常、この XML 抽象構文木そのものではなく、前述のノード(XML 抽象構. に基. 文木、または、文字列)のリストが素性値、あるいは、素性の素性(素性属性)の値として. づき CHISE-Wiki ローカルであることを示すドメイン名を付与すれば CHISE 環境の他の. 格納される。例えば、. 部分に影響を与えること無く共存することが可能ではあるが、CHISE-Wiki の目的のひとつ. <link><ref><name-url/></ref>=U</link. が CHISE の文字オントロジーを WWW 上から編集できるようにすることであることを考. >+<link><ref><unihan-url/></ref><HEX/></link. えれば、ある程度汎用的な内部表現を採用した方が良いといえる。そこで、CHISE-Wiki で. >(<decimal/>) <prev-char/> <next-char/>. は内部表現として XML の構文木に相当する S 式による汎用的な表現を用いることにする。. は. この内部表現ではノードを文字列、もしくは、. ((link (:ref ((name-url))) ”=U”) ”+” (link (:ref ((unihan-url))) (HEX)) ”(” (decimal) ”) ” (prev-char) ” ” (next-char)). ?1 入れ子状になる場合、XRI を用いれば良い。. 5. c 2010 Information Processing Society of Japan.
(6) Vol.2010-CH-87 No.8 2010/7/31. 情報処理学会研究報告 IPSJ SIG Technical Report. と表現される。. の属性 format の値で設定された書式指定に従うこととする。. 8.1 文字素性値の書式指定. 文字素性の形式は、8.1 節で述べたリスト形式を用いる。すなわち、単純な文字列のリス. ある文字に関する Wiki 頁において、ある文字素性の値を表示する際、その文字素性名の. トを書くことも可能であるが、link 関数を用いてハイパーリンクを表現することも可能で. 属性 value-format の値で設定された書式指定に従うこととする。. ある。但し、組み込みタグ関数は 8.1 節で述べたものに加え、表示用の文字素性名を返す関. この書式指定用の素性属性の値はシンボルかリストをとる。. 数 name も利用可能となる。. この値がシンボルの場合、組み込みの書式指定を示す。現在の所、. 文字素性属性 format の値が設定されていない場合、その既定値として、. default 数値は 10 進表記、文字列をクオートしない. ((name) ":" (value)). decimal 10 進数. を用いる。ここで、(value) の返り値は、その文字素性の値を素性属性 value-format の値. HEX 16 進数(大文字). に基づき整形したものとなる。value に対して属性 :format を指定すれば、その値が素性属. hex 16 進数(小文字). 性 value-format の値の代わりに書式指定として用いられる。例えば、(value (:format. ku-ten 区-点表現. HEX)) と書けば、文字素性値を 16 進数にしたものが返る。. comma-separated リストをコンマ (,) で区切る. 9. コ メ ン ト. space-separated リストを空白 ( ) で区切る S-exp S 式(数値は 10 進表記、文字列を ”...” でクオートする). 9.1 文字素性値に対するコメント. を設けることとする。. ある文字素性 foo の値に対するコメントは、foo のメタデータ素性 foo*note に格納する. 一方、リストの場合、そのリストの各要素として、関数ノードと文字列を取ることとす. こととする。. る。ここで、関数ノードとは XML の抽象構文木のことである。また、XML の抽象構文木. コメントの形式は、8.1 節で述べたリスト形式を用いる。すなわち、単純な文字列のリス. のタグ名のことを、タグ関数と呼ぶことにする。. トを書くことも可能であるが、link 関数を用いてハイパーリンクを表現することも可能で. タグ関数には、特別な意味を持つ『組み込みタグ関数』と利用者が自由に定義できる『一. ある。. 般タグ関数』が存在する。組み込みタグ関数としては、現在の所、前述の組み込みの書式指. 9.2 文字に対するコメント. 定に加え、. ある文字に対するコメントは、文字素性 note に格納することとする。. value 素性値を示す. コメントの形式は、8.1 節で述べたリスト形式を用いる。すなわち、単純な文字列のリス. link リンクを示す. トを書くことも可能であるが、link 関数を用いてハイパーリンクを表現することも可能で. を用意することとする。なお、前述の組み込みの書式指定は (value (:format 書式指定)). ある。但し、素性値を参照する関数 value, および、素性値に対する書式指定関数(decimal,. という関数ノードと等価とする。例えば、(HEX) は (value (:format HEX)) と等価となる。. HEX 等)は利用できない。?1. 8.2 表示用文字素性名の指定. 10. Wiki 頁の編集. ある文字に関する Wiki 頁において、ある文字素性の名前を表示する際、その文字素性名 の属性 name の値を表示用の名前として用いることとする。name の値が存在しない場合、. 10.1 書式の編集. その既定値として、文字素性名から機械的に整形した文字列を用いることとする。. CHISE-Wiki の書式指定の編集画面では内部表現の S 式を書式指定の書式指定(を示す. 8.3 文字素性の書式指定 ある文字に関する Wiki 頁において、ある文字素性の情報を表示する際、その文字素性名. ?1 文字素性が指定されていないため。. 6. c 2010 Information Processing Society of Japan.
(7) Vol.2010-CH-87 No.8 2010/7/31. 情報処理学会研究報告 IPSJ SIG Technical Report. 素性の素性の素性)に基づき変換したものが表示される。この書式指定の書式指定の既定値 として CHISE-Wiki の記法が用いられる。 これを編集して、編集結果を登録すると、書式指定の書式指定の記法で記述された編集結 果が構文解析され、8 節で述べた形式に変換して格納される。. 10.2 値 の 編 集 Wiki 頁では、素性値は第 8 節で述べた書式指定に従って整形されて表示される。この 時、編集ボタンも表示され、これを押すことで値を編集するためのモード(頁)に入る。 編集モードでは、編集対象となる項目に対して入力窓が用意され、その初期値として素性. 図 4 16 進数として編集. 値が表示される。前述のように、素性値は第 8 節で述べた書式指定に従って整形されて表 示されるが、編集結果もまたこの書式指定に基づき構文解析され、その結果得られた S 式 が格納される。 例えば、comma-separated が指定されている場合、編集結果はコンマ (,)(とそれの前 後の空白列)で区切られたものを要素とするリストとして解釈される。また、素性属性. format*accept-atom が指定されている場合、編集結果が1要素でかつアトム(数値、文 字、文字列等のリスト以外のもの)である場合、アトムとして解釈される。また、素性属性. format*accept-symbol が指定されている場合、"..." のように " で囲まれた文字列のみが 文字列として解釈され、そうでない文字列はシンボルとして解釈される。. 図 5 16 進数として編集. 編集モードにおいて、編集対象ではない値は入力窓ではなく、通常の整形済文字列として 表示される。すなわち、編集項目だけが入力窓となる訳である。これにより、編集する必要. 報を参照することによってその内容が決定される場合がある。例えば、<HEX/> というタグ. のないデータを誤って壊すことなく入力ができる。また、素性属性 value-format で. の場合、素性値を参照する必要がある。そして、その結果は素性値を 16 進数に変換した文 字列となる。このように、書式指定中のタグ関数を実行することを『評価』と呼び、タグ関. ("0x" (HEX) " [" ku-ten "] (" (decimal) ")") のように複数の形式で値を表示するように設定している場合、この各形式毎に対応する入力. 数を評価した結果の値で置き換えることを『簡約』と呼ぶ。このように、タグ関数を評価し、. 窓を表示することとする(図 4, 5)。. リストを簡約し続けることによって、実行時に決定されるべき全ての項目が決定される。. 11.2 表示用変換. 11. Wiki 頁の表示. 書式指定を簡約した結果得られるリストは HTML に相当する XML 抽象構文木のリス. Wiki 頁は第 8 節で述べた書式指定中の関数ノードの値を CHISE 文字オントロジーにお. トであり、この各ノードを HTML のタグ形式としてシリアライズすることにより HTML. ける文字の情報によって評価・簡約した結果得られる構文木から生成される HTML によっ. 化された文字列を得ることが出来る。. て表示される。. 一方、プレイン・テキストが必要な場合、各ノードの XML 抽象構文木のタグと属性リ. 11.1 評価・簡約. ストを除いて、子ノード中に含まれる文字列だけを取り出せば良い。. 頁や素性、素性値はその書式指定によって整形される。書式指定中は文字列、もしくは、. CHISE-Wiki ではこの2種類の表示を作るための表示用変換器が用意されているが、TEX. タグ関数を要素とするリストであるが、この内、タグ関数は CHISE 文字オントロジーの情. 等の他の形式のための変換器を実現することも可能である。. 7. c 2010 Information Processing Society of Japan.
(8) Vol.2010-CH-87 No.8 2010/7/31. 情報処理学会研究報告 IPSJ SIG Technical Report. 11.3 多 言 語 化. (素性属性は feature オブジェクトの素性となる)として扱われる。よって、CHISE-Wiki. 頁の表示に用いる言語が指定されている場合(ここで、その言語タグを lang とする) 、階層 1)2). 的素性名記法. と同様な手法によって、任意のジャンルのオブジェクトを編集可能な “Concord-Wiki” の. に基づき、素性名(あるいは、素性属性名) (ここで、この名前を basename. ようなものを実現すれば、さまざまな(半)構造データを試行錯誤しながら構造化するため. とする)に lang というドメインを付与し、そのドメインを付与した名前 basename@lang. の編集システムとして利用可能になるかも知れない。. を basename よりも優先して探索することとする。. 参. 例えば、日本語が指定されている場合、もし format@ja の値が存在していれば、この値. 考. 文. 献. 1) 守岡知彦:文字オントロジーに基づく文字処理について,情処研報,Vol.2006, No.112, pp.25–32 (2006). 2006-CH-72. 2) Morioka, T.: CHISE: Character Processing based on Character Ontology, Largescale Knowledge Resources (LKR2008), LNAI, No.4938, pp.148–162 (2008). 3) 守岡知彦,師 茂樹:文字素性に基づく文字処理,情処研報, Vol.2004, No.58, pp. 53–60 (2004). 2004-CH-62. 4) 守岡知彦:CHISE IDS 漢字検索,http://chise.zinbun.kyoto-u.ac.jp/ids-find. 5) 上地宏一:GlyphWiki, http://glyphwiki.org/wiki/GlyphWiki. 6) 河本健作,北村泰彦:Semantic Wiki による RDF 自動生成,第 10 回セマンティック ウェブとオントロジー研究会,人工知能学会 (2005). SIG-SWO-A501-02. 7) : MediaWiki, http://www.mediawiki.org/. 8) : Semantic MediaWiki, http://semantic-mediawiki.org/. 9) International Organization for Standardization (ISO): Information technology — Universal Multiple-Octet Coded Character Set (UCS) (2003). ISO/IEC 10646:2003. 10) 守岡知彦:CHISE に基づくグリフ・オントロジーの試み,人文科学とコンピュータシ ンポジウム論文集—デジタル・ヒューマニティーズの可能性,情報処理学会シンポジウ ムシリーズ,Vol.2009, No.16, 情報処理学会,情報処理学会,pp.9–14 (2009). 11) 守岡知彦:Concord: プロトタイプ方式のオブジェクト指向データベースの試み,Linux Conference 抄録集, Vol.4 (2006).. が format の値の代わりに用いられる(format@ja の値が存在しない場合、format の値が 用いられ、これも存在しない場合は、既定値が用いられる)。 表示可能な言語が複数指定されている場合、その優先順位に従って、複数の素性(属性) を探索することも考えられる。. 12. お わ り に CHISE 文字オントロジーを Wiki 的な手法によって WWW 上で編集するためのシステ ム CHISE-Wiki の満たすべき仕様について述べた。CHISE-Wiki は構造化された機械可 読なデータを Wiki 的な手法によって編集しようとするもので、書式指定と値を分離するこ とで、任意の文字素性値を CHISE-Wiki に依存しない形で編集できる。また、書式指定を. XML に相当するものとすることで、人間が読みやすい形に柔軟に表示できる。コメントの ための素性を設けたり書式指定中にテキストを埋め込むことで、構造化された機械可読な データの編集と Wiki 的な自由なテキストの入力・表示を両立しようとしている。. CHISE-Wiki は現在実装中であり、編集のコンフリクトの解消やセキュリティー上の問 題等、実際の運用にはまだ課題も少なくないが、特別なプログラムのインストールなしに. CHISE 文字オントロジーを利用できるという点で可能性が高いといえる。今後は実際の運 用を通じて問題点を潰し、早期の実用化に努めたい。 また、CHISE-Wiki は CHISE 文字オントロジーを Wiki 化、すなわち、文字に特化し たものとなっているが、対象となるエントリーを文字以外も含む任意のオブジェクトに一般 化することが考えられる。CHISE はその基盤として任意のオブジェクトを素性の集合とし て格納する “Concord”11) を用いており、Concord から見ると、CHISE の文字オブジェク トは character ジャンル?1 のオブジェクト、素性名は feature ジャンルのオブジェクト. ?1 『型』のようなもの。ジャンル毎に固有のオブジェクト空間とオブジェクトにアクセスするためのインターフェ イスを持つ。. 8. c 2010 Information Processing Society of Japan.
(9)
関連したドキュメント
本章では,現在の中国における障害のある人び
現行選挙制に内在する最大の欠陥は,最も深 刻な障害として,コミュニティ内の一分子だけ
RNAi 導入の 2
これはつまり十進法ではなく、一進法を用いて自然数を表記するということである。とは いえ数が大きくなると見にくくなるので、.. 0, 1,
ヒュームがこのような表現をとるのは当然の ことながら、「人間は理性によって感情を支配
日本フォーマットには現在、トルコの一般的な検体方法である、咽頭ぬぐいと鼻ぬぐいの混合 Combined Throat And Nose
これらの事例は、照会に係る事実関係を前提とした一般的
最後に,本稿の構成であるが,本稿では具体的な懲戒処分が表現の自由を