3.3 提案されている商品記述の実例
3.3.8 PCO(Portable Compound Object)
一方、「A.出演者:Maedchen Amick」というメタデータを持つ映画は、Miss Amick が主 演か助演か不明なため確実ではないが、検索式「B.主演女優 == Maedchen Amick」にあては まる可能性がある。そこで、可能性がある検索結果として、この映画を挙げるのが「拡大解 釈」である。すなわち、検索する「属性1 ⊆ 属性2」の関係の時に、検索式「属性1 == 値」
を検索式「属性2 = 値」に変換することを「拡大解釈」と呼ぶ。「拡大解釈」は、検索サ ービスにおいて、ユーザの指定された検索式に合致する商品が少ない場合に拡大解釈して商 品を探すなどの用途が考えられる。
3.3.7.4 標準属性辞書
スキーマの数が少ない場合は、スキーマ間の関係は m 対 n で設定することができる。し かし、スキーマは各店が他店との差別化のために拡張したり独自に定義したりして、スキー マの数が多くなると、m 対 n の設定は実質的に不可能になる。これを解決するためには、標 準的な属性を集めた標準属性辞書が必要となる。スキーマを新規に作るときには標準属性辞 書との関係を記述すれことで他のスキーマとの互換性を実現する。
のデータオブジェクトである。特に電子商取引における商品コンテンツや博物館のデジタル ライブラリなどを記述することを目標に東京大学坂村研究室で設計されている。
3.3.8.2 PCOの特徴 (1) 記述フェーズ
l 意味記述が可能 ‑‑ 意味記述とは、例えば1500という数字があったら、
それが大きさなのか値段なのか識別できることを言う。
l HTML変換の標準化 – 記述された意味情報をHTMLに変換するためのマ クロをサポート。Web ブラウザで閲覧することができる。
l 記述したいことが制限なく書ける。 ‑‑ 意味記述の項目が、オブジェクト指 向の継承概念を導入した外部定義言語(PDL)によって自由に定義できる。
l 動的な値の参照 ‑‑ ハイパーリンクやスクリプトによって、条件に応じた値 が得られるように設定可能。
l 入力系の効率化 – 膨大な量のデータ入力の作業を効率よく行えるように、定 義、テンプレート作成、実際の入力の3段階に階層化。
(2) 配布フェーズ
l LZ77圧縮アルゴリズムの標準化 ‑‑ 文字列情報と同様、ファイルオブジ ェクトをバイトコードとしてパッケージ化。
l プロトコルの非依存性 – HTTPプロトコルだけでなく、メールのアタッチ メントやCD−ROMカタログとして配布することが可能。
l 再配布が可能 ‑‑ インターネット上に分散配置されたPCOコントロールサ ーバによって記述者が確認できるので、再配布してもオリジナルの内容を保 証。
l オブジェクトの寿命 – 流通しているオブジェクトは、その内容に対して有効 期限を保持している。古い情報は自動的に除外される。
(3) 利用フェーズ
l オブジェクトの複合化 – 他者が記入したデータオブジェクトを複数組み合わ せて、自分で複合されたオブジェクトを作成することができる。
l 関連辞書 – 外部にキー辞書を置くことで、他のPCOオブジェクトとのデー タ交換性や関連性を保持できる。
l 内容証明 ‑‑ インターネット上に分散配置されたPCOコントロールサーバ によって記述者やデータ指紋を確認でき、改ざんをチェックできる。
l オブジェクトの複合化 – 他者が記入したデータオブジェクトを複数組み合わ せて、自分で複合されたオブジェクトを作成することができる。
(4) 商品記述におけるメリット
商品記述を具体例にして、PCOの特長を列挙すると次のようになる。
l 価格などの意味情報をコンピュータが識別できる。
l 種類が豊富な商品の多様性にあわせて、項目を拡張できる。
l エンドユーザでも簡単に入力することができる。
l 画像などマルチメディアデータもテキスト同様扱え、商品カタログとしてき れいに表示できる。
l 画像などマルチメディアデータもテキスト同様扱える。
l ネットワークによる配布に適している。
l 流通しているデータにディレクトリサービスや複合化サービスなど付加サー ビスを追加しやすい。
l 記入者や改ざんをチェックできる信頼性がある。
これらの特長は、商品記述が自由にインターネットを流通するようなオープン型 EC アーキテクチャ1において、最大限の威力を発揮する。
3.3.8.3 PCOのアーキテクチャ
PCOオブジェクトは、分散オブジェクトの思想に類似している。実際、PCOオブジ ェクトの内部は、複数のチャンク(Chunk)からなり、各チャンクは文字列、数値、テキスト、
画像などのデータを保持している。ただし、PCOオブジェクトの利用者は、チャンクの並
1 複数のショップの商品情報をすべてモール内で処理しているモール型ECアーキテクチ ャに対して、我々が提案しているECアーキテクチャのことを指す。
び型を気にすることなく、チャンク識別子を用いて外部から値を参照することになる。
PCO Architecutre
PCO Request Broker
Response Request
PCO Objects PDL
Class Library Related
Dictionary Database
PDL(PCO Description Language)は、PCOのチャンク識別子、チャンクの型を定義 するものであり、それ自体、PCOとは別に配布・提供されている。PCOの利用者は、P DLを読むことでのみ、そのPCOがどのようなチャンクを保持していて、それの識別子や 型が定義されているか知ることが可能である。
PDLは、オブジェクト指向のクラス継承の概念を導入して、PCO間のチャンクの間 に共有関係や階層関係を持たせることができる。このしくみは、定義が未知のクラスのPC Oであっても、インターフェース(チャンクの共有関係)から基本情報を参照可能であること も意味する。
関連辞書(Related Dictionary)は、文字列や数値が辞書として定義されたものであり、
PCOインスタンス(実体を持ったPCOオブジェクト)間での関連性を検索するときに使 われる。関連辞書もPDLによって、定義される。
クラスや関連辞書の定義は、クラスライブラリや辞書データベースの形で、統合管理さ れる。PCOのデータをフルに利用するときは、クラスライブラリと関連辞書ベースとの連 携が必要であり、これを管理するのがPRB(PCO Request Broker)機構である。ユーザ側 は、直接PCOにアクセスせず、PRBのAPIを用いることになる。
PCOに関する詳しい説明は巻末の6.2資料編PCO仕様書を参照されたい。