• 検索結果がありません。

amfd-06

N/A
N/A
Protected

Academic year: 2021

シェア "amfd-06"

Copied!
24
0
0

読み込み中.... (全文を見る)

全文

(1)

メタデータの社会生活

伝統的に、司書や文書保管係といった人々は、メタデータという用語を「図書館や 博物館の資料を索引化、整理、保存し、それらへのアクセスを改善するために用いら れる記述的情報†」という意味で使ってきた。この用法の由来はギリシャ語の接頭辞 である「メタ」にあり、その意味は「∼と共に、∼の間に、∼の後に、∼の後ろに」 などと解釈されている。こういった意味でメタデータは、データに付随するものではあ るが、データ自体に不可欠なものではないといえる。古典的な例として挙げられるの は、カード目録である。これは、図書館内の資料の物理的なコレクションについて、 書名別や著者名別、または主題別にアクセスできるようにするためのメタデータを採 用している。カード目録の利用の歴史は、紀元前 650 年のアッシリア帝国の首都ニネ ベにまでさかのぼる。当時、アッシュールバニパル王が、大まかな主題別目録と記述 的書誌を備えた3 万枚を超える粘土板を収蔵する、王宮図書館を設立したのである。 もちろん広義の解釈では、メタデータは言語そのものと同じぐらい古い歴史を持つこ とになる。人や場所や所有物に名前を与える時、人間はそれらの対象物にメタデータ によるタグ付けをしているというわけだ。図 6-2 のような図書館のカード目録は、メタ データの莫大なコレクションである。 メタデータは多くの形式と目的を持つ。管理用のメタデータは、ドキュメント管理 とワークフローの作成を助ける。構造的メタデータは、単一ソースによる情報公開と、 柔軟なコンテンツ表示を可能にする。そして記述的メタデータは、その情報へのアク セスおよび利用を許可する。簡単に言うと、そのドキュメントが検索できるように、 主題を記述する単語やフレーズをメタデータとして用いているのだ。将来的なファイ ンダビリティ確保のために、そのドキュメントの「アバウトネス(何についての情報な のかということ)††」を簡潔に要約しておこうとするのである。 セマンティックウェブが用いるオントロジーから、ソーシャルソフトウェアが生み出 すフォークソノミーにいたるまで、ユーザの興味関心の復興を駆り立ててきたのは、必 要な情報を見つける手助けとなるメタデータの力である。互いに異なるソリューション を求めているにも関わらず、これら二派のコミュニティは似たような問題に直面してい

† A.J. Gilliland-Swetland著『Defining Metadata』。M. Baca との共著『Introduction to Metadata: Pathways to Digital Information』、Getty Information Institute.

†† 訳注:固定的な「意味」とは異なる情報の性質で、その情報を利用する目的、理由、意図など により変化する主題概念のこと。

(2)

る。彼らは新しいツールを用いて、言語や表現や分類体系をめぐる古くからの課題に 取り組んでいるが、不幸なことに、過去から教訓を得たりお互いから学び合ったりす ることができない場合が多いのだ。両者が話し合うことはめったにないし、いざ話をす る段になっても、互いに異なる語彙を用いて会話してしまう。サイバースペースにおけ

図 6-2 伝統的な図書館のカード目録

図 6-3 ブリューゲル作『バベルの塔』(Kunsthistorisches Museum, Wein oder KHM, WLEN)

(3)

る構造と意味をめぐる論争の有様は、いずれ崩壊する定めとなる図 6-3 のようなバベ ルの塔を思い起こさせる。希望的観測としては、メタデータを境界オブジェクトとし て用いることで、われわれは相互解釈を育み、共通理解を形成し、真の社会的進歩を 促すことができるはずなのだ。

タクソノミー

メタデータの歴史は、階層構造と複雑に織り交ぜられている。思考やモノをカテゴ リとサブカテゴリによって体系化することは、人間の経験の基盤となる行いであるか らだ。人間は、理解するために分類を行う。図 6-4 のようなツリー構造が、人間の意 識の根底にある。親子関係を欠いた知性というものは想像もできない。 公式なタクソノミーでは、単一の「ルートノード」が階層構造の頂点に位置する。 属性はクラスからサブクラスへ、継承の原則にしたがって受け継がれる。各オブジェ クトとカテゴリには、そのタクソノミー内で一意の位置情報が割り当てられる。たと えばわれわれは、通りの名前や市町村名、州名、国名が入れ子構造を成す階層関係の 中に存在する住所に暮らしている。人間は、域、界、門、亜門、網、目、科、属、 種といった生物学上のタクソノミーの中で、ホモ・サピエンスとして存在している。 もちろん、世界中どこでも必ずこのプラトン的な理論上の分類アプローチが適用で きるわけではない。肺のある魚もいれば、卵を産む哺乳類もいる。複数のトピックを 扱うドキュメントがあり、多くの意味を持つ言葉や、多くの言葉で表される意味もあ る。現実世界では相互排他的な分類同士が混同されているために、われわれは気がつ くといつでも、何かを分類するために既存のどのカテゴリが最適かについて議論した り、それに完璧にマッチする新しいカテゴリを定義したりしているのだ。統合論者 (lumper)と細分論者(splitter)は過去数世紀に渡り、リンネ式動植物分類法をめ クラス サブクラス サブクラス 図 6-4 単純なタクソノミー

(4)

ぐって論争を繰り返している† さてわれわれIA は、デジタル情報システムの柔軟性に助けられながら、現実に適応 するべく戦略を練り直してきた。今では、統制された「多重階層構造(ポリヒエラル キー)」も容認している。これは図 6-5 のように、オブジェクトやクラスの一定の集合 を複数のカテゴリで相互参照することを可能にするものだ。 また、既存のデータ集合の中でオブジェクトを記述するために複数のフィールドま たは「ファセット(面)」を用いる、図 6-6 のような「ファセット分類」を採用してい る。1930 年代にインドの図書館学者 S.R. Ranganathan が初めて定義したファセット † 原注:統合論者は、おおよそ類似している項目を同一のカテゴリに位置付ける。細分論者は、 それらの差異に適応すべく新たなカテゴリを作ることを主張する。さらに詳しい解説は、以下 の Wikipedia の『Lumpers and Splitters』のページを参照のこと(http://en.wikipedia. org/wiki/Lumpers_and_splitters)。 単一のタクソノミー ファセット分類 色による分類 価格による分類 ブランドによる分類 タイトルによる分類 主題による分類 著者名による分類 図 6-6 単一の階層構造 vs.多数の(ファセット分類による)階層構造 疾患 気道疾患 ウイルス性疾患 ウイルス性肺炎 図 6-5 医学文献データベースにおける多重階層構造

(5)

分類は、オブジェクトが多数の場所に同時に存在しうるデジタルの領域において特に 重宝されてきた。ウェブ上でユーザやそのタスクごとに異なるナビゲーション方法に対 応するには、この関係性重視のアプローチが頼りになる。コンテンツを相互排他的な 入れものに分けて詰め込むよりも、構造的かつ意味的なメタデータを適用する手法を 選んでいるのだ。 そしてわれわれIA は、言語の曖昧さに対処するために「統制語彙」を開発している。 人気語についてはその類義語(検索目的で同じ意味を持つ別の用語)を扱うために等 価関係を定義し、階層関係にこだわらない(クロスセルやアップセル†促進のために よく使われる)「関連商品」リンクの生成に役立つ連想関係を定義して、図 6-7 のよ うな構造を作り出している。 最後になるが、われわれはIA として、これらの構造を設計することで実現できるの はファインダビリティだけではないことを認識している。分類システムはユーザの理解

カモノハシのパラドックス

1799年、大英博物館の自然史課に、オーストラリアのジョン・ハンター大尉から奇妙な動物 の標本が届いた。科学的な分類学者たちは当初これを、器用なアジアの剥製師が彼らに一杯食 わせるつもりで、アヒルのくちばしをモグラの毛皮に縫いつけたものだと思い込んだ。この毛 皮に覆われた、温血の、鳥類と爬虫類の特徴を兼ね備えた生物は、長い間博物学者たちを混乱 させた。1836年になり、ビーグル号に乗ってオーストラリアを訪れたチャールズ・ダーウィ ンによる観測が、カモノハシを進化論者と創造論者との激しい論争の渦中に投げ込んだ。最終 的にカモノハシは、現存する4種の単孔類の一種であり、胎生ではなく卵生である唯一の哺乳 類として、分類学上の居場所を得た。興味深いことに、半水生のカモノハシはまた、電気を感 知できる感覚器官を持つ数少ない哺乳類の一種でもある。獲物となる生物の生体電気を検知し てその居場所を知るのである。 も ち ろ ん 現 地 オ ー ス ト ラ リ ア の ア ボ リ ジ ニ の 人 々 は 、 こ の キ メ ラ の よ う な 生 物 に 、 「mallangong」「boondaburra」「tambreet」といった異なる名称を付けている。そしてアボ

リジニが用いるディルバル語では、カモノハシは“Balan”と呼ばれる第2のカテゴリに属し ている。このカテゴリには他に、女性、オニネズミ、犬、エキドナ、ある種の蛇、ほとんどの 鳥類、ホタル、サソリ、コオロギ、毛虫のような幼虫、水や火に関するすべての物、ある種の 樹木などが含まれる。

― ジョージ・レイコフ著『Women, Fire, and Dangerous Things』、 University of Chicago Press.

† 訳注:クロスセルは購入者に別の関連商品を販売する手法であり、アップセルは購入者により 上位のまたは付加価値の高い商品を販売する手法である。

(6)

を促進し、対象物のアイデンティティに影響を及ぼし、権威を主張するものでもある。 製品の分類や、ブランドの様式や、企業内特有の語彙は、図 6-8 の例のようにその企 業の戦略や競争優位性と密接に結び付いている。そして特定の世界観を推し進めるも のであるがゆえに、あらゆる主題別分類は本来政治的なものである。そのすべてが図 狭義語 関連語 関連語 変異語 変異語 広義語 階層関係 等価関係 人気語 連想関係 ミノルタ dimage デジタル ビデオカメラ カメラ付き 携帯電話 デジタルカメラ デジタル 一眼レフカメラ カメラと電話 デジタルカメラ 図 6-7 シソーラスの用語および関係 図 6-8 Forrester Research 社のファセット分類

(7)

6-9の例のごとく、一目瞭然で面白おかしいものであるわけではないとしても。 ジョージ・レイコフが論じているように、「人間がその思考や知覚、行動、発話をカ テゴリ分類することほど、基本的な行為はない」のである。セマンティックウェブの可 能性を探るに当たっては、メタデータの歴史に秘められた、タクソノミーにまつわるこ れらの教訓をおろそかにしてはならない。

オントロジー

しかし私は、デジタルなオブジェクトやコンピュータ、そしてインターネットを中心 に据える新鮮なアプローチには価値がないと言いたいわけではない。結局のところ、 1974年に初めて公開されたZ39.19†のような統制語彙の標準というものは、旧世代の 遺物をビットの時代に持ち越してしまう事態を招いているのだ。それと対照的に、セ マンティックウェブの各種標準は初めからデジタル技術向けに用意されており、コー 図 6-9 Harpers Magazine の主題別分類(このサイトのタクソノミー作成に関する事情は、 以下のPaul Ford の記事『A New Website for Harper's Magazine』で知ることがで きる。http://www.ftrain.com/AWebSiteForHarpers.html)

† 『単一言語統制語彙の構築・フォーマット・管理のためのガイドライン(Guidelines for the Construction, Format, and Management of Monolingual Controlled Vocabularies)』のこと。 以下の URL で公開されている(http://www.niso.org/standards/resources/Z39-19.html)。

(8)

ドやネットワークを深く理解している開発者たちによって作り出されている。そして彼 らはその名誉にかけて、最初の一歩を踏み出す時から、タクソノミーが持つミッショ ンクリティカルな性質を認識していたのだ。言うまでもなく、古典的な階層構造モデ ルをビットの世界で適用するには限度がありすぎたので、彼らはオントロジーという付 加価値モデルを支持することを決めた。 哲学上は、オントロジーとは存在の本質、存在する物の種類の性質についての理論 である……人工知能やウェブの研究者が一致して、この用語を選び出した……もっ とも典型的なウェブ用オントロジーのほとんどは、タクソノミーと一連の推論ルール を備えている† 現在このモデルをもっとも分かりやすく応用している事例は、W3C が定めたメタ データの記述や交換のための標準であるリソース記述フレームワーク(RDF、 Resource Data Description)である。RDF で表現される情報の構造は、主語、述語、 目的語で構成されるトリプル(三つ組)要素の集合となっている。これらは、あるモノ が一定の値を持つ属性を備えていることを断定するために利用される。これらのトリプ ル要素は、XMLのタグによって定義される。URI(Uniform Resource Identifier)に よって各定義が識別できるので、その定義は世界でただ1つのものとなり、広範なアク セスが可能になる。図 6-10 に示すこのトリプルストレージモデルは、エンティティ†† およびエンティティ同士の関係を定義するための、パワフルかつ柔軟な方法を与えて くれる。 たとえば、公式な階層関係は以下のように定義できる。 主語 述語 目的語 カモノハシ は∼に属する 単孔目 † Berners-Lee、http://sciam.com. †† 訳注:一単位として扱われるデータの集合のこと。 主語 述語 目的語 図 6-10 トリプル要素によるRDF グラフのデータモデル

(9)

しかしそこで即座に、等価関係や連想関係も容易に定義できる。 主語 述語 目的語 カモノハシ は∼と同義である Boondaburra† カモノハシ は∼と関連している エキドナ†† 実際、このモデルを用いれば、伝統的なシソーラスでおなじみの連想関係の先まで 進むことができる。トリプル要素によって、分類された関係の無限配列を作ることが できるのだ。この点がXML とRDF の、エキサイティングな特質である。タクソノミー や統制語彙、ファセット分類、豊かな意味体系上の関係性への対応が、インフラに組 み込まれているのだ。それはIA にとっては夢のような話である。さらにうれしいこと には、その明示的な達成目標にはファインダビリティの実現も含まれているのだ。 ティム・バーナーズ・リーの説明によれば、オントロジーは「ウェブ検索の精度を高 めるために利用できる。つまり検索プログラムが、あいまいなキーワードを含むすべて のページを見に行く代わりに、正確に一致する概念を参照しているページのみを検索 範囲とすることができる‡」のである。そしてXML 仕様の共同策定者であるティム・ ブレイは、メタデータをRDF にエンコードすることを「モノを見つけるための正しい 方法」‡‡であると位置付けている。 図書館学者たちは即座にRDF の価値を理解した。1995 年、オハイオ州ダブリンに て、オンラインコンピュータ図書館センター(OCLC)が米国立スーパーコンピュータ 応用研究所(NCSA)との合同ワークショップを開催し、ウェブでの情報の検索、取 得を改善するために意味論的なメタデータをどのように利用すべきかを話し合った。こ れらの議論が結果的に、ダブリン・コア・メタデータ標準の作成につながった。これは、 ネットワーク上のリソースを記述するシンプルな要素セットを定義するものである* † 訳注:アボリジニの間で使われる、カモノハシを意味する用語。 †† 訳注:ハリモグラとも呼ばれる動物で、カモノハシと同じ単孔目に属するとされる。 ‡ Berners-Lee、http://sciam.com.

‡‡ Tim Bray の記事『What is RDF?』より。以下の URL で公開されている(http://www. xml.com/lpt/a/2001/01/24/rdf.html)

* 原注:ダブリン・コアの 16 個の要素は、タイトル(Title)、著者あるいは作者(Creator)、主 題(Subject)、内容記述(Description)、公開者あるいは出版者(Publisher)、寄与者 (Contributor)、日付(Date)、資源タイプ(Type)、形式(Format)、資源識別子(Identifier)、

情報源(Source)、言語(Language)、関係(Relation)、対象範囲(Coverage)、権利管理 (Rights)、資源利用者(Audience)である。詳しくは、http://dublincore.org/を参照の

(10)

このメタデータのスキーマはHTML、XML、RDF にエンコード可能であり、図 6-11 のように、トリプルストレージモデルに完璧にフィットする。 要するにわれわれは、シンプルかつ拡張性を備え、多分野に渡って広く適用できる よう綿密に作り上げられた、堅牢なXML のインフラとメタデータ標準を手に入れたの だ。これはアプリケーションの構築や語彙の強化の基盤となる、見事な礎である。そ れならなぜ、セマンティックウェブや、RDF やダブリン・コアが、まだ世界を変革す るに至っていないのか? なぜそれらが、あらゆるウェブ関連プロジェクトに不可欠な 要素となっていないのか? まだ何か満たされない要望が残っている気がするのは、 なぜなのか? その理由としては、RDF 構文の複雑さが災いしたのだと言う人もいれば、創成期の エバンジェリストたちの高尚すぎるビジョンのせいだと批判する人もいる。また、セマ ンティックウェブ支持者たちの視野について、彼らは人間と機械、あるいは人間同士 のインタラクションよりも、機械と機械のインタラクションばかりに目を向けていると いう誤解が広く流布してしまったせいだという意見もある。これらの主張はどれも一 理ある上に、まださらに広く深くさまざまな理由付けが存在している。 第 1 の理由として、大部分の情報システムでは、構造的メタデータと統制語彙の適 用を許していない。人間が情報を整理するためのおもな原則は、積み重ねとファイリ ング(綴じ込み)という行為によって典型的に示される。人間はいろいろなものを机 やテーブルや床の上に積み上げ、新着順に並んだ一次元のグラフを作る。そして、類 似性によってアトムやビットで例示される単純なタクソノミーに従い、それらをキャビ ネットやフォルダやディレクトリにファイリングする。事実いまだに、世界最大規模の 企業ウェブサイトの多くが、おもにバケツを入れ子にしたような原始的な階層構造モ デルに基づいて作られているのだ。これからも世界の大部分では、セマンティックウェ ブを実現する準備が整うことはないだろう。そしてわれわれはいまだに、それ以外の場 所にいる少数派が追いつくのを待っている状態なのだ。 ユリシーズ ジェイムズ・ジョイス DC.Creator(著者) ユリシーズ テキスト DC.Type(データの種類) ユリシーズ ランダムハウス DC.Publisher(出版者) 図 6-11 RDF のトリプル要素に対応するダブリン・コア要素

(11)

第 2 の理由としては、第 1 の説明とも密接に関係しているが、共有可能な分類シス テムの設計は驚くほど複雑で、面倒で、コストがかさむという点が挙げられる。こう した意味で、セマンティックウェブの設計者たちが「オントロジー」という用語を選 んだのは適切だったと言える。この用語は哲学上、実在の本質や、実存の基本的カテ ゴリについて研究する形而上学の一部門のことを指す。存在するということは何を意 味するのか? モノとは何か? どんな属性が核になっているのか? 知識表現につ いてのこの新たなビジョンは、ソクラテス、プラトン、アリストテレスによる古典的理 論をルーツとしている。クレイ・シャーキーの激しい批判を招いたのは、この演繹法 と三段論法という過去の遺産であった。しかし哲学者ウィトゲンシュタインが論じた ように、上記のような存在論上の課題の根本的原因は、意味論だけではなく、分類と いう行為の土台となる論理にもあるのだ。 たとえば、われわれがゲームと呼ぶ行為について考えてみよう。つまりボードゲーム、 カードゲーム、球技、オリンピックの試合、などのことである。それらすべてに共通 する点は何か?† ウィトゲンシュタインはこのシンプルな設問によって、ルールに基づく定義の錯誤を 明らかにし、レイコフの『Women, Fire, and Dangerous Things』で端的に示されて いる、現代的なプロトタイプ理論の表現へとわれわれを導く。要するに、人間が日常 生活で用いるほとんどのカテゴリは、客観的なルールというより、あいまいな認知モデ ルによって定義されているのだ。家族の構成メンバー同士は何ら共通の属性を持って いなくても、容貌の類似性という特質によって関連付けることができるだろう。必然 的に、メンバー性には程度の差と求心性が生まれる。メンバーのランクを備えるカテ ゴリがあったり、他のメンバーより代表的なサンプルとなるメンバーがいたりするのだ。 レイコフが証明したように、人間がカテゴリ分類をする方法は言語と文化に根ざして いる。実を言えば彼の著書のタイトルも、オーストラリアのアボリジニが用いるディル バル語に触発されたものだ。その言語には「Balan」というカテゴリがあり、そこには 女性や火、危険なものが含まれる。また、危険ではない鳥や、カモノハシ、オニネズ ミ、エキドナのような珍しい動物もそこに含まれる。ハイテク用の語彙の場合、その ローカライゼーションを行うには、翻訳と合わせて分類も必須となるのだ。 さらに、タクソノミーとオントロジーの設計は本来、政治的かつ道徳的なものであ る。Geoffrey BowkerとSusan Leigh Starは『Sorting Things Out』でこう説明する。 † Ludwig Wittgenstein著『Philosophical Investigations』、Macmillan.

(12)

それぞれの標準、それぞれのカテゴリは、ある何らかの観点について価値を設定し、 それ以外を封じるものである。これは本来、悪いことではない―まったくもって不 可避な事態である。しかしそれは道義的な選択であり、それ自体危険なことなのだ。 悪くはないが危険なのである† 情報の集合にラベルを付け、整理する方法は数多くある。台湾は国家か? トマト は野菜か? テロリストと自由の闘士の境界線はどこにあるのか? シラー、メル ロー、ピノ・ノワールの微妙な違いが本当に重要なのか? どれもただの赤ワイン じゃないのか? その答えは、質問の相手次第で決まる。グループ分類や粒度 (granularity)††がこのように複雑化せずに済んでいる領域は、非常にわずかしか残っ ていない。機械は互いに精密な会話を交わすかもしれないが、機械に語彙を与え、最 終的に価値判断を行わねばならないのはあくまで人間である。ウェブは詰まるところ、 セマンティックであろうとなかろうと、人間の共同作業のためにあるのだ。市場は対 話である。ハイパーリンクは階層関係をくつがえす。ウェブは生き物だ。あるいは少 なくともそれは、ブロゴスフィア‡の周辺でざわめくソーシャルソフトウェアマニアの 群れから、いずれ伝え聞くことになる物語なのである。

フォークソノミー

集団による索引生成は、ソーシャルソフトウェアを満たしているエーテル(媒介物 質)の中から現れてきた。そこで、フォークソノミーの話題に入る前に、まずこの広 範囲な社会工学的現象について調べておくべきだろう。複数の人間が協調行動のため にコンピュータを用いるという概念は、1945 年のヴァネヴァー・ブッシュによる memexの発想にまで起源をたどることができる。memex を用いれば、ユーザがハイ パーテキスト上の「足跡」を共有できるとされた‡‡。この概念はその後数十年に渡っ て苦難の道を乗り越え、1980 年代になってやっと、ユーザの共同作業を支援するグ ループウェアやコンピュータの御旗の下で日の目を浴びることとなった。「ソーシャル ソフトウェア」という用語は、1987 年のハイパーテキスト会議において、ナノテクノ ロジの先駆者 K ・エリック・ドレクスラーによって初めて用いられた。

† Geoffrey C. Bowker、Susan Leigh Star 著『Sorting Things Out: Classification and its Consequences』、MIT Press.

†† 訳注:処理の細分化または要約の単位のこと。

‡ 訳注:ブログを作成するユーザによって形成される情報空間のこと。ブログ圏とも呼ばれる。 ‡‡ Christopher Allen の記事『Tracing the Evolution of Social Software』。以下の URL で公開さ

(13)

(自分で選択した判断基準に基づいて)ユーザが自動的に一部のリンクを表示しその 他を隠すことができるシステムとは、フィルタリングされたハイパーテキストである。 これは、将来フィルタリングを行うための判断基準を示す投票や評価のスキームを 含む、「ソーシャルソフトウェア」とでも呼ぶべきシステムへの対応を暗に意味して いる……ハイパーテキストベースのソーシャルソフトウェアの可能性は広範囲に渡る と思われる† しかしこの用語は、2002 年になるまで一般的に使われてはいなかった。それが一挙 に普及したきっかけは、我らの友クレイ・シャーキーが主催した「ソーシャルソフト ウェアサミット」であった。それに続いて彼は、『Social Software and the Politics of Groups』と題された秀逸な論文において、彼自身によるソーシャルソフトウェアの定 義を披露した。 ソーシャルソフトウェアは、集団のコミュニケーションを支援するソフトウェアであ り、メールのCC 欄からEverQuest のような壮大な3D ゲームの世界に至るまでのあ らゆる要素を含んでおり、チャットルームのように特定の方向性を持たないものに もなるし、Wiki(協調的ワークスペース)のようにタスク志向のものにもなり得る。 集団内のインタラクションには非常に多くのパターンがあるので、ソーシャルソフト ウェアはグループウェアやオンラインコミュニティのようなシステムよりはるかに大 きなカテゴリである……この巨大なカテゴリ内での数少ない共通項の1 つは、ブロー ドキャストやパーソナルコミュニケーションのためのソフトウェアがインターネット 上でユニークではないとすれば、ソーシャルソフトウェアはその意味ではユニークで ある、という点だ†† ソーシャルソフトウェアの普及を促した功労者はクレイに違いないが、それに呼応 する成果の数々が途方もなく集中的に現れたことで、新たな段階への移行は避けられ なくなった。ブログ記事、コメント、トラックバック、リファラのログ、被リンク数、 ページランクや、Daypop、Slashdot、Technorati、Ryze、Friendster、LinkedIn、 Wikipediaといったサイトなど、パーソナルパブリッシングやインタラクション、ソー シャルフィードバック、会話の発見、風評コントロールのための軽量なツールの数々 が生み出す驚くほどの資産が、またたく間に現れた。異論のあるところだが、われわ れはかつてUsenet やWELL などのコミュニティで、この類の仕組みをすでに目にして いた。しかし今世紀の幕開けにおいて、ウェブ上のソーシャルソフトウェアの真の規模 † Christopher Allenの『Tracing the Evolution of Social Software』で引用された。

†† Clay Shirky 著『Social Software and the Politics of Groups』より。以下の URL で公開されて いる(http://www.shirky.com/writings/group_politics.html)。

(14)

とそれが新たに生み出す豊かさは、おなじみの臨界点を超えたその先の世界へとユー ザを旅立たせてくれる。デビッド・ワインバーガーのブログで、ある読者はこうコメン トしている。 変化はソフトウェアの中で起こっているのではなく、ユーザの頭の中で起こっている のです。やがては、ガラス瓶の中に木造の船を作るのが好きな青年が、世の中には 自分以外にも同じ愛好家が山のようにいて、中には自分と同じ町に住んでいる人も いることに気づくでしょう† 社会的ネットワークとIT が交わる地点では、非常に大きな興奮と盛んな活動が沸き 起こっている。数百万人のブロガーが、評価経済(reputation economy)で用いる 「karma」や「whuffie」††などの代用貨幣と引き換えに、ミームの交換を行っている。 われわれが授業中や会議中に、Wi-Fi 対応の内緒話コミュニケーションを試している ように、新手の談話形態が出現しつつある。del.icio.us のソーシャルブックマークや Flickrの画像共有タグなど、新たな遊び道具やツールが暴動のごとき勢いで続々と浮 上している。フォークソノミーが現れたのは、ソーシャルソフトウェアの縦糸と横糸が 織り成すこのような状況の真っ只中であった。情報アーキテクチャに関するメーリン グリストにおいてGene Smith が、情報を体系化し共有するためにユーザ定義によるラ ベルやタグがますます頻繁に使われつつあることを指摘し、「この類いの非公式かつ社 会的な分類体系を指す用語はあるだろうか?」と問いかけたのだが、一通り意見が出 たところでThomas Vander Wal が以下のような返答をしたのである。

では、新たに生み出されるシソーラスによってユーザが作り出すボトムアップ型のカ テゴリ構造が発展すると、「フォークソノミー」になるのだろうか?‡

こうして、フォーク(人々)とタクソノミーを合体させた新たな用語が慎ましやか に、1 つの問題提起を伴って誕生したのだ。しかしこの用語はブロゴスフィアの世界に 入っていく際に、そのつつましい起源から遠ざかってDavid Sifry によるTechnorati 革 命の魅力を追い求めながら、独自の生命力を帯びていった。

† 「Joho the Blog」での David Weinberger の投稿『Why Social Software Now?』に対する、 Michael Pusateri(http://cruftbox.com/)のコメント。以下の URL で読むことができる (http://www.hyperorg.com/blogger/mtarchive/001451.html)。

†† 訳注:コミュニティサイト「Slashdot」やオンラインゲーム「Clan Load」などで使用される ユーザ評価の単位。

‡ 2004年 7 月 24 日に、情報アーキテクチャ研究所(IAI)の会員制メーリングリストに投稿され た。

(15)

タグは単純でありながらパワフルな、ソーシャルソフトウェアにおける革新である。 今では数百万人のユーザが、コンテンツや掲示板のスレッドに、自由かつオープン にメタデータを割り当てている。ユーザが敬遠する厳格なタクソノミーのスキームと 異なり、社会的なインセンティブに基づいて個人用の情報の整理に用いるタグ定義 の手軽さは、情報が豊富で探しやすいフォークソノミーの誕生につながる。知的情 報は、社会的な発見の助けとなるために、現実の人間からボトムアップ方式で供給 される。そして適切なタグの検索とナビゲーションが可能であれば、フォークソノ ミーは、それより構造化された分類アプローチよりも優れた成果を挙げる† さらに悪いことに、恩知らずな腕白息子のようなこの用語は、両親に対するあから さまな反抗という形でクレイ・シャーキーと手を組んだのだ。ルイス・ローゼンフェル ドとの討論において、シャーキーはこう論じている。 フォークソノミーの強みは、統制語彙より優れているということではない。タグ付け が必要な事例のほとんどについて、統制語彙ではカバーし切れないので、せめて フォークソノミーがあれば何もないよりはましだというだけなのである……これは、 「満足に設計されたメタデータ」の支持者たちが理解していない重要なポイントであ る……大規模システムで厳密なタグ定義を行うコストは非常に負担となるので、 Flickrのような環境で統制されたメタデータを用いたらどうかという発想は、ユーザ が突如として情報アーキテクチャのしもべになろうと決意してくれるのではないかと 夢想するに等しい、まさに絵空事でしかない†† なんともはや、彼はまずセマンティックウェブを酷評し、次に情報アーキテクチャを 冒涜している。ソーシャルソフトウェアの伝道者たちにとっては、クレイはやや「アン チソーシャル」な印象を与えてしまっているのだ。境界オブジェクトを戦争の道具と して使うのはルール違反だと、誰かが彼に忠告したほうがよさそうだ。 とにかく、この自由なタグ定義の話に戻ろう。その呼び方は、集団的索引生成でも、 協調的カテゴリ作成でも、民族的分類でも、何でもお望みのものでかまわない。中核 をなすアイデアは単純だ。ユーザがオブジェクトにタグを付けるのである。その際、図 6-12のように複数のタグを付けるという選択肢もある。

† David Sifryのブログに 2005 年 1 月 17 日に投稿された記事『Technorati Launches Tags』。彼は Technoratiの創立者かつ CEO であり、自らいわく「ブログ界の最新事情に関する権威」でも ある。

†† 『Folksonomies + Controlled Vocabularies』。以下の URL で公開されている(http://www. corante.com/many/archives/2005/01/07/folksonomies_controlled_vocabular ies.php)。

(16)

タグは共有され、社会的ナビゲーションの軸となる。ユーザはオブジェクトやタグ や、著者や索引作成者の間を、流動的に行き来できる。やがて多くのユーザが1 つの オブジェクトに異なるタグを付けたり、異なるオブジェクトに同じタグを付けたりする と、事態は面白くなってくる。例を挙げてみよう。

インフォメーションアーキテクトであるJesse James Garrett は、『Ajax: A New Approach to Web Applications』†と題したエッセイを書いたが、その2 か月後には図 6-13のように、del.icio.us で1,646 人のユーザがこのページをブックマークしていた。 この事実は何よりもまず、それがかなり人気のあるエッセイだということを示して いる。 オブジェクト タグ タグ 図 6-12 1 つのオブジェクトに付けられた複数のタグ

† Jesse James Garrett 著『Ajax: A New Approach to Web Applications』。以下の URL で公開さ れている(http://www.adaptivepath.com/publications/essays/archives/ 000385.php)。

(17)

しかしもっと重要なのは、そのエッセイについて誰がどんなタグを付けたかが分かる ことである。そしてそれらのリンクをたどれば、これらの話題についてより多くの情報 や、その背後にいるユーザたちを発見できるのだ。つまりウェブ開発やプログラミン グ、XML、RIA、Javascript、Flash などについての他の記事を見つけることができ、 さらには図 6-14 の一番下の例のように、他のどのユーザがこの記事を「後で読む (read later)」つもりかなどということまで分かってしまうのだ。そしてもちろん、 Ajaxに興味を持っている他のユーザを発見することもできる。ある意味でオブジェク トが、新たに芽生えるコミュニティの種子として機能するのだ。 同様にして、「ajax」というキーワードをタグとして付加されている記事やオブジェ クトの一覧を見ることもできる。これは図 6-15 のように、時にはかなり異なる観点か ら同じ話題について議論しているユーザを見つけるのにも役立つ。 こうしてタグは図 6-16 のように、本質的には異なるオブジェクトの集合を縫い合わ せる糸の役割を果たし、ボトムアップ方式で定義される創発的なカテゴリ体系、すな わちフォークソノミーを作り出す。そしてその素晴らしい点は、ライブラリアンやオン トロジストその他の「満足に設計されたメタデータの支持者たち」が、トップダウン 方式の階層構造を押し付けてくることに対価を払わずに(またはそれを待たずに)済 んだことである。 フォークソノミーは豊穣なコモンズ(共有地、共有知)の中で、著しいコストをか けることなく繁栄する。それらは、セレンディピティ(掘り出し物を発見できること) 図 6-14 del.icio.us におけるJesse のエッセイへのリンク

(18)

という素晴らしい要素をウェブのナビゲーションに盛り込み、ユーザの興味や行動の 主要な指標として役立っている。人気のタグは広がりつつあるミームの存在を示唆し、 1枚の写真が無数の言葉を語ることにもなる。ここ最近は誰もが、Flickr で茶葉占い† をしているようなのだ†† オントロジーとタクソノミーのことはもう忘れよう。フォークソノミーこそ未来なの だ。デビッド・ワインバーガーが表現したように、「旧来の手法は樹木を育てそうとす るが、新たな手法は落ち葉をかき集める」のである。そして私はデビッドに同意せざ るを得ない。このメタファーは完璧なのだ。なぜならわれわれは、毎年秋に踏みしめる 美しい枯葉の山がどんな運命をたどるかを知っているからである。それらは腐敗する。 そして土に帰り、樹木の養分となり、結果としてさまざまな樹木が多様な形と大きさ 図 6-15 「ajax」というキーワードでタグ付けされたオブジェクト † 訳注:茶を淹れた時の茶葉の開き具合を見て未来を予想する占い。「木」と「葉」の関係は、 タクソノミーとフォークソノミーの関係を表すメタファーである。

†† Matt Jones のブログ記事を参照(http://www.blackbeltjones.com/work/?p=1174)。

オブジェクト

タグ

(19)

に成長し、大いなる価値をもたらし、非常に長期間に渡って生き続けることになる。 フォークソノミーは、Technorati が「World Live WebTMと呼ぶウェブの世界で ユーザがネットサーフィンする際に非常に役立つ。トレンドを発見したり、欲望の ルートを明らかにしたりするための、新たな驚くべきツールである。そして自分が見つ けたものを見失わないようにしておくために、フォークソノミーを個人用ブックマーク のツールとして利用するのも悪くはない。しかしファインダビリティの尺度からフォー クソノミーを考えると、それは等価関係や階層関係などの意味論上の関係性を扱えな いために、ある程度規模が大きくなると惨めな失敗を引き起こしてしまう。もしどう しても新旧の手法のどちらか1 つだけを選ばなくてはならないとすれば、私は絶対に、 (図 6-17 のような)つかの間の人気を呼ぶ葉の数々よりも、古来の知識の樹木のほう を選ぶだろう。 しかしそれこそが、われわれがメタデータと呼ぶ境界オブジェクトに備わっている美 † 訳注: Technorati のコンセプトに関わる、リアルタイムに非常に高頻度で更新されるウェブの 世界を表現する用語。 図 6-17 Flickr での葉の写真の一覧

(20)

徳なのである。どちらか一方だけを選ぶ必要はないのだ。オントロジー、タクソノミー、 フォークソノミーは相互排他的なものではない。企業ウェブサイトのような多くの利用 背景においては、オントロジーとタクソノミーによる公式な構造を定義することに投資 するだけの値打ちがある。それ以外の、たとえばブロゴスフィアのような環境では、 フォークソノミーによる非公式なセレンディピティがあれば、何もないよりはありがた いのは間違いない。そしてまた、イントラネットや知識ネットワークなどの場合には、 両方の要素を組み合わせたハイブリッドなメタデータ環境を作るのが理想的だろう。

この潜在的なシナジーは、「AND の才能」を超えてペースの多層化(pace layering) という概念にまで影響を及ぼしている。ペースの多層化とは、おそらく Stewart Brandによってもっとも明確に示された概念である。彼は著書『How Buildings Learn and The Clock of the Long Now』の中で、建築物やさらには社会全体が、図 6-18および図 6-19 のように、個々にユニークかつ適切な変化率を持つ複数の層から 成る構造体であるという考えを詳しく示した。 変化が遅い層は安定性をもたらす。変化が速い層は革新の原動力となる。各層の速 度の独立性は、自然かつ健全な進化の結果である。さもなければどんな結果を招くか 想像してみよう。政府活動と同じペースでしか商業活動が進まないとしたら? ソビ エト連邦の例を覚えているだろうか? 用地 無期限 構造 30 ∼300年 外装 20年 設備 7 ∼15年 空間設計 3 ∼30年 家具、内装など 1日∼1か月

図 6-18 建築物におけるペースの多層化(出典: Stewart Brand 著『How Buildings Learn』、 Penguin Books [1995])

(21)

私はかなりの間、このペースの多層化という概念が、ウェブデザインというもっと狭 い領域で大きな成果を約束するものだろうと信じていた。このメタデータをめぐる議論 においては、統合的アーキテクチャがもたらす可能性はおのずと明らかである。セマン ティックウェブに関するツールや各種標準は、パワフルで耐久性のある基盤を作り出 す。タクソノミーとオントロジーは、インターフェースをインフラ構造に結び付ける堅 牢な意味体系のネットワークを提供する。そしてそれらの上層に、変化が速く流行的 なフォークソノミーが――柔軟で融通が利き、ユーザのフィードバックに即座に反応 できる分類体系が――位置するのだ。 そして時間の経過とともに、最上層で得られた教訓は下層へと受け渡され、より耐 久性の高い社会的かつ意味論的なインフラ構造の層へと埋め込まれていく。これが、 ファインダビリティとソシオセマンティック(社会意味論的)なナビゲーションの未来 像であり、それは人間とコンテンツとメタデータとの未知なるつながりの上で、言語と コードが織り成す豊かなつづれ織りにもたとえられる。

ネットワーク

ネットワークは、リンクによって接続されたノード群で構成されている。橋でつな がっている島々、通商ルートで結び付いている市場、電話回線で接続しているコン ピュータ、軸索で結節している神経細胞、関係性によって結ばれている人間たちなど がその例だ。図 6-20 は、極めてシンプルなネットワークである。ネットワークは人間 の生活において非常に重要な役割を果たす。人がどこへ行くのか、何を見つけるのか ファッションと芸術 商業活動 インフラ 政府活動 文化 自然 遅い 速い

図 6-19 社会におけるペースの多層化(出典: Stewart Brand 著『The Clock of the Long Now』、Basic Books [2000])

(22)

を左右するのだ。これは意味論的ネットワークと社会的ネットワークをつないでおり、 社会的ネットワーク分析の未開の地でわれわれにファインダビリティに関する洞察を 追い求めさせている、見えない糸である。 人と人とのインタラクションを研究してみると、ファインダビリティ的観点から見て 興味深いパターンが見出せることが多い。たとえば図 6-21 の例では、以下の3 種類の 尺度を測ることができる。 活動性(activity) Susanは他のノードへの直接リンクを6 個持つ「コネクタ」である。彼女は密接 につながり合った群集あるいは実践的コミュニティの中心に位置している。 媒介性(betweenness) Claudiaは3 人としかつながっていないが、異なるグループ同士をつなぐ唯一の 「バウンダリースパナー」として重要なポジションを占めている。 近接性(closeness) SarahとSteven は、他の全員に対して最短のルートを持っている。彼らは集団 全体の中で何が起こっているかを見渡すのに有利な立場にいる。 これらの尺度は個人、組織、企業のいずれのレベルでも適用可能である。またこれ らは、トポロジ最適化のためにコンピュータネットワークに適用したり、ファインダビ リティ改善のために情報システムに適用することもできる。なぜなら、上記の例で言 う「バウンダリースパナー」はたちまち、図書館やGoogle 検索で探し出せるドキュメ ントになることがあるからだ。ノードは人でもコンテンツでもかまわないし、終端とし ても経路としても、データとしてもメタデータとしても機能し得る。記事や書籍やブ ログは単に目的地であるだけではない。時にそれらは、ユーザを著者に引き寄せる逆 引き参照としても機能するからである。何かを書くということは、ただその内容を伝 達するためだけではなく、自分個人のファインダビリティを強化するためでもあるの だ。 ノード ノード リンク 図 6-20 単純なグラフまたはネットワーク

(23)

社会的ネットワークにおけるもう1 つの興味深いパターンは、“6 次の隔たり”とい うフレーズでよく知られている「狭い世界」†現象である。そしてこの意味では、ウェ ブもまた狭い世界である。公開されている索引化可能な8 億ノードから成るウェブを評 価した1998 年の調査研究では、「すべてのドキュメントは互いに、わずか平均 19 ク リック分しか離れていない」††という結果が示された。しかしながら、アルバート= ラ ズロ・バラバシはこう反論する。 「六次の隔たり」であれ「十九次の隔たり」であれ、この表現は大きな誤解を招きや すい。「小さな世界」の中では、欲しいものは簡単に見つかるかのような印象を与え るからだ。しかし現実はそれとはほど遠い。目的の人物ないしドキュメントまでの距 離が六次や十九次ではないばかりか、どの人物への距離も、どのドキュメントへの 距離もそうではないからである‡ バラバシの計算によれば、1 ドキュメント当たりの確認時間をわずか1 秒としても、 19クリック分離れたすべてのドキュメントを見つけるのには3 億年以上かかることにな Fred Susan David Claire Tom Sarah Steven

Claudia Ben Jennifer

図 6-21 凧 型 ネットワークの図 解 ( 出 典 : 本 書 の著 者 Peter Morville の論 文 『 Social Network Analysis』、http://semanticstudios.com/publications/seman

tics/000006.php)

† 訳注:社会心理学者ミルグラムの実験によって提示された概念。スモールワールド問題とも呼 ばれる。

†† Albert-Laszlo Barabasi 著『Linked: The New Science of Networks』、Perseus.

日本語訳:アルバート = ラズロ・バラバシ著『新ネットワーク思考―世界のしくみを読み解く』 (青木薫訳、NHK 出版)より。

(24)

る。狭い世界がファインダビリティの問題を解決するわけではないのだ。べき法則を 理解すれば、もっと多くの洞察を得られる。ジップ分布†を覚えているだろうか? 人間社会やインターネットのような自己組織的なネットワークでは、多数の小さなイ ベントが、少数の大規模なイベントと共存している。ウェブ上では、少数の主要なハ ブに対して膨大な量のインバウンドリンクが設置されている一方、大多数のウェブサ イトは、人気度を反映するGoogle のページランクのようなアルゴリズムに照らすとか ろうじて視界に入るかどうかという状態なのである。もちろん、ロングテールの中の僻 地に追いやられているのはサイトだけではない。ここは検索キーワードの多くが同様に くすぶっている場所でもある。ロングテールの中で需要と供給をリンクさせるのは、大 いなる挑戦でありチャンスでもあるのだ。Chris Anderson が指摘するように、平均的 なBarnes & Noble の店舗には10 万タイトルの在庫がある。しかしながらAmazon の 書籍売上げの4分の1から3分の1は、その売上げランキングの上位 10万タイトル“以 外”によるものなのだ††。これがマーケティングの専門家たちへの警鐘でないとしたら、 いったい何がそうだというのか。Amazon、eBay、Netflix、Googleはすべて、このロン グテールの尻尾の先にある無数のニッチを発掘することで利益を上げているのだ。 しかし彼らの成功は、ネットワーク上の不可視なノードの所有者や作成者にとって は、ごくわずかな慰めでしかない。たとえば、私に助けを求めてきたイタリア人の事業 家の例を挙げてみよう。彼はデザイン会社に制作費を支払って自社のウェブサイトを 作らせていたのだが、数か月後に、そのサイトを探し出すことができないのを発見し た。Google で会社名を正確に入力しても、自社サイトを検索できなかったのだ。その サイトは一見すると十分魅力的なのだが、中身をちょっと調べるとすぐに問題が見つ かった。デザイン上の調整のため、テキストが画像に加工されていたのだ。「望ましい こと」と引き換えに、ファインダビリティが犠牲になってしまったのである。 この単純な事例には重要な教訓が潜んでいる。ウェブの世界では、旅の行程がいき なり目的地から始まることが少なくない。検索エンジンに入力されるユーザのキーワー ドは、ウェブサイト内のキーワードと結び付かねばならない。さもないと、サイトへ訪 問すらしてもらえないうちに旅が終わってしまう。こういうわけで、旅の終わりにたど り着く、ドキュメントと呼ばれるノードについては、もっと詳細に調べてみる価値があ るのだ。 † 訳注: 3 章参照。

†† Chris Anderson の 記 事 『 The Long Tail』。 以 下 の URL で 公 開 さ れ て い る ( http:// longtail.typepad.com/the_long_tail/2005/08/a_methodology_f.html)。

図 6-3 ブリューゲル作『バベルの塔』(Kunsthistorisches  Museum,  Wein  oder  KHM, WLEN)
図 6-13 del.icio.us で人気のあるリンク
図 6-16 1 つのタグを持つ複数のオブジェクト
図 6-18 建築物におけるペースの多層化(出典: Stewart Brand 著『How Buildings Learn』 、 Penguin Books [1995])
+3

参照

関連したドキュメント

砂質土に分類して表したものである 。粘性土、砂質土 とも両者の間にはよい相関があることが読みとれる。一 次式による回帰分析を行い,相関係数 R2

声、吠犬、吠狗といった語があるが、関係があるかも知れない。

「文字詞」の定義というわけにはゆかないとこ ろがあるわけである。いま,仮りに上記の如く

従って、こ こでは「嬉 しい」と「 楽しい」の 間にも差が あると考え られる。こ のような差 は語を区別 するために 決しておざ

ƒ ƒ (2) (2) 内在的性質< 内在的性質< KCN KCN である>は、他の である>は、他の

究機関で関係者の予想を遙かに上回るスピー ドで各大学で評価が行われ,それなりの成果

これらの定義でも分かるように, Impairment に関しては解剖学的または生理学的な異常 としてほぼ続一されているが, disability と

本論文での分析は、叙述関係の Subject であれば、 Predicate に対して分配される ことが可能というものである。そして o