amfd-06

(1)

メタデータの社会生活

伝統的に、司書や文書保管係といった人々は、メタデータという用語を「図書館や博物館の資料を索引化、整理、保存し、それらへのアクセスを改善するために用いられる記述的情報†_{」という意味で使ってきた。この用法の由来はギリシャ語の接頭辞} である「メタ」にあり、その意味は「∼と共に、∼の間に、∼の後に、∼の後ろに」などと解釈されている。こういった意味でメタデータは、データに付随するものではあるが、データ自体に不可欠なものではないといえる。古典的な例として挙げられるのは、カード目録である。これは、図書館内の資料の物理的なコレクションについて、書名別や著者名別、または主題別にアクセスできるようにするためのメタデータを採用している。カード目録の利用の歴史は、紀元前 650 年のアッシリア帝国の首都ニネベにまでさかのぼる。当時、アッシュールバニパル王が、大まかな主題別目録と記述的書誌を備えた3 万枚を超える粘土板を収蔵する、王宮図書館を設立したのである。もちろん広義の解釈では、メタデータは言語そのものと同じぐらい古い歴史を持つことになる。人や場所や所有物に名前を与える時、人間はそれらの対象物にメタデータによるタグ付けをしているというわけだ。図 6-2 のような図書館のカード目録は、メタデータの莫大なコレクションである。メタデータは多くの形式と目的を持つ。管理用のメタデータは、ドキュメント管理とワークフローの作成を助ける。構造的メタデータは、単一ソースによる情報公開と、柔軟なコンテンツ表示を可能にする。そして記述的メタデータは、その情報へのアクセスおよび利用を許可する。簡単に言うと、そのドキュメントが検索できるように、主題を記述する単語やフレーズをメタデータとして用いているのだ。将来的なファインダビリティ確保のために、そのドキュメントの「アバウトネス（何についての情報なのかということ）††_{」を簡潔に要約しておこうとするのである。} セマンティックウェブが用いるオントロジーから、ソーシャルソフトウェアが生み出すフォークソノミーにいたるまで、ユーザの興味関心の復興を駆り立ててきたのは、必要な情報を見つける手助けとなるメタデータの力である。互いに異なるソリューションを求めているにも関わらず、これら二派のコミュニティは似たような問題に直面してい

† A.J. Gilliland-Swetland著『Defining Metadata』。M. Baca との共著『Introduction to Metadata: Pathways to Digital Information』、Getty Information Institute.

†† 訳注：固定的な「意味」とは異なる情報の性質で、その情報を利用する目的、理由、意図などにより変化する主題概念のこと。

(2)

る。彼らは新しいツールを用いて、言語や表現や分類体系をめぐる古くからの課題に取り組んでいるが、不幸なことに、過去から教訓を得たりお互いから学び合ったりすることができない場合が多いのだ。両者が話し合うことはめったにないし、いざ話をする段になっても、互いに異なる語彙を用いて会話してしまう。サイバースペースにおけ

図 6-2 伝統的な図書館のカード目録

図 6-3 ブリューゲル作『バベルの塔』（Kunsthistorisches Museum, Wein oder KHM, WLEN）

(3)

る構造と意味をめぐる論争の有様は、いずれ崩壊する定めとなる図 6-3 のようなバベルの塔を思い起こさせる。希望的観測としては、メタデータを境界オブジェクトとして用いることで、われわれは相互解釈を育み、共通理解を形成し、真の社会的進歩を促すことができるはずなのだ。

タクソノミー

メタデータの歴史は、階層構造と複雑に織り交ぜられている。思考やモノをカテゴリとサブカテゴリによって体系化することは、人間の経験の基盤となる行いであるからだ。人間は、理解するために分類を行う。図 6-4 のようなツリー構造が、人間の意識の根底にある。親子関係を欠いた知性というものは想像もできない。公式なタクソノミーでは、単一の「ルートノード」が階層構造の頂点に位置する。属性はクラスからサブクラスへ、継承の原則にしたがって受け継がれる。各オブジェクトとカテゴリには、そのタクソノミー内で一意の位置情報が割り当てられる。たとえばわれわれは、通りの名前や市町村名、州名、国名が入れ子構造を成す階層関係の中に存在する住所に暮らしている。人間は、域、界、門、亜門、網、目、科、属、種といった生物学上のタクソノミーの中で、ホモ・サピエンスとして存在している。もちろん、世界中どこでも必ずこのプラトン的な理論上の分類アプローチが適用できるわけではない。肺のある魚もいれば、卵を産む哺乳類もいる。複数のトピックを扱うドキュメントがあり、多くの意味を持つ言葉や、多くの言葉で表される意味もある。現実世界では相互排他的な分類同士が混同されているために、われわれは気がつくといつでも、何かを分類するために既存のどのカテゴリが最適かについて議論したり、それに完璧にマッチする新しいカテゴリを定義したりしているのだ。統合論者（lumper）と細分論者（splitter）は過去数世紀に渡り、リンネ式動植物分類法をめクラスサブクラスサブクラス 図 6-4 単純なタクソノミー

(4)

ぐって論争を繰り返している†_。さてわれわれIA は、デジタル情報システムの柔軟性に助けられながら、現実に適応するべく戦略を練り直してきた。今では、統制された「多重階層構造（ポリヒエラルキー）」も容認している。これは図 6-5 のように、オブジェクトやクラスの一定の集合を複数のカテゴリで相互参照することを可能にするものだ。また、既存のデータ集合の中でオブジェクトを記述するために複数のフィールドまたは「ファセット（面）」を用いる、図 6-6 のような「ファセット分類」を採用している。1930 年代にインドの図書館学者 S.R. Ranganathan が初めて定義したファセット † 原注：統合論者は、おおよそ類似している項目を同一のカテゴリに位置付ける。細分論者は、それらの差異に適応すべく新たなカテゴリを作ることを主張する。さらに詳しい解説は、以下の Wikipedia の『Lumpers and Splitters』のページを参照のこと（http://en.wikipedia. org/wiki/Lumpers_and_splitters）。単一のタクソノミーファセット分類色による分類価格による分類ブランドによる分類タイトルによる分類主題による分類著者名による分類 図 6-6 単一の階層構造 vs.多数の（ファセット分類による）階層構造 疾患気道疾患ウイルス性疾患ウイルス性肺炎 図 6-5 医学文献データベースにおける多重階層構造

(5)

分類は、オブジェクトが多数の場所に同時に存在しうるデジタルの領域において特に重宝されてきた。ウェブ上でユーザやそのタスクごとに異なるナビゲーション方法に対応するには、この関係性重視のアプローチが頼りになる。コンテンツを相互排他的な入れものに分けて詰め込むよりも、構造的かつ意味的なメタデータを適用する手法を選んでいるのだ。そしてわれわれIA は、言語の曖昧さに対処するために「統制語彙」を開発している。人気語についてはその類義語（検索目的で同じ意味を持つ別の用語）を扱うために等価関係を定義し、階層関係にこだわらない（クロスセルやアップセル†_{促進のために} よく使われる）「関連商品」リンクの生成に役立つ連想関係を定義して、図 6-7 のような構造を作り出している。最後になるが、われわれはIA として、これらの構造を設計することで実現できるのはファインダビリティだけではないことを認識している。分類システムはユーザの理解

カモノハシのパラドックス

1799年、大英博物館の自然史課に、オーストラリアのジョン・ハンター大尉から奇妙な動物の標本が届いた。科学的な分類学者たちは当初これを、器用なアジアの剥製師が彼らに一杯食わせるつもりで、アヒルのくちばしをモグラの毛皮に縫いつけたものだと思い込んだ。この毛皮に覆われた、温血の、鳥類と爬虫類の特徴を兼ね備えた生物は、長い間博物学者たちを混乱させた。1836年になり、ビーグル号に乗ってオーストラリアを訪れたチャールズ・ダーウィンによる観測が、カモノハシを進化論者と創造論者との激しい論争の渦中に投げ込んだ。最終的にカモノハシは、現存する4種の単孔類の一種であり、胎生ではなく卵生である唯一の哺乳類として、分類学上の居場所を得た。興味深いことに、半水生のカモノハシはまた、電気を感知できる感覚器官を持つ数少ない哺乳類の一種でもある。獲物となる生物の生体電気を検知してその居場所を知るのである。もちろん現地オーストラリアのアボリジニの人々は、このキメラのような生物に、「mallangong」「boondaburra」「tambreet」といった異なる名称を付けている。そしてアボ

リジニが用いるディルバル語では、カモノハシは“Balan”と呼ばれる第2のカテゴリに属している。このカテゴリには他に、女性、オニネズミ、犬、エキドナ、ある種の蛇、ほとんどの鳥類、ホタル、サソリ、コオロギ、毛虫のような幼虫、水や火に関するすべての物、ある種の樹木などが含まれる。

― ジョージ・レイコフ著『Women, Fire, and Dangerous Things』、 University of Chicago Press.

† 訳注：クロスセルは購入者に別の関連商品を販売する手法であり、アップセルは購入者により上位のまたは付加価値の高い商品を販売する手法である。

(6)

を促進し、対象物のアイデンティティに影響を及ぼし、権威を主張するものでもある。製品の分類や、ブランドの様式や、企業内特有の語彙は、図 6-8 の例のようにその企業の戦略や競争優位性と密接に結び付いている。そして特定の世界観を推し進めるものであるがゆえに、あらゆる主題別分類は本来政治的なものである。そのすべてが図狭義語関連語関連語変異語変異語広義語階層関係等価関係人気語連想関係ミノルタ dimage デジタルビデオカメラカメラ付き携帯電話デジタルカメラデジタル一眼レフカメラカメラと電話デジタルカメラ 図 6-7 シソーラスの用語および関係 図 6-8 Forrester Research 社のファセット分類

(7)

6-9の例のごとく、一目瞭然で面白おかしいものであるわけではないとしても。ジョージ・レイコフが論じているように、「人間がその思考や知覚、行動、発話をカテゴリ分類することほど、基本的な行為はない」のである。セマンティックウェブの可能性を探るに当たっては、メタデータの歴史に秘められた、タクソノミーにまつわるこれらの教訓をおろそかにしてはならない。

オントロジー

しかし私は、デジタルなオブジェクトやコンピュータ、そしてインターネットを中心に据える新鮮なアプローチには価値がないと言いたいわけではない。結局のところ、 1974年に初めて公開されたZ39.19†_{のような統制語彙の標準というものは、旧世代の} 遺物をビットの時代に持ち越してしまう事態を招いているのだ。それと対照的に、セマンティックウェブの各種標準は初めからデジタル技術向けに用意されており、コー 図 6-9 Harpers Magazine の主題別分類（このサイトのタクソノミー作成に関する事情は、 以下のPaul Ford の記事『A New Website for Harper's Magazine』で知ることがで きる。http://www.ftrain.com/AWebSiteForHarpers.html）

† 『単一言語統制語彙の構築・フォーマット・管理のためのガイドライン（Guidelines for the Construction, Format, and Management of Monolingual Controlled Vocabularies）』のこと。以下の URL で公開されている（http://www.niso.org/standards/resources/Z39-19.html）。

(8)

ドやネットワークを深く理解している開発者たちによって作り出されている。そして彼らはその名誉にかけて、最初の一歩を踏み出す時から、タクソノミーが持つミッションクリティカルな性質を認識していたのだ。言うまでもなく、古典的な階層構造モデルをビットの世界で適用するには限度がありすぎたので、彼らはオントロジーという付加価値モデルを支持することを決めた。哲学上は、オントロジーとは存在の本質、存在する物の種類の性質についての理論である……人工知能やウェブの研究者が一致して、この用語を選び出した……もっとも典型的なウェブ用オントロジーのほとんどは、タクソノミーと一連の推論ルールを備えている†_。現在このモデルをもっとも分かりやすく応用している事例は、W3C が定めたメタデータの記述や交換のための標準であるリソース記述フレームワーク（RDF、 Resource Data Description）である。RDF で表現される情報の構造は、主語、述語、目的語で構成されるトリプル（三つ組）要素の集合となっている。これらは、あるモノが一定の値を持つ属性を備えていることを断定するために利用される。これらのトリプル要素は、XMLのタグによって定義される。URI（Uniform Resource Identifier）によって各定義が識別できるので、その定義は世界でただ1つのものとなり、広範なアクセスが可能になる。図 6-10 に示すこのトリプルストレージモデルは、エンティティ†† およびエンティティ同士の関係を定義するための、パワフルかつ柔軟な方法を与えてくれる。たとえば、公式な階層関係は以下のように定義できる。主語述語 目的語 カモノハシは∼に属する単孔目 † Berners-Lee、http://sciam.com. †† 訳注：一単位として扱われるデータの集合のこと。主語述語目的語 図 6-10 トリプル要素によるRDF グラフのデータモデル

(9)

しかしそこで即座に、等価関係や連想関係も容易に定義できる。主語述語 目的語 カモノハシは∼と同義である Boondaburra† カモノハシは∼と関連しているエキドナ†† 実際、このモデルを用いれば、伝統的なシソーラスでおなじみの連想関係の先まで進むことができる。トリプル要素によって、分類された関係の無限配列を作ることができるのだ。この点がXML とRDF の、エキサイティングな特質である。タクソノミーや統制語彙、ファセット分類、豊かな意味体系上の関係性への対応が、インフラに組み込まれているのだ。それはIA にとっては夢のような話である。さらにうれしいことには、その明示的な達成目標にはファインダビリティの実現も含まれているのだ。ティム・バーナーズ・リーの説明によれば、オントロジーは「ウェブ検索の精度を高めるために利用できる。つまり検索プログラムが、あいまいなキーワードを含むすべてのページを見に行く代わりに、正確に一致する概念を参照しているページのみを検索範囲とすることができる‡_{」のである。そしてXML 仕様の共同策定者であるティム・} ブレイは、メタデータをRDF にエンコードすることを「モノを見つけるための正しい方法」‡‡_{であると位置付けている。} 図書館学者たちは即座にRDF の価値を理解した。1995 年、オハイオ州ダブリンにて、オンラインコンピュータ図書館センター（OCLC）が米国立スーパーコンピュータ応用研究所（NCSA）との合同ワークショップを開催し、ウェブでの情報の検索、取得を改善するために意味論的なメタデータをどのように利用すべきかを話し合った。これらの議論が結果的に、ダブリン・コア･メタデータ標準の作成につながった。これは、ネットワーク上のリソースを記述するシンプルな要素セットを定義するものである*_。 † 訳注：アボリジニの間で使われる、カモノハシを意味する用語。 †† 訳注：ハリモグラとも呼ばれる動物で、カモノハシと同じ単孔目に属するとされる。 ‡ Berners-Lee、http://sciam.com.

‡‡ Tim Bray の記事『What is RDF?』より。以下の URL で公開されている（http://www. xml.com/lpt/a/2001/01/24/rdf.html）

* 原注：ダブリン・コアの 16 個の要素は、タイトル（Title）、著者あるいは作者（Creator）、主題（Subject）、内容記述（Description）、公開者あるいは出版者（Publisher）、寄与者（Contributor）、日付（Date）、資源タイプ（Type）、形式（Format）、資源識別子（Identifier）、

情報源（Source）、言語（Language）、関係（Relation）、対象範囲（Coverage）、権利管理（Rights）、資源利用者（Audience）である。詳しくは、http://dublincore.org/を参照の

(10)

このメタデータのスキーマはHTML、XML、RDF にエンコード可能であり、図 6-11 のように、トリプルストレージモデルに完璧にフィットする。要するにわれわれは、シンプルかつ拡張性を備え、多分野に渡って広く適用できるよう綿密に作り上げられた、堅牢なXML のインフラとメタデータ標準を手に入れたのだ。これはアプリケーションの構築や語彙の強化の基盤となる、見事な礎である。それならなぜ、セマンティックウェブや、RDF やダブリン・コアが、まだ世界を変革するに至っていないのか？なぜそれらが、あらゆるウェブ関連プロジェクトに不可欠な要素となっていないのか？まだ何か満たされない要望が残っている気がするのは、なぜなのか？その理由としては、RDF 構文の複雑さが災いしたのだと言う人もいれば、創成期のエバンジェリストたちの高尚すぎるビジョンのせいだと批判する人もいる。また、セマンティックウェブ支持者たちの視野について、彼らは人間と機械、あるいは人間同士のインタラクションよりも、機械と機械のインタラクションばかりに目を向けているという誤解が広く流布してしまったせいだという意見もある。これらの主張はどれも一理ある上に、まださらに広く深くさまざまな理由付けが存在している。第 1 の理由として、大部分の情報システムでは、構造的メタデータと統制語彙の適用を許していない。人間が情報を整理するためのおもな原則は、積み重ねとファイリング（綴じ込み）という行為によって典型的に示される。人間はいろいろなものを机やテーブルや床の上に積み上げ、新着順に並んだ一次元のグラフを作る。そして、類似性によってアトムやビットで例示される単純なタクソノミーに従い、それらをキャビネットやフォルダやディレクトリにファイリングする。事実いまだに、世界最大規模の企業ウェブサイトの多くが、おもにバケツを入れ子にしたような原始的な階層構造モデルに基づいて作られているのだ。これからも世界の大部分では、セマンティックウェブを実現する準備が整うことはないだろう。そしてわれわれはいまだに、それ以外の場所にいる少数派が追いつくのを待っている状態なのだ。ユリシーズジェイムズ・ジョイス DC.Creator（著者）ユリシーズテキスト DC.Type（データの種類）ユリシーズランダムハウス DC.Publisher（出版者） 図 6-11 RDF のトリプル要素に対応するダブリン・コア要素

(11)

第 2 の理由としては、第 1 の説明とも密接に関係しているが、共有可能な分類システムの設計は驚くほど複雑で、面倒で、コストがかさむという点が挙げられる。こうした意味で、セマンティックウェブの設計者たちが「オントロジー」という用語を選んだのは適切だったと言える。この用語は哲学上、実在の本質や、実存の基本的カテゴリについて研究する形而上学の一部門のことを指す。存在するということは何を意味するのか？モノとは何か？どんな属性が核になっているのか？知識表現についてのこの新たなビジョンは、ソクラテス、プラトン、アリストテレスによる古典的理論をルーツとしている。クレイ・シャーキーの激しい批判を招いたのは、この演繹法と三段論法という過去の遺産であった。しかし哲学者ウィトゲンシュタインが論じたように、上記のような存在論上の課題の根本的原因は、意味論だけではなく、分類という行為の土台となる論理にもあるのだ。たとえば、われわれがゲームと呼ぶ行為について考えてみよう。つまりボードゲーム、カードゲーム、球技、オリンピックの試合、などのことである。それらすべてに共通する点は何か？† ウィトゲンシュタインはこのシンプルな設問によって、ルールに基づく定義の錯誤を明らかにし、レイコフの『Women, Fire, and Dangerous Things』で端的に示されている、現代的なプロトタイプ理論の表現へとわれわれを導く。要するに、人間が日常生活で用いるほとんどのカテゴリは、客観的なルールというより、あいまいな認知モデルによって定義されているのだ。家族の構成メンバー同士は何ら共通の属性を持っていなくても、容貌の類似性という特質によって関連付けることができるだろう。必然的に、メンバー性には程度の差と求心性が生まれる。メンバーのランクを備えるカテゴリがあったり、他のメンバーより代表的なサンプルとなるメンバーがいたりするのだ。レイコフが証明したように、人間がカテゴリ分類をする方法は言語と文化に根ざしている。実を言えば彼の著書のタイトルも、オーストラリアのアボリジニが用いるディルバル語に触発されたものだ。その言語には「Balan」というカテゴリがあり、そこには女性や火、危険なものが含まれる。また、危険ではない鳥や、カモノハシ、オニネズミ、エキドナのような珍しい動物もそこに含まれる。ハイテク用の語彙の場合、そのローカライゼーションを行うには、翻訳と合わせて分類も必須となるのだ。さらに、タクソノミーとオントロジーの設計は本来、政治的かつ道徳的なものである。Geoffrey BowkerとSusan Leigh Starは『Sorting Things Out』でこう説明する。 † Ludwig Wittgenstein著『Philosophical Investigations』、Macmillan.

(12)

それぞれの標準、それぞれのカテゴリは、ある何らかの観点について価値を設定し、それ以外を封じるものである。これは本来、悪いことではない―まったくもって不可避な事態である。しかしそれは道義的な選択であり、それ自体危険なことなのだ。悪くはないが危険なのである†_。情報の集合にラベルを付け、整理する方法は数多くある。台湾は国家か？トマトは野菜か？テロリストと自由の闘士の境界線はどこにあるのか？シラー、メルロー、ピノ・ノワールの微妙な違いが本当に重要なのか？どれもただの赤ワインじゃないのか？その答えは、質問の相手次第で決まる。グループ分類や粒度（granularity）††_{がこのように複雑化せずに済んでいる領域は、非常にわずかしか残っ} ていない。機械は互いに精密な会話を交わすかもしれないが、機械に語彙を与え、最終的に価値判断を行わねばならないのはあくまで人間である。ウェブは詰まるところ、セマンティックであろうとなかろうと、人間の共同作業のためにあるのだ。市場は対話である。ハイパーリンクは階層関係をくつがえす。ウェブは生き物だ。あるいは少なくともそれは、ブロゴスフィア‡_{の周辺でざわめくソーシャルソフトウェアマニアの} 群れから、いずれ伝え聞くことになる物語なのである。

フォークソノミー

集団による索引生成は、ソーシャルソフトウェアを満たしているエーテル（媒介物質）の中から現れてきた。そこで、フォークソノミーの話題に入る前に、まずこの広範囲な社会工学的現象について調べておくべきだろう。複数の人間が協調行動のためにコンピュータを用いるという概念は、1945 年のヴァネヴァー・ブッシュによる memexの発想にまで起源をたどることができる。memex を用いれば、ユーザがハイパーテキスト上の「足跡」を共有できるとされた‡‡_{。この概念はその後数十年に渡っ} て苦難の道を乗り越え、1980 年代になってやっと、ユーザの共同作業を支援するグループウェアやコンピュータの御旗の下で日の目を浴びることとなった。「ソーシャルソフトウェア」という用語は、1987 年のハイパーテキスト会議において、ナノテクノロジの先駆者 K ・エリック・ドレクスラーによって初めて用いられた。

† Geoffrey C. Bowker、Susan Leigh Star 著『Sorting Things Out: Classification and its Consequences』、MIT Press.

†† 訳注：処理の細分化または要約の単位のこと。

‡ 訳注：ブログを作成するユーザによって形成される情報空間のこと。ブログ圏とも呼ばれる。 ‡‡ Christopher Allen の記事『Tracing the Evolution of Social Software』。以下の URL で公開さ

(13)

（自分で選択した判断基準に基づいて）ユーザが自動的に一部のリンクを表示しその他を隠すことができるシステムとは、フィルタリングされたハイパーテキストである。これは、将来フィルタリングを行うための判断基準を示す投票や評価のスキームを含む、「ソーシャルソフトウェア」とでも呼ぶべきシステムへの対応を暗に意味している……ハイパーテキストベースのソーシャルソフトウェアの可能性は広範囲に渡ると思われる†_。しかしこの用語は、2002 年になるまで一般的に使われてはいなかった。それが一挙に普及したきっかけは、我らの友クレイ・シャーキーが主催した「ソーシャルソフトウェアサミット」であった。それに続いて彼は、『Social Software and the Politics of Groups』と題された秀逸な論文において、彼自身によるソーシャルソフトウェアの定義を披露した。ソーシャルソフトウェアは、集団のコミュニケーションを支援するソフトウェアであり、メールのCC 欄からEverQuest のような壮大な3D ゲームの世界に至るまでのあらゆる要素を含んでおり、チャットルームのように特定の方向性を持たないものにもなるし、Wiki（協調的ワークスペース）のようにタスク志向のものにもなり得る。集団内のインタラクションには非常に多くのパターンがあるので、ソーシャルソフトウェアはグループウェアやオンラインコミュニティのようなシステムよりはるかに大きなカテゴリである……この巨大なカテゴリ内での数少ない共通項の1 つは、ブロードキャストやパーソナルコミュニケーションのためのソフトウェアがインターネット上でユニークではないとすれば、ソーシャルソフトウェアはその意味ではユニークである、という点だ††_。ソーシャルソフトウェアの普及を促した功労者はクレイに違いないが、それに呼応する成果の数々が途方もなく集中的に現れたことで、新たな段階への移行は避けられなくなった。ブログ記事、コメント、トラックバック、リファラのログ、被リンク数、ページランクや、Daypop、Slashdot、Technorati、Ryze、Friendster、LinkedIn、 Wikipediaといったサイトなど、パーソナルパブリッシングやインタラクション、ソーシャルフィードバック、会話の発見、風評コントロールのための軽量なツールの数々が生み出す驚くほどの資産が、またたく間に現れた。異論のあるところだが、われわれはかつてUsenet やWELL などのコミュニティで、この類の仕組みをすでに目にしていた。しかし今世紀の幕開けにおいて、ウェブ上のソーシャルソフトウェアの真の規模 † Christopher Allenの『Tracing the Evolution of Social Software』で引用された。

†† Clay Shirky 著『Social Software and the Politics of Groups』より。以下の URL で公開されている（http://www.shirky.com/writings/group_politics.html）。

(14)

とそれが新たに生み出す豊かさは、おなじみの臨界点を超えたその先の世界へとユーザを旅立たせてくれる。デビッド・ワインバーガーのブログで、ある読者はこうコメントしている。変化はソフトウェアの中で起こっているのではなく、ユーザの頭の中で起こっているのです。やがては、ガラス瓶の中に木造の船を作るのが好きな青年が、世の中には自分以外にも同じ愛好家が山のようにいて、中には自分と同じ町に住んでいる人もいることに気づくでしょう†_。社会的ネットワークとIT が交わる地点では、非常に大きな興奮と盛んな活動が沸き起こっている。数百万人のブロガーが、評価経済（reputation economy）で用いる「karma」や「whuffie」††_{などの代用貨幣と引き換えに、ミームの交換を行っている。} われわれが授業中や会議中に、Wi-Fi 対応の内緒話コミュニケーションを試しているように、新手の談話形態が出現しつつある。del.icio.us のソーシャルブックマークや Flickrの画像共有タグなど、新たな遊び道具やツールが暴動のごとき勢いで続々と浮上している。フォークソノミーが現れたのは、ソーシャルソフトウェアの縦糸と横糸が織り成すこのような状況の真っ只中であった。情報アーキテクチャに関するメーリングリストにおいてGene Smith が、情報を体系化し共有するためにユーザ定義によるラベルやタグがますます頻繁に使われつつあることを指摘し、「この類いの非公式かつ社会的な分類体系を指す用語はあるだろうか？」と問いかけたのだが、一通り意見が出たところでThomas Vander Wal が以下のような返答をしたのである。

では、新たに生み出されるシソーラスによってユーザが作り出すボトムアップ型のカテゴリ構造が発展すると、「フォークソノミー」になるのだろうか？‡

こうして、フォーク（人々）とタクソノミーを合体させた新たな用語が慎ましやかに、1 つの問題提起を伴って誕生したのだ。しかしこの用語はブロゴスフィアの世界に入っていく際に、そのつつましい起源から遠ざかってDavid Sifry によるTechnorati 革命の魅力を追い求めながら、独自の生命力を帯びていった。

† 「Joho the Blog」での David Weinberger の投稿『Why Social Software Now?』に対する、 Michael Pusateri（http://cruftbox.com/）のコメント。以下の URL で読むことができる（http://www.hyperorg.com/blogger/mtarchive/001451.html）。

†† 訳注：コミュニティサイト「Slashdot」やオンラインゲーム「Clan Load」などで使用されるユーザ評価の単位。

‡ 2004年 7 月 24 日に、情報アーキテクチャ研究所（IAI）の会員制メーリングリストに投稿された。

(15)

タグは単純でありながらパワフルな、ソーシャルソフトウェアにおける革新である。今では数百万人のユーザが、コンテンツや掲示板のスレッドに、自由かつオープンにメタデータを割り当てている。ユーザが敬遠する厳格なタクソノミーのスキームと異なり、社会的なインセンティブに基づいて個人用の情報の整理に用いるタグ定義の手軽さは、情報が豊富で探しやすいフォークソノミーの誕生につながる。知的情報は、社会的な発見の助けとなるために、現実の人間からボトムアップ方式で供給される。そして適切なタグの検索とナビゲーションが可能であれば、フォークソノミーは、それより構造化された分類アプローチよりも優れた成果を挙げる†_。さらに悪いことに、恩知らずな腕白息子のようなこの用語は、両親に対するあからさまな反抗という形でクレイ・シャーキーと手を組んだのだ。ルイス・ローゼンフェルドとの討論において、シャーキーはこう論じている。フォークソノミーの強みは、統制語彙より優れているということではない。タグ付けが必要な事例のほとんどについて、統制語彙ではカバーし切れないので、せめてフォークソノミーがあれば何もないよりはましだというだけなのである……これは、「満足に設計されたメタデータ」の支持者たちが理解していない重要なポイントである……大規模システムで厳密なタグ定義を行うコストは非常に負担となるので、 Flickrのような環境で統制されたメタデータを用いたらどうかという発想は、ユーザが突如として情報アーキテクチャのしもべになろうと決意してくれるのではないかと夢想するに等しい、まさに絵空事でしかない††_。なんともはや、彼はまずセマンティックウェブを酷評し、次に情報アーキテクチャを冒涜している。ソーシャルソフトウェアの伝道者たちにとっては、クレイはやや「アンチソーシャル」な印象を与えてしまっているのだ。境界オブジェクトを戦争の道具として使うのはルール違反だと、誰かが彼に忠告したほうがよさそうだ。とにかく、この自由なタグ定義の話に戻ろう。その呼び方は、集団的索引生成でも、協調的カテゴリ作成でも、民族的分類でも、何でもお望みのものでかまわない。中核をなすアイデアは単純だ。ユーザがオブジェクトにタグを付けるのである。その際、図 6-12のように複数のタグを付けるという選択肢もある。

† David Sifryのブログに 2005 年 1 月 17 日に投稿された記事『Technorati Launches Tags』。彼は Technoratiの創立者かつ CEO であり、自らいわく「ブログ界の最新事情に関する権威」でもある。

†† 『Folksonomies + Controlled Vocabularies』。以下の URL で公開されている（http://www. corante.com/many/archives/2005/01/07/folksonomies_controlled_vocabular ies.php）。

(16)

タグは共有され、社会的ナビゲーションの軸となる。ユーザはオブジェクトやタグや、著者や索引作成者の間を、流動的に行き来できる。やがて多くのユーザが1 つのオブジェクトに異なるタグを付けたり、異なるオブジェクトに同じタグを付けたりすると、事態は面白くなってくる。例を挙げてみよう。

インフォメーションアーキテクトであるJesse James Garrett は、『Ajax: A New Approach to Web Applications』†_{と題したエッセイを書いたが、その2 か月後には図} 6-13のように、del.icio.us で1,646 人のユーザがこのページをブックマークしていた。この事実は何よりもまず、それがかなり人気のあるエッセイだということを示している。オブジェクトタグタグ 図 6-12 1 つのオブジェクトに付けられた複数のタグ

† Jesse James Garrett 著『Ajax: A New Approach to Web Applications』。以下の URL で公開されている（http://www.adaptivepath.com/publications/essays/archives/ 000385.php）。

(17)

しかしもっと重要なのは、そのエッセイについて誰がどんなタグを付けたかが分かることである。そしてそれらのリンクをたどれば、これらの話題についてより多くの情報や、その背後にいるユーザたちを発見できるのだ。つまりウェブ開発やプログラミング、XML、RIA、Javascript、Flash などについての他の記事を見つけることができ、さらには図 6-14 の一番下の例のように、他のどのユーザがこの記事を「後で読む（read later）」つもりかなどということまで分かってしまうのだ。そしてもちろん、 Ajaxに興味を持っている他のユーザを発見することもできる。ある意味でオブジェクトが、新たに芽生えるコミュニティの種子として機能するのだ。同様にして、「ajax」というキーワードをタグとして付加されている記事やオブジェクトの一覧を見ることもできる。これは図 6-15 のように、時にはかなり異なる観点から同じ話題について議論しているユーザを見つけるのにも役立つ。こうしてタグは図 6-16 のように、本質的には異なるオブジェクトの集合を縫い合わせる糸の役割を果たし、ボトムアップ方式で定義される創発的なカテゴリ体系、すなわちフォークソノミーを作り出す。そしてその素晴らしい点は、ライブラリアンやオントロジストその他の「満足に設計されたメタデータの支持者たち」が、トップダウン方式の階層構造を押し付けてくることに対価を払わずに（またはそれを待たずに）済んだことである。フォークソノミーは豊穣なコモンズ（共有地、共有知）の中で、著しいコストをかけることなく繁栄する。それらは、セレンディピティ（掘り出し物を発見できること） 図 6-14 del.icio.us におけるJesse のエッセイへのリンク

(18)

という素晴らしい要素をウェブのナビゲーションに盛り込み、ユーザの興味や行動の主要な指標として役立っている。人気のタグは広がりつつあるミームの存在を示唆し、 1枚の写真が無数の言葉を語ることにもなる。ここ最近は誰もが、Flickr で茶葉占い† をしているようなのだ††_。オントロジーとタクソノミーのことはもう忘れよう。フォークソノミーこそ未来なのだ。デビッド・ワインバーガーが表現したように、「旧来の手法は樹木を育てそうとするが、新たな手法は落ち葉をかき集める」のである。そして私はデビッドに同意せざるを得ない。このメタファーは完璧なのだ。なぜならわれわれは、毎年秋に踏みしめる美しい枯葉の山がどんな運命をたどるかを知っているからである。それらは腐敗する。そして土に帰り、樹木の養分となり、結果としてさまざまな樹木が多様な形と大きさ 図 6-15 「ajax」というキーワードでタグ付けされたオブジェクト † 訳注：茶を淹れた時の茶葉の開き具合を見て未来を予想する占い。「木」と「葉」の関係は、タクソノミーとフォークソノミーの関係を表すメタファーである。

†† Matt Jones のブログ記事を参照（http://www.blackbeltjones.com/work/?p=1174）。

オブジェクト

タグ

(19)

に成長し、大いなる価値をもたらし、非常に長期間に渡って生き続けることになる。フォークソノミーは、Technorati が「World Live WebTM_」†_{と呼ぶウェブの世界で} ユーザがネットサーフィンする際に非常に役立つ。トレンドを発見したり、欲望のルートを明らかにしたりするための、新たな驚くべきツールである。そして自分が見つけたものを見失わないようにしておくために、フォークソノミーを個人用ブックマークのツールとして利用するのも悪くはない。しかしファインダビリティの尺度からフォークソノミーを考えると、それは等価関係や階層関係などの意味論上の関係性を扱えないために、ある程度規模が大きくなると惨めな失敗を引き起こしてしまう。もしどうしても新旧の手法のどちらか1 つだけを選ばなくてはならないとすれば、私は絶対に、（図 6-17 のような）つかの間の人気を呼ぶ葉の数々よりも、古来の知識の樹木のほうを選ぶだろう。しかしそれこそが、われわれがメタデータと呼ぶ境界オブジェクトに備わっている美 † 訳注： Technorati のコンセプトに関わる、リアルタイムに非常に高頻度で更新されるウェブの世界を表現する用語。 図 6-17 Flickr での葉の写真の一覧

(20)

徳なのである。どちらか一方だけを選ぶ必要はないのだ。オントロジー、タクソノミー、フォークソノミーは相互排他的なものではない。企業ウェブサイトのような多くの利用背景においては、オントロジーとタクソノミーによる公式な構造を定義することに投資するだけの値打ちがある。それ以外の、たとえばブロゴスフィアのような環境では、フォークソノミーによる非公式なセレンディピティがあれば、何もないよりはありがたいのは間違いない。そしてまた、イントラネットや知識ネットワークなどの場合には、両方の要素を組み合わせたハイブリッドなメタデータ環境を作るのが理想的だろう。

この潜在的なシナジーは、「AND の才能」を超えてペースの多層化（pace layering）という概念にまで影響を及ぼしている。ペースの多層化とは、おそらく Stewart Brandによってもっとも明確に示された概念である。彼は著書『How Buildings Learn and The Clock of the Long Now』の中で、建築物やさらには社会全体が、図 6-18および図 6-19 のように、個々にユニークかつ適切な変化率を持つ複数の層から成る構造体であるという考えを詳しく示した。変化が遅い層は安定性をもたらす。変化が速い層は革新の原動力となる。各層の速度の独立性は、自然かつ健全な進化の結果である。さもなければどんな結果を招くか想像してみよう。政府活動と同じペースでしか商業活動が進まないとしたら？ソビエト連邦の例を覚えているだろうか？用地無期限構造 30 ∼300年外装 20年設備 7 ∼15年空間設計 3 ∼30年家具、内装など 1日∼1か月

図 6-18 建築物におけるペースの多層化（出典： Stewart Brand 著『How Buildings Learn』、 Penguin Books [1995]）

(21)

私はかなりの間、このペースの多層化という概念が、ウェブデザインというもっと狭い領域で大きな成果を約束するものだろうと信じていた。このメタデータをめぐる議論においては、統合的アーキテクチャがもたらす可能性はおのずと明らかである。セマンティックウェブに関するツールや各種標準は、パワフルで耐久性のある基盤を作り出す。タクソノミーとオントロジーは、インターフェースをインフラ構造に結び付ける堅牢な意味体系のネットワークを提供する。そしてそれらの上層に、変化が速く流行的なフォークソノミーが――柔軟で融通が利き、ユーザのフィードバックに即座に反応できる分類体系が――位置するのだ。そして時間の経過とともに、最上層で得られた教訓は下層へと受け渡され、より耐久性の高い社会的かつ意味論的なインフラ構造の層へと埋め込まれていく。これが、ファインダビリティとソシオセマンティック（社会意味論的）なナビゲーションの未来像であり、それは人間とコンテンツとメタデータとの未知なるつながりの上で、言語とコードが織り成す豊かなつづれ織りにもたとえられる。

ネットワーク

ネットワークは、リンクによって接続されたノード群で構成されている。橋でつながっている島々、通商ルートで結び付いている市場、電話回線で接続しているコンピュータ、軸索で結節している神経細胞、関係性によって結ばれている人間たちなどがその例だ。図 6-20 は、極めてシンプルなネットワークである。ネットワークは人間の生活において非常に重要な役割を果たす。人がどこへ行くのか、何を見つけるのかファッションと芸術商業活動インフラ政府活動文化自然遅い速い

図 6-19 社会におけるペースの多層化（出典： Stewart Brand 著『The Clock of the Long Now』、Basic Books [2000]）

(22)

を左右するのだ。これは意味論的ネットワークと社会的ネットワークをつないでおり、社会的ネットワーク分析の未開の地でわれわれにファインダビリティに関する洞察を追い求めさせている、見えない糸である。人と人とのインタラクションを研究してみると、ファインダビリティ的観点から見て興味深いパターンが見出せることが多い。たとえば図 6-21 の例では、以下の3 種類の尺度を測ることができる。 活動性（activity） Susanは他のノードへの直接リンクを6 個持つ「コネクタ」である。彼女は密接につながり合った群集あるいは実践的コミュニティの中心に位置している。 媒介性（betweenness） Claudiaは3 人としかつながっていないが、異なるグループ同士をつなぐ唯一の「バウンダリースパナー」として重要なポジションを占めている。 近接性（closeness） SarahとSteven は、他の全員に対して最短のルートを持っている。彼らは集団全体の中で何が起こっているかを見渡すのに有利な立場にいる。これらの尺度は個人、組織、企業のいずれのレベルでも適用可能である。またこれらは、トポロジ最適化のためにコンピュータネットワークに適用したり、ファインダビリティ改善のために情報システムに適用することもできる。なぜなら、上記の例で言う「バウンダリースパナー」はたちまち、図書館やGoogle 検索で探し出せるドキュメントになることがあるからだ。ノードは人でもコンテンツでもかまわないし、終端としても経路としても、データとしてもメタデータとしても機能し得る。記事や書籍やブログは単に目的地であるだけではない。時にそれらは、ユーザを著者に引き寄せる逆引き参照としても機能するからである。何かを書くということは、ただその内容を伝達するためだけではなく、自分個人のファインダビリティを強化するためでもあるのだ。ノードノードリンク 図 6-20 単純なグラフまたはネットワーク

(23)

社会的ネットワークにおけるもう1 つの興味深いパターンは、“6 次の隔たり”というフレーズでよく知られている「狭い世界」†_{現象である。そしてこの意味では、ウェ} ブもまた狭い世界である。公開されている索引化可能な8 億ノードから成るウェブを評価した1998 年の調査研究では、「すべてのドキュメントは互いに、わずか平均 19 クリック分しか離れていない」††_{という結果が示された。しかしながら、アルバート= ラ} ズロ・バラバシはこう反論する。「六次の隔たり」であれ「十九次の隔たり」であれ、この表現は大きな誤解を招きやすい。「小さな世界」の中では、欲しいものは簡単に見つかるかのような印象を与えるからだ。しかし現実はそれとはほど遠い。目的の人物ないしドキュメントまでの距離が六次や十九次ではないばかりか、どの人物への距離も、どのドキュメントへの距離もそうではないからである‡_。バラバシの計算によれば、1 ドキュメント当たりの確認時間をわずか1 秒としても、 19クリック分離れたすべてのドキュメントを見つけるのには3 億年以上かかることにな Fred Susan David Claire Tom Sarah Steven

Claudia Ben Jennifer

図 6-21 凧型ネットワークの図解（出典：本書の著者 Peter Morville の論文『 Social Network Analysis』、http://semanticstudios.com/publications/seman

tics/000006.php）

† 訳注：社会心理学者ミルグラムの実験によって提示された概念。スモールワールド問題とも呼ばれる。

†† Albert-Laszlo Barabasi 著『Linked: The New Science of Networks』、Perseus.

日本語訳：アルバート = ラズロ・バラバシ著『新ネットワーク思考―世界のしくみを読み解く』（青木薫訳、NHK 出版）より。

(24)

る。狭い世界がファインダビリティの問題を解決するわけではないのだ。べき法則を理解すれば、もっと多くの洞察を得られる。ジップ分布†_{を覚えているだろうか？} 人間社会やインターネットのような自己組織的なネットワークでは、多数の小さなイベントが、少数の大規模なイベントと共存している。ウェブ上では、少数の主要なハブに対して膨大な量のインバウンドリンクが設置されている一方、大多数のウェブサイトは、人気度を反映するGoogle のページランクのようなアルゴリズムに照らすとかろうじて視界に入るかどうかという状態なのである。もちろん、ロングテールの中の僻地に追いやられているのはサイトだけではない。ここは検索キーワードの多くが同様にくすぶっている場所でもある。ロングテールの中で需要と供給をリンクさせるのは、大いなる挑戦でありチャンスでもあるのだ。Chris Anderson が指摘するように、平均的なBarnes & Noble の店舗には10 万タイトルの在庫がある。しかしながらAmazon の書籍売上げの4分の1から3分の1は、その売上げランキングの上位 10万タイトル“以外”によるものなのだ††_{。これがマーケティングの専門家たちへの警鐘でないとしたら、} いったい何がそうだというのか。Amazon、eBay、Netflix、Googleはすべて、このロングテールの尻尾の先にある無数のニッチを発掘することで利益を上げているのだ。しかし彼らの成功は、ネットワーク上の不可視なノードの所有者や作成者にとっては、ごくわずかな慰めでしかない。たとえば、私に助けを求めてきたイタリア人の事業家の例を挙げてみよう。彼はデザイン会社に制作費を支払って自社のウェブサイトを作らせていたのだが、数か月後に、そのサイトを探し出すことができないのを発見した。Google で会社名を正確に入力しても、自社サイトを検索できなかったのだ。そのサイトは一見すると十分魅力的なのだが、中身をちょっと調べるとすぐに問題が見つかった。デザイン上の調整のため、テキストが画像に加工されていたのだ。「望ましいこと」と引き換えに、ファインダビリティが犠牲になってしまったのである。この単純な事例には重要な教訓が潜んでいる。ウェブの世界では、旅の行程がいきなり目的地から始まることが少なくない。検索エンジンに入力されるユーザのキーワードは、ウェブサイト内のキーワードと結び付かねばならない。さもないと、サイトへ訪問すらしてもらえないうちに旅が終わってしまう。こういうわけで、旅の終わりにたどり着く、ドキュメントと呼ばれるノードについては、もっと詳細に調べてみる価値があるのだ。 † 訳注： 3 章参照。

†† Chris Anderson の記事『 The Long Tail』。以下の URL で公開されている（ http:// longtail.typepad.com/the_long_tail/2005/08/a_methodology_f.html）。