• 検索結果がありません。

社会の科学とテクストマイニング

N/A
N/A
Protected

Academic year: 2021

シェア "社会の科学とテクストマイニング"

Copied!
26
0
0

読み込み中.... (全文を見る)

全文

(1)

社会の科学とテクストマイニング

  ーホッブズ『リヴァイアサン』を題材に一

左 古 輝 人

1.はじめに テクストマイニングとは

 ここ四半世紀ほどのあいだに、コンピュータを用いた自然言語処理の技術は 長足の発達を遂げた。文から単語や文節、品詞を特定するく形態素分析〉や、文 法構造、文中の成句などを特定するく構文分析〉は、現在私たちがワードプロ セッサで文書を作成する際には必ずお世話になっている自然言語処理技術であ る。或る語の意味を他の語とのあいだの関係から特定するく意味分析〉や、語や 文の意味を、その前後の文との関係から特定するく文脈分析〉などの技術開発も 進められており、音声による文字入力や、外国語の機械翻訳などに応用されて

いる。

 こうした自然言語処理技術の応用には枚挙にいとまがないが、その1つに、

近年、テクストマイニング(text mining)あるいはQDA(qualitative data analysis,質

的データ分析)と呼ばれるようになったテクスト分析手法がある一一以下では まとめてテクストマイニングと呼ぶ一一。これは分析者一人では処理しつくせ ないような、膨大で多様な、あるいは互いに矛盾するように見えるテクスト群 からなるコーパスから、分析者の関心に基づいて有意味な情報を抽出するため に開発された手法である。

 たとえば企業の顧客相談窓口に集まる情報を想定してみると分かりやすいだ ろう。この場合、情報量の多さもさることながら、情報の性質がきわめて多様 で、一貫性も確認しにくい。質問票を用いた調査とちがって、情報収集者の側 が、クレイマーに対してあらかじめ効果的な方向付けを与えるのが難しいため である。クレイマーは製品の不具合や使い方に関する問い合わせだけでなく、

当該企業自身には無関係と思われるような各種の苦情も窓口に持ち込むだろ

(2)

う。窓口担当者はそれら全てに応対しなければならない。

 しかもクレイマーたちは同じ事柄を別の呼称で言い表したり、同じ語句で別 の事柄を言い表したりするものだ。たとえば「ウィンドウズセブン」は、

「ウィンドウズ」、「この基本ソフト」、 「ういんなな」などとも呼ばれるだ ろう。たとえば「ソフト」という語句はコンタクトレンズ、コンピュータプロ グラム、アイスクリーム、球技などをも意味するだろう。こうした情報の山か ら、有意味な情報と無意味な情報を効果的に濾し分けたり、一見したところ無 意味と思われる情報から意味を取り出したりできれば、顧客相談体制の改善は もちろんのこと、販売済み製品の欠陥の早期探知、製品の開発、販売手法の改 善や広告宣伝の工夫のためにも参考になるだろう。

 と、ほんのこれだけ説明すれば、鋭敏な読者は、テクストマイニングが営利 団体の利潤追求にとって有益なだけでないことに気づくだろう。テクストマイ ニングは司法における判例分析や看護・介護における患者・利用者ニーズの把 握などをはじめ、公共性の高い活動や非営利活動にも幅広く応用可能である。

 それでだけではない。テクストマイニングは社会学および隣接諸研究に対し ても興味深い応用可能性を持つ。しかも、単に応用できるというだけではない ように思われる。テクストマイニングはく質的データの大量処理〉およびく質的 データの分析過程の検証〉の可能性を開く突破口ともなるのではないか。テク ストマイニングによって、私たちは膨大な質的データのなかに潜む傾向性や、

特異な事例の特異性に量的な表現を与えることができる。一連の分析手続きは テクストマイニング・ソフトウェアのくプロジェクト〉としてファイリングでき るため、複数の分析者がコーパスとくプロジェクトファイル〉を共有すれば、知 見の妥当性を詳細に検証することができる。もはや、いわゆる質的調査と量的 調査を相容れないアプローチとみなす必要はないかもしれないのである。もは や質的データの分析を内在的批判が不可能な達人的奥義とみなす必要もないか もしれないのである。

 テクストマイニングが、新聞学におけるいわゆるコンテントアナリシス(con−

tent analysis,内容分析)とよく似ているように感じる読者もいるだろう。その通

りである。げんに試行されているテクストマイニングの社会学的研究への応用

(3)

にはコンテントアナリシスを踏まえたものが多い。1)

 もう少し具体的に言うと、テクストマイニングの実際の作業は以下のように 進められると考えると分かりやすい。

     1.準備①クルード・コーパス特定       ②コーパス洗浄

     ll.分析③キーワード抽出       ④キー…ワード間関係測定      HI.究明、⑤キーワード間関係特定

 分析者はまず①考察対象とするクルード・コーパス(crude corpus,原資料)

を特定する。たとえば<2009年度、首都大学東京広報担当代表電話に寄せられ た意見のうち、通話時間が1分以上だったもの〉など。②そのクルード・コーパ スを自然言語処理技術を用いながら、一定のルールに基づきリファイン

(refine,洗浄)する。つまりテクストにおける各語、各文の品詞と構文を特定 し、分析に必要な語句と不要な語句をある程度濾し分けたり一冠詞、抽象度 の高い一般名詞、助詞、副詞などはしばしば分析に不要である一、前後の文 脈から指示対象が明らかな代名詞を固有名詞に置換する一たとえば「これ」

を「首都大学東京」へ、など一。

 そうして得られたリファインド・コーパスから、③分析者の関心やコーパス 内での出現頻度、意味の類似性などを基準にしてキーワードを抽出し、整理し てゆく。たとえば「首都大」、 「この大学」、 「昔の都立大」、 「南大沢の大 学」をキーコンセプト〈首都大学東京〉として括る。「良い」、「好き」、「か

わいい」、「便利」をキーコンセプト〈プラス評価〉として括る。「悪い」、

「嫌い」、「かわいくない」、「不便」をキーコンセプト〈マイナス評価〉とし て括る。

④これらキーコンセプトどうしのあいだの相関を近接性、共起性など観点か

ら数量的に測定し、また統計的かつグラフィカルに表現する。たとえばキーコ

ンセプト〈首都大学東京〉とキーコンセプト〈プラス評価〉、キーコンセプト<マ

イナス評価〉のあいだの関係を、単一文中での共起がコーパス全体で何回起っ

ているか(共起頻度)で比較する。

(4)

⑤キーコンセプト整理とキーコンセプト間関係測定を往復し、時にはクルー ド・コーパス洗浄のルールを調整しながら、キーコンセプト間の有意味な関係 を探索、究明する。たとえばくプラス評価〉をくプラス評価〉とくプラス提言〉に 分割し、〈マイナス評価〉をくマイナス評価〉とくマイナス提言〉に分割し、それ ぞれ相関を検証する。

2.概念系譜学

2−1.テクストマイニングと概念系譜学

 筆者の研究上の主要な関心は社会学史(history of sociology)、なかでも英、

仏、米、日における社会学の形成経緯の究明にある。過去数年にわたり、概念 系譜学(genealogy of concepts)の観点から、社会(society)という語句が他の主要な 諸語句と連動しつつ意味を変えていった16世紀以降の過程、および、その延長 線上で19・20世紀における社会学(sociology)や社会主義(socialism)の形成、展開 との関係を解明するための準備作業を進めてきた。この研究計画の遂行に役立 ちそうなヒントをいろいろと探策するなかで、筆者はテクストマイニングに興 味を持った。

 ここにいう概念系譜学とは「現在特定の意味を持ちかなりの程度に定まった 用法で用いられているタームが、過去に何と関係しながら、現在と異なるどの ような意味や用法で用いられてきたかの探究を指す。ちょうど家系図というも のが現在を起点として、単一の名がさまざまな人々によって継承され現在にい たるまでの経緯を、時間を遡って描き出すのと同じである」(左古2009b:53)。

自然言語処理の用語で言いなおせば、概念系譜学とは、異なる時点に書かれた 複数のテクストからなるコーパスを分析することによって、特定の語句がた

どった意味変化の過程を実証的に究明する研究アプローチである。意味変化と はある語句と他の諸語句とのあいだに結ばれる関係の変化である。

 この概念系譜学にとって、社会学なる学問とは、要するに《社会学を自称す

るテクスト群からなるコーパス内における諸語句の出現頻度や諸語句問関係に

見られる、自然言語および他の諸学問と異なる、かなりの程度に固定した傾

向》と同義である。第2に、社会学史とは、こうした《社会学特有の諸語句の

(5)

使用パタンの歴史的形成およびその変遷の諸過程》と同義である。テクストマ イニングが、概念系譜学的アプローチによる社会学史の書き換えのための方法 の1つとして、いかに優れた性質を持つかが分かるだろう。読え向きと言うべ

き相性の良さである。

2−2.社会の終焉

 テクストマイニングの作業のデモンストレーションをおこなう前に、ここで は《概念系譜学的アプローチによる社会学史の書き換え》が単に可能であると いうだけでなく、必要でもあることを強調しておこう。

 社会が、社会学および社会的科学(social science(s))にとって最重要の概念であ ることを疑う者は居るまい。その社会概念がこんにち揺らいでいる。.

 社会概念の意味の曖昧性や多様性のことを言っているのではない。それなら 過去200年を通してずっと言われ続けてきた。こんにちの議論はそんな生半可 なものではない。社会概念の全般的棄却までが射程に収められている。実際に 社会概念の廃棄をはっきり提唱しているのはジョン・アーリ(Urry 2000=2006)

とイマニュエル・ウォーラーステイン(Wallerstein 1987)の2名くらいであるにし ても、それ以外の論者たちも廃棄という選択肢を、廃棄しないという選択肢と 秤にかけていることに変わりはない。

 しかし議論は全体としては、いまだ表層的な水準に止まっている。多くの論 者はく社会の終焉〉を、〈国民国家の成員〉を考察の単位として明に暗に想定した 社会概念の無効化として説明しようとするのである。マイケル・ビリグ(Billig 1995)、ウルリヒ・ベック(Beck l997=2000)、アンソニー・ギデンズ(Giddens l987=1998)、アーリ(Uay 2000=2006)などがこれにあたる。

 それが検討すべき1つの重要な側面であることは、筆者も認める。しかしこ れらの論者たちが考えているほど事態が容易であろうはずはない。これらの論 者は、そもそも社会学および社会的科学における社会概念の歴史が、国民国家 の歴史よりも明らかに長い、という初歩的な事実をあまりに軽視している。あ たかも社会学および社会的科学における社会概念が20世紀の産物であるかのよ うに語っているのである。浮薄にもほどがある。

 そんな中でも、主題の本性を見極めようとする試みとして注目すべきものが

(6)

4つある。フランソワ・デュベ『我々はいかなる社会を生きているのか』

(Dubet・1998)、スティーヴ・フラーr新しい社会学的想像力』(Fuller 2008)、盛 山和夫「構想としての探究」(盛山2005)、そして筆者の「社会概念の再検討」

(左古2007)である。

2−3.フランソワ・デュベの所説

 デュベによれば、多義的かつ曖昧な社会という語句は、19・20世紀を通し て主要なキーターム群と接合されることによって、①〈近代社会〉、似産業社 会〉、③〈社会的システム〉、④〈国民社会〉などとしてその意味を結晶化させて

きた。こんにちく社会の終わり〉が言われるのは、近代、産業化、システム、国 民という主要なキーターム全てが疑義に付され、かつてのような自明性を喪失

したためである。

 ①について。近代の人文知は前近代的な共同態とく近代社会〉の対比構図を描 き、前者から後者への進歩・発展の物語を再生産してきた。しかしそうしたく 大きな物語〉(人間の知的・道徳的性情の全般的漸次的改善の歴史観)は衰退

し、それとともに社会の意味も不明瞭になった。

 ②について。20世紀をつうじて進展してきた新中間層の増大、脱産業化、知 識産業化は、工業生産に従事する賃労働者の群れとしてのく産業社会〉、および 階級闘争の場としてのく産業社会〉の特徴を衰退させてきた。

 ③にっいて。機能主義全盛期の社会学にとってスタンダードだったく人間関 係が地位と役割の統合された1つのシステムをなしている〉という考え方が、

ここ30年間ほど批判され、代わって現れた新しいく社会的システム〉の概念は、

全体としての目的を欠く諸要素各々の合理性が互いに齪酷をきたしながら維持 されてゆく全体性を示している。

④について。運輸、通信手段の発達、相互依存の進展を通して、国民国家の 文化的統合は衰退し、経済的自律性は減衰している。

 デュベによれば、〈社会の終焉〉はこのように広範な事象であって、20世紀、

特に後半の主要な諸議論を彩ってきた様々なく終焉論〉一人間の終焉、イデオ

ロギーの終焉、歴史の終焉、国民国家の終焉、福祉国家の終焉、大きな物語の

終焉…一の総決算でもある。

(7)

2−4.スティーヴ・フラーの所説

 フラーによれば、近代におけるヒューマニティ(humanity)と社会の概念の関 係の基本的な構図は、<ヒューマニティの完成のためには、万人を平等にする 社会が必要〉というものだった。この構図を基本として、ヒューマニティと社 会の概念は、19・20世紀の主要なイデオロギー諸闘争における両極一左対 右、計画経済対自由市場、ファシスト全体主義対コミュニスト全体主義な

ど一を媒介し緩衝する役割を果たしてきた。

 しかしこんにち、これらのイデオロギー諸闘争が終わった結果として、

〈ヒューマニティと社会の終焉〉が訪れている。社会はイデオロギー闘争の軸が 移り変わるなかで明確な形姿を失いつつある。フラーにしたがえば、今後は社 会を媒介したこれら諸闘争の諸経緯を総括し、〈社会の終焉〉の後のイデオロ ギー対立軸を見極めることが必要である。新しいイデオロギー闘争はカーボン 極(ピーター・シンガー、動物権、自然に帰れ)とシリコン極(レイ・カーッウェ ル、スピリチュアルマシン、効率性の追求)を両翼とするものである。とすれ ば、そのあいだを媒介し緩衝する概念ないし概念構図はいかなるものであり得

ようか。

 なお、フラーによれば、近代以前のイデオロギー闘争において、身体的苦痛 の最小化を目指す極と、現世の終局を求める極のあいだで媒質として機能して いたのはウニヴェルシタスだった。ウニヴェルシタスはローマ法上の概念で あって、法人としての財産権を皇帝から下賜された団体である教会、ギルド、

大学などを指した(Fuller 2006:450)。

 フラーはこうしたく闘争〉の実態について何ら証拠を示していない。そのた め、フラーのく闘争史観〉はこのままではとても支持できない。しかし人々が陥 る困難や苦悩に対する応答としての知が、個々人の生を超えて持続する、人間 関係の全体性の心像を生み出し続けてきたこと、その歴史のなかに社会の概念 を位置づけようとしている点は意義深い。

2−5.盛山と左古の所説

 盛山によれば、これまで社会なるものの実在性の信愚を根底で支えていたの

は、複雑で多様な人間的諸事象の背後に、それらを可能にする単一のまとまり

(8)

あり秩序だった一体としての社会が存在するはずだ、というウアドクサ

(urdoxa,原信慧)だった。こんにちのく社会の終わり〉は、このウアドクサの 根底的な解体を示唆している。今後はく今現にある〉統一体としての社会の表象 の再建ではなく、〈未来にあるべき望ましい〉統一体に関する規範的な議論の再 建を図るべきである。

 左古は前三者が述べるような意味における社会が18世紀末から19世紀前半 に生成したことを再確認しつつ、①その初期の局面において社会的科学、社会 問題(social problem)、社会主義、そして社会学が果たした諸役割を検討する必 要があること、②社会の生成の前提条件として、16世紀以降ステート(国家)

の概念が形成され、③18世紀以降エコノミー(economy)概念が形成される諸系 譜を検討する必要があること、④近代に社会が置かれた位置に中世に置かれて いたウニヴェルシタス、コルレーギウムの概念系譜を検討する必要があるこ

と、そして、⑤今後の社会学と社会的科学のグローバルな展開のためには、漢 語、日本語における社会の概念系譜を踏まえる必要があること、を指摘してい

る。

 要するに、〈社会の終焉〉が緩慢に進行しつつあるこんにち、概念系譜学的な 基礎研究なしには、社会学および社会的科学にとっての最重要の概念である社 会がどのような意味において今後継承されうるのか、されるべきかを開かれた 議論の組上に載せることなどできようはずもないのである。社会学および社会 的科学にとって社会の概念系譜学は、この意味において不可欠的に必要である。、

 テクストマイニングが、こうした概念系譜学的研究を適切に実現するための 好適な手法であることはすでに述べた通りである。

3.準備の実際

 では、いよいよテクストマイニングの作業のデモンストレーションへと進も

う。

題材はトマス・ホッブズの『リヴァイアサンj(1651)とする。

 「リヴァイアサン」を選んだのは次の3つの理由による。①しばしば近代的

な社会思想の嗜矢とみなされる、〈社会の概念系譜学〉にとって不可欠の重要テ

(9)

クストであって、優先度が高い。②全48章、計20万語超という長大さが、テク ストマイニングの試金石として適している。③解釈をめぐって、比較的シンプ ルな争点が豊富に存在する。       ,

 そのような解釈上の争点は多岐にわたるが、ここでは、<社会の概念系譜 学〉にとって重要と思われる、①〈ホッブズは社会契約論者だったか〉、そし て、②〈ホッブズはステート(state)概念の近代的用法を確立したか〉という争点 を選び、テクストマイニングによって検討してみることとしよう。

 社会学や社会科学の概説書において、しばしばホッブズは最初の社会契約論 者の一人とされている(竹沢2010)が、それはどのような条件の下、どの程度、

妥当なのだろうか。そして、政治思想史においては、しばしばホッブズはス テートという語句の近代政治学的用法の確立者とされている(Skimer 1989)が、

それはどのような意味で、どの程度妥当なのだろうか。

 用いるソフトウェアはSPSS社製Text Analysis for SurveysのVersion 3.0(以下 SPSS Text Analysisと略記)とする。これは本来、質問紙調査における自由記述 欄の内容を分析することを目的として開発されたソフトだが、その用途にかぎ

らず、テクストマイニングにおける分析と究明の一通りを、単体で実現できる 点を評価して採用する。

3−1.クルード・コーパスの特定

 採用するコーパスは、Project Gutenberg<http:〃www.gutenberg.org1>に提供さ れている、Thomas Hobbes,工evjaεhan, or the matter, forme and power of a common−

wealth・ecclesiasticall・and civilの全文である。これは2002年5月、 Edward Whiteに よってus−ascii形式でエンコー一一ドされた約1.2メガバイトの電子テクストであ る一以下、White(2002)と略記する一。電子化の元となったのはCrawford Brough Macphersonの編集により、Pelican ClassicsのAC2として1968年に刊行さ れた版(ISBN:0140400028)である。2》

3−2.クルード・コーパスの洗浄

 クルード・コーパスの洗浄をおこなうには、テキストエディタを用いるのが

便利である。ここではサイトー企画製『秀丸』バージョン7,1を用いる。

(10)

3−2−1.不要部分の削除と、不要な改行記号の除去

 まずはWhite(2002)の冒頭からゴドルフィンへの献辞の前の行まで、そして FINIS の次の行以下末尾までを削除する。

 White(2002)は約80文字ごとに改行されているため、改行記号を取り除く必要 がある。次の手順でおこなうと高速かつ確実である。

     ①まず改行記号を、コーパス内で全く使われておらず見易くかつ        意味のない記号、たとえばソtに置換する。

     ②文字列 〃 が、元テクストにおける改行部分である。これをさ        らに別の記号、たとえば # に置換する。

     ③すると残された文字ソ は、元テクストにおけるスペース部分        である。これをL (スペース。以下同様)に置換する。

     ④ # を改行記号に置換する。

     ⑤不要なL (ダブルスペース)を一 に置換する。

3−2−2.スペリングの改訂

 ホッブズの『リヴァイアサン』は17世紀英語のスペリングで書かれているた め、そのままでは、現代語のみを対象としたspss TextAnalysisの自然言語処理 エンジンでの正確な分析が期待できない。そこでスペリングの改訂をおこな

う。

 White版(2002)における『リヴァイアサン」序文は次のように始まる。

     N。t。,e(the飢wh・・eby G・dha血madeand睡山ew・・ld)isby山e血

     of man, as in many other things, so in this also imitated, that it can make an      Mifi、i。1 A。im、L F。r・se・i・9・lif・・i・b・t・m・ti・n・f Limb・, th・麟      whereof is in some欝灘麺購part within;why may we not say, that all      A。t。m、ta(E・gi…th・t m・ve th・m・elve・by・pri・g・and灘鱗・・d・th・

     watch)have an趣life?

       【White=Sako(2010):Line#75−78.強調引用者.以下同様】

ここで網掛け強調した文字列が改訂を要する部分である。 governes ぱgoverns   に、・begining は beginning に、 principall は principal に・ wheeles は wheels に・

artificiall は artificial に、それぞれ改訂する。

(11)

 改訂した文字列を、テキストエディタのく検索・置換〉の機能を用いてコーパ ス全体で統一してゆく。 governes°、 begining1という文字列はコーパス内に各々 1箇所ずつしかないが、 principall 、 wheeles▽arti∬ciall は複数回用いられてい

る。

 なお、 principall と artificiall という文字列を適切に改訂するには、テキストエ ディタの置換前文字列のダイアログボックス内に量principall_ 、 artificialし\置 換後文字列のボックス内には principal_ 、°artificial:、と入力しなければならな い。さもないと改訂の必要がない副詞1principally と artificially が各々、

principaly と artificialy へと誤って置換されてしまうので注意を要する。クルー ド・コーパスの洗浄過程では、注意していてもこれに類するミスは起こり得る ので、頻繁にファイル名を変更のうえ保存すべきだ。

 以下、同様にスペル改訂をおこなってゆく。どの程度徹底的に改訂するか は、そのコーパスに対する分析者の関心のあり方と、分析者が投入できる労力 による。筆者は用いなかったが、マイクロソフト社製『ワード』をはじめとす るワードプロセッサのスペルコレクション機能が、あるいは便利かもしれない。

3−2−3.文法上の改訂、略号の統一、引用符号の除去

 17世紀英語はスペリングだけでなく、文法も、現代語と若干異なる。 『リ ヴァイアサン』において目立つのは、名詞の所有格の s と複数形のs が表記上 区別されないことである。例えばtGods という語は、現代語における所有格

GOd s を指している場合と複数形の GOds を指している場合がある。文脈に応じ て判断し、改訂するほかない。

 略号の不統一を改訂することも、後の作業を円滑にするためにおこなってお

くのがよい。例えばQueen Elizabeth°, Q. Elizabeth∵Qu. Elizazbeth を Queen Eliza−

beth「に統一し、 Saint Paul , St.Paul , S. Paul を St.・Paulに統一する。

 扱うコーパスが文献である場合、文中にしばしば引用符号が混入している。

分析者の関心によってはそれこそが決定的な重要性を持つ場合もあるが、ここ

では全て除去する。「リヴァイアサン』では聖書からの引用、聖書への参照を

次のような略号で示している。Exod.32.27. は『出エジプト記』第32章第27節を

あらわす。 Numbers・25.6,7. は「民数記』第25章第26,27節をあらわす。コーパ

(12)

スの前半ではこの略号が大部分oカッコで括られているが、後半ではほとんど 括られていないので注意を要する。

3−−2−5.テクストの分割(改行記号の追加)

 以上のように洗浄したコーパスを、最後に、SPSS TextAnalysisで読み込むこ とができるマイクロソフト社の『エクセル』形式(xlS)に変換する。

 表のセル1個に対してどの程度の量のテクストを流し込むかは、もちろん、

コーパスが異なるに応じて、また分析者の関心に応じてさまざまである。ここ ではテクストの意味の明白な区切り目を示す一文を単位とする。つまりピリオ ド、エクスクラメーションマーク、クエスチョンマークで改行をおこなう。た とえば第1章冒頭の1パラグラフを次の要領で分割する。

     ①Nature(the art whereby God has made and govems the world)is by the        art of man, as in many other things, so in this a lso imitated, that it can

       make an Artificial Anima1.

     ②For seeing life is but a motion of Limbs, the beginning whereof is in        some principal part within;why may we not say, that all Automata        (Engines that move themselves by springs and wheels as does a watch)

       have an artificial life?

     ③For what is the Heart, but a Spring;and the Nerves, but so many        Strings;and the joints, but so many wheels, giving motion to the whole        Body, such as was intended by the Artificer?

     ④Art goes yet further, imitating that rational and most excellent work of        Nature, Man.       【White=Sako(2010):75−78]

 spss TextAnalysisが、 xls形式からデータソースをインポートした場合、1セ

ルに流し込むことのできる字数の上限は4,㎜字である(英語版での公称。語数

ではなく字数である。スペースを含み4,000字である)ので注意を要する。一文

の字数が4,000字を超えてしまうセルがあり、そのセルが分析対象となるケース

とならないケースで分析結果に相違が生ずる場合は、その旨注記すべきだろ

う。場合によってはコロン、セミコロンでも改行するというルールの適用など

も検討すべき場合があるだろう。

(13)

 以上によって5,634行からなる『リヴァイアサン』リファインド・コーパスが 得られる。これをWhite=Sako(2010)と呼ぶ。3}

4.分析の実際

 テクストマイニングソフトSPSS TextAnalysisを起動し、データソースとして さきほど作成したWhite=Sako(2010)を選択すると、自動的に自然言語処理がス タートする。

 自動自然言語処理が終了すると、次のような画面が現れる。

絡輔叢銘。,;,

左下のボックスには、コーパス内で用いられている語句群が抽出され、出現 回数が多い順にリストされている。まずは抽出された語句群をすべて丁寧に チェックしよう。もし分析者の関心にとって必要な語句が抽出されていないよ うなら、さきの自然言語処理の手続きを手動で修正する必要がある。

SPSS TextAnalysisにおけるく出現回数〉とは、〈その語句が出現したセルの数〉な

(14)

ので注意を要する。つまり1セルのなかで同じ語句が複数回出現していても、

1回としてカウントされている。例えば次の行における dream°は2回ではなく1 回である。

     And seeing麟are caused by the distemper of some of the inward par山s      ・fthe B・dy;divers distem匹rs must needs cause dif免rent繍繍.

       [White=Sako(2010):141】

4−1.分析に用いる語句の選択

 自動抽出された語句群のなかから分析者の関心に照らして重要なものを、左 上のボックスにドラッグ・アンド・ドロップしてゆく。この左上ボックスに収 めた語句群が今後の分析対象となる。あまり多くの語句を選んでしまうと後の 作業が過度に複雑になるので、最初は出現回数が特に多い語句のなかから、決 定的に重要なものだけを選ぶべきだろう。ここではWhite=Sako(2010)において 10回以上出現する語句のなかから、 sovereign 、 common−wealth 、 civil 、

lnature 、 oeople 、 kingdom 、 govemment 、 state 、 contract 、 society を選択

した。この過程では、クリックした語句を含むセルの内容が、右ボックスにリ ストされる。

 その上で、これらキーコンセプトに、左下からさらに語群を取り込んでゆく。

キーコンセプト sovereign には sovereignty 、 civil sovereign などを当然含めるべ きだろう。キーコンセプト contract には、 agreement 、 pact 、 covenant も含めて みた。他のキーコンセプトも同様に処理する。この作業を一通り終了したとζ ろで、これらキーコンセプトの相互関係がどうなっているか概観してみよう。

4−2.図を用いた分析

 左上ボックスでAll Recordsを選択してから、右上ボックスのCategory Webを 選択し、Grid Layoutで描画すると、次ページ上の図が得られる。

 マルの大きさは各キーコンセプトの出現頻度の高さをあらわす。量sovereign 、 lcommon−wealth 、「nature の出現頻度の高さに対して、 society 、 state 、 govem−

ment の出現頻度は低いことが分かる。

 マルをつなぐ線は、複数のキーコンセプトが1セル内一White=Sako(2010)

においては一文と同義一で共起していることをあらわす。線の太さは共起頻

(15)

度の高さをあらわす。 sovereignt、 common−wealthl、 nature は出現頻度が高いた め、共起頻度も高いのは当然だが、Igovemment は出現搬の低さ。こも関わら ず、 sovereign 、 common−wealth 、°nature と共起しがちである。これは同じく出 現頻度が低い SOCiety曾と State Gこはない、°90vemment の特徴である。

 次に各キーコンセプトが他のいくつのキーコンセプトと共起しているかをみ る。右上ボックスでCategory Webを選択し、 Circle Layoutで描画すると、下の 図が得られる。

.袈:t

∴翫:・漁vも鱒enl

(16)

ほとんどのキーコンセプトが、他の全て(10個)と共起していることが分かる。

出現頻度が低く、 sovereign 、 common−wealth°、 Inature との共起頻度も少ない state°でも9個のキーコンセプトと共起している。それに対して、 society°は7個 のキーコンセプトとしか共起していない。 society は state 、 kingdom 、°public と いう3個のキーコンセプトと全く共起していないのである。

 ここで仮に、出現頻度の高さを、コーパス内におけるそのキーコンセプトの く重要性〉と解し、共起頻度の高さを、それらキーコンセプト間のく関係の強

さ〉と同義とする4)と、次の解釈が成り立つ。

 《ホッブズの『リヴァイアサン」は主権とコモン=ウェルス、および自然の 相互関係を中心に論じた書である。ホッブズは社会もステートもほとんど主題 的に扱っていない。したがってホッブズをく近代的な社会思想の噛矢〉であると

したり、〈社会契約論の始祖〉であるとするのは疑わしい。近代政治思想の根本 概念であるステートを樹立したとする説も疑わしい》。

5.究明の実際

 では、この解釈の妥当性をいくつかの角度から検証しよう。

5−1.社会契約

 White=・Sako(2010)のなかでキーコンセプト society は、25個の文においてしか 用いられておらず一 sociable という形容詞と゜sociably という副詞を含め

て一、しかも他のキーコンセプトとのあいだの関係も比較的薄い。 Social と いう形容詞は1回も出現せず、したがって当然、 social・contract という成句の出 現も0件である。

 SPSS TextAnalysjsの左上ボックス内の society をクリックすると、右ボックス にはキーコンセプト society を含むセルがリスト表示される。そのなかで1soci−

ety と contract が共起している文が、わずかに1件ながら存在する。

     But the most noble and profitable invention of all other, was that of Speech,

     consisting of Names or appellations, and their connection;… without      which, there had been amongst men, neither Common−wealth, no曝簸i鎌,

     nor鍵欝鐵騰, nor Peace, no more than amongst Lyons, Bears, and Wolves.

(17)

      [White=Sako(2010):226]

コモン=ウェルス、社会、契約は、〈言葉(speech)なしにはあり得ないもの〉と して並べて言及されている。この言葉の並び順は、ことさらく契約によって社 会を作られ、コモン=ウェルスが生ずる〉などといった関係を表現するもので はない。ライオン、熊、狐が、〈言葉を持たない動物〉として並べられているの と同じだと考えるべきだろう。したがって、やはりWhite=Sako(2010)におい て、社会と契約のあいだに有意な相関があるとは言い難い。

 しかしそれでもまだ次のような当然の異論が残るだろう。ホッブズが社会契 約論者か否かは、そもそも、ホッブズがく社会契約〉という語句を用いたか否か で決まるのではない。今日から振り返って《安定したコミ4ニケーションは、

人々相互の約束によって可能になる》とまとめることができる思考パタンを、

ホッブズがロックやルソーと共有していた、とする整理が可能であって、この       s

思考パタンを社会契約論と呼ぶ。ホッブズは実際の著作においては国家などの 語も用いて、この思考範型を表現している。したがってこれを社会契約説と呼 ばず、国家契約説と呼ぶことも等しく可能だ。

 この異論に対する、テクストマイニングを用いた概念系譜学の立場からの応 答は次のとおりである。①この思考パタンが本当に存在するかどうか、そし て、②この思考パタンをことさら社会契約説と呼ぶ言論習慣がいかにして形成 され定着したかは、テクストマイニング手法を用いて解明されるべき、<社会 の概念系譜学〉の重要な課題である。

①について。これは主要な著述家の主要な著作を電子コーパス化し、マイニ ングし、 contract およびそれに類するキーコンセプトがその他の語句とのあい だに持つ諸関係を比較すれば解明できる。

②について。ホッブズの時点では決して重視されていたとは言えない society

が、その数百年後には、多様な言論を整理するために分析者が作るカテゴリー

のラベルとして採用されるような、そんな重要な地位へと大躍進を遂げた。し

かもそのあいだに、 society は国家と同じ意味を持つ語として理解されるように

なった。これら2つの事実こそが興味深い。その過程をテクストマイニングを

用いて辿ることは、電子コーパスの制作や洗浄、自然言語処理にかかる時間

(18)

的、金銭的コストの問題は当然あるものの・原理的には可能である。

5−2.ステート

 スキナーによれば近代政治学におけるtstate の概念は、特定の支配者人格の生 死から自律して存続するものとして支配体制を捉えることを最大の特徴とす る。この意味における雪state概念の確立はホッブズにおいてなされた

(Skinner1989)o

 すでにみたように、White・・Sako(2010)のなかで支配体制を含意しうるキーコ ンセプトのなか出現頻度が最も高いのは、 common−wealth である(424回)。次い で kingdoml、(241回)、 government (135回)が多く、 state の出現撮は最も低い

(97回)。したがってtstate°は主題的な扱いを受けているとは言えない。ホッブズ のstate概念がその後の政治的言論の趨勢を決定づけたことを説得的に説明する のは容易でない。

        

 まずはキーコンセプト state がスキナーの言う意味で用いられている用例をリ ストアップし、その特徴を検討しよう。

 キーコンセプト state と person電は3箇所で共起している。しかし state をく不死 のtperson°を持つ〉だとか、〈 person を持たない〉と説明しているわけではない。

 特定の支配者の生死に依存せず存続する支配体制としでstate に言及している と考えられる文は、 personではなぐsoul を用いているものの、1箇所、確かに 存在する。序章の前半である[White=Sako(2010):75】。序章、しかもその前半と いう出現箇所に特別重要な意味を認めるならば、スキナーの主張にもひとまず 一理を認めることができそうだ。

 ただし最後まで読めばわかるように、この一文は、生身の人格とは異なる、

state という人工人間は内乱によって死璽、と言っているのである。実はこの一 文だけでなく、キーコンセプト state のリストを読んでゆくと、 state はそのく存 続》よりも、そのく不在〉やく解体〉を述べる場面で用いられる傾向が強いと言える。

     ○…LEVIATHAN called a COMMON−WEALTH, or鍵灘講,(in Latin      CIVITAS)which is but an artificia1 Man;…and簾難繍蟻i難繊顯.

       【White=Sako(2010):75]

(19)

     the sightS of the 灘灘s of any other State, will guess, the like war…

      【White=Sako(2010):209]

     ○...Most effectual seeds of the鎌鐵繊of any雛灘…

       [White=Sako(201q):5581】

こうした用例が散見される・・一一一一方で、 state°のく存続〉を強調する用例は、計40個 の文のなかに1件もない。したがって、やはりく近代的な state概念のホッブズに おける確立〉を主張するのは難しそうに思われる。

 しかしそれでもまだ次のような当然の異論が残るだろう。或る概念は別の語 句でも言いあらわされる。スキナーが他の著作のなかでジャン・ボーダンにお ける republique概念について説明している(Skinner 1978=2009:634−637)ように、

ホッブズは common−wealth という伝統的な語句を用いつつ、それに事実上 state の意味を託しているのだ、と。

 この異論に対して、テクストマイニングを用いた概念系譜学は、さきほどの く社会契約と国家契約の同一説〉に対するのと同様の仕方で応答する。ただしス

キナーとしては、第2の応答は言わずもがなであろう。スキナーにおける思想 史的思考には概念系譜学と共通する側面が多々ある。いや、コンピュータを用 いた高度な情報処理技術なしに、事実上概念系譜学を試行しているとさえ言え

る。

では、White=Sako(2010)における cornmon−wealth と゜contract の検討に移ること としよう。

5−3.コモン=ウェルス、人格、主権

 キーコンセプドperson と common−wealth は32箇所で共起している。 soul と common−wealth は6箇所で共起している。これら合計38箇所のうちキーコンセ プト゜sovereignty とも共起しているのは18箇所である。大変高い確率での共起で あると言える。

 これら18箇所のうちぐsovereignty は common−wealth の person である〉との言明

が含まれているのは、15箇所である。これら3つのキーコンセプトのあいだに

は、ほとんど成句と言ってよいほどの強い絆があると見てよさそうである。例

えば次のように。

(20)

soUI

儀ム・.、.

can do nothing but by the蕪懸嚢難that Represents it, it is the act only of the

      [White=Sako(2010):2120】

[White=Sako(2010):2708]

      【White=Sako(2010):2780]

この3者のあいだの関係について決定的な説明をおこなっていると思われるは 次の一文である。

      【White=Sako(2010):2245】

つまり、コモン=ウェルスはそれ自体としては人格ではない。コモン=ウェルス を代表・表象・代理(represent)する主権が人格である。現実としては人格を持 たないコモン=ウェルスはコモン=ウェルスではありえないのだが、言語上・論 理上、コモン=ウェルスと主権は弁別されるべきものである。したがって、次 のように、コモン=ウェルスには意志塑とも説明される。

     …a購叢蔭繊鱗難has no Will, nor makes no laws, but those that are

(21)

     made by the Will of him, or them that have the鱒難灘難i蟻Power…

       [White=Sako(2010):2245]

 以上から判明するように、スキナーテーゼ、つまり《ホッブズが近代政治思 想の根本概念であるステートを樹立した》は、それがコモン=ウェルスという 語句によって言いあらわされているとする限りで、妥当性が検討される余地を 持つ。しかしそれならば課題をもっと徹底的に概念系譜学的に捉えなおし、同 じ過程をコモン=ウェルスの意味変遷として追跡してみることのほうが研究戦 略上有利だとも思われるが、どうだろうか。5)

5−4.国家契約

 すでに前節から明らかだろうが、〈社会契約説イコール国家契約説〉論者の言 い分を検証するためには、そこで言う社会の意味もさることながら、国家が

state なのか、 common−wealth なのか、あるいは゜kingdom なのか、はたまた響gov−

emment なのか、究明する必要がある。議論をシンプルにするために予め答え を言ってしまえば、ホッブズがく契約によって形成される〉と述べているのは、

これら4つのいずれの国家でもなく、主権なのである。

 キーコンセプト contract°を基準として、共起関係を探索してみればよい。

state°との共起が2回、 government が5回、 kingdom が11回、 common−wealth が20

回、そして sovereign「が27回である。

(22)

   すでに前節で common−wealth と sovereign概念の弁別、論理的関係については   或る程度説明したものとし、ここでは両キーコンセプトがそれぞれ contract と   どう関わっているかを考察しよう。その違いを際立たせるために、壁common−

  wealthlと sovereign 、そしでcontract がすべて共起している10個の文を考察から   除外する。

   〈契約によってコモン=ウェルスがつくられる〉ないしく契約がなければコモン

・ =ウェルスもない〉という意味を含むようにも解釈可能な文は、かなり緩めに解   釈しても3箇所しかない。

       ①. , .i.iii .. i、.i.麺.i棄

         Pers。n,。f wh。、e A・t・a 9reat・M・1tit・d・, by m・t・・1難購繍・ne          with another…       [White=Sako(2010):1498]

       ②

      【White=Sako(2010):1799】

       ③…山ekingdom of God, is properly meant a鹸辮灘馨, insti−

         tuted(by the議鱗i蕪織of those which were to be subject thereto)fbr          their civil Government…       【White=Sako(2010):3389]

  これに対して、〈契約によって主権がつくられる〉ないしく契約がなければ主権   もない〉と端的に述べている文のみを抽出する厳しい方法を採っても10箇所あ   る。

[White=Sako(2010):1273】

【White=Sako(2010):1519】

【White=Sako(2010):1529】

【White=Sako(2010):18771

of the Subjects°°°

【White=Sako(2010):2693】

(23)

     ⑥

      [White=Sako(2010):2864]

     ⑦

      【White=Sako(2010):3004】

     ⑧  …an Institution by灘襲, of Go(rs peculiar護騰灘褻獺譲over the seed        of Abraham;which in the renewing of the same醸籔繊雛毒by Moses…

      [White=Sako(2010):3379】

     ⑨…The kingdom Of G(rd・ls…His Civi壌購鱒灘難Over A Peculiar        People By欝譲…      【White=Sako(2010):3380]

     ⑩

   r       eve1yone of those that are to be governed・・。

      [White=Sako(2010):4630】

次の文も加えてよいなら11箇所である。

       …we are not now under any other Kings by繋欝, but our Civi1麟繋i        灘灘…      【White=Sako(2010):4902]

屍理屈のように聞こえると心外なので念のため説明を加えておくが、<契約に よってつくられるのは主権であって、コモン=ウェルスではない〉と言うのは、

<支配体制の諸機関は契約に先立って予め存在し、それら機関を動かす人格、

意志、あるいは力(power)が契約によってあらしめられる〉ということである。

これはホッブズ国家論全体の理解にとっても重大な意味を持ちうる事実であろ

う。

 兎も角も、ホッブズを社会契約論者と呼ぶことだけでなく、国家契約論者と 呼ぶことも、White=Sako(2010)のテクストマイニングによる限り、あまり正し

くない。ホッブズは、正しくは主権契約論者なのである。この主張が気に入ら

ないならくホッブズにおける主権イコール社会〉と言える根拠を示せばよい。あ

まり生産的な議論になるとは思えないが、社会は存外、持ち前の可塑性を発揮

するかも知れない。

(24)

6.まとめ

 以上、テクストマイニング手法によるコーパスの分析を試行した。そこで示 された、コーパス内における諸語句の出現頻度と共起頻度の分析がもつ二大効 能をまとめて、本稿を閉じるとしよう。

 ①通常の読む行為においては踏襲されやすい通説的解釈に対して批判的な諸 論点を、証拠をあげながら提起できた。ホッブズを社会契約論者と呼ぶ常識的 理解を疑義に曝すだけでなく、そのような疑義を受けて国家契約論者と呼びな おすことの疑わしさも追及できた。ホッブズにおけるステート概念について

も、その歴史的重要性を指摘したスキナーの真意を汲みながら批判的に吟味で

きた。

 ②通常の読む行為からは得がたい新しい知見を、実証的に策出できた。『リ ヴァイアサン』において、契約によって作り出されるのは支配のための諸機関 ではなく(それらは契約以前に存在する)、コモン=ウェルスでもなく、コモ ン=ウェルスの主権なのだった。これはホッブズにおける自然状態とは何なの かの再解釈を要求する重大な事実である。

 こうした効能は、特に歴史的なテクストの解釈だけに認められることではな く、ライフヒストリー的資料や質問紙の自由回答欄の分析、判例研究やクレー ム分析、各種の談話分析、官公庁に寄せられる電子メールの内容分析などでも 同じように確認できるはずだ。

 概念系譜学の観点からは、もっと巨大で長い期間に分布するテクストから成 るコーパスー数十年、数百年にまたがるテクスト群から成るギガバイト単位 やテラバイト単位のコーパスーの分析においても同じ効能が発揮されるもの と期待できる。例えば19世紀英国の二大論壇誌Westmjnster Revie vv(1824.1gl4)

とQuarterly Revievv(1809−1967)のコーパスから、論点の変遷や、主要な語句の意 味変遷を読み解くような概念系譜学的研究を、テクストマイニング手法を用い

ておこなうことなどが有望だろう。

(25)

1)そのような研究として、すでに公開されている業績のなかで代表的なのは(樋口  2005)、(鈴木2006)だろう。(岡本・笹野2001)と(左古2007)はコンピュータこそ用いてい  ないが、着想の基軸や対象の設定は前三者とよく似ており、かつ前二者とは異なり歴  史的な関心を前面に押し出している。

2)White(2002)と、その元となったMacpherson(1968)の相違については、 White(2002)の  冒頭 TRANSCRIBER S NOTES ON THE E−TEXT を参照。 Leviathanのおもなエディ  ションとしては、ここで採用するWhite(2002)と、その元となったMacpherson(1968)以  外に、1651年の初版(Head版)、1668年のラテン語版、 Molesworth(1839)、 Tuck(1991)、

 Curley(1994)がある。詳細は本稿末尾の参考文献リストを参照。

3)これら2つの作業仮説は常識感覚にはかなり適合するが、当然ながら、あらゆる作業  仮説と同様、限界や欠点を意識しながら用いる必要がある。

  出現頻度が低いことは、必ずしもその語句がコーパス内で重要でないことを意味し  ない。例えばハーレクインロマンスの或る一編に、〈愛〉という語句が一度も現れない  ことは大いにあり得ると思われるが、だからといってその一編においてく愛〉が重要で  ないと主張するのはおそらくひどい間違いだろう。

  共起性が高い場合、〈強い関係〉の質が当然問題になる。例えばく善〉とく悪〉といった  語の共起と、〈心臓〉とく拍動〉といった語の共起は性質が異なるから、たとえ同じ頻度

で用いられているからといって同列に並べて論じるべきではない。

4)このWhite=Sako(2010)を、本稿に示した『リヴァイアサン』分析の検証に目的を  限って、研究者にのみ配布する。配布を希望する研究者は電子メールにて依頼された

 レ、o <電dsak(@tmu.ac.jp>

5)私見によればもっとよい解決がある。ホッブズにおける state という語句の用いられ 方をもっと詳細に検討すれば、スキナーが述べたのとぽ別の意味ではあるが、ホッブ ズはやはり゜state 概念の確立者であると言える。左古(2009a:16−19)、左古(2009b:70)。

文献

Beck, Urlich.,1997=2000:What is Globalization?P.Camiller(tr.), Polity,

Billig, Michae1.,1995:Banal Nationalism, Sage.

Dubet, Frangois.,&Danilo Martucceli,1998:Dams Quelle Soci6t6〜 Vivons−Nous?Seuil.

Fuller, Steve.,2008:The Ne w Sociological lmagination, Sage.

Giddens, Anthony.,1987=1998:『社会理論と現代社会学』藤田弘夫監訳、青木書店。

樋口耕一、2005:『計量テキスト分析の方法と実践』 (大阪大学大学院人間科学研究科平     成16年度博士論文)。

Hobbes, Thomas.,1651:Leviathan, London:Andrew Crooke at the Green Dragon(Head Edition).

Hobbes,1651=1668:Leviathan in Opera Philosophica, Amsterdam:Apud loannem Blaeu.

Hobbes,1651=1839:Leviathan, in The English works of Thomas Hobbes, William

    Moleswonh(ed.), London:John Bohn, Longman.

(26)

Hobbes,1651=1968:Leviathan,(Pelican C萱assics AC2), Crawford B. Macpherson(ed.), Penguin     Books.

Hobbes,1651=1991:Levjathan, Richard Tuck(ed.), CUP.

Hobbes,1651=1994:Leviathan, Edwin Curley(ed.), Hackett.

岡本智周・笹野悦子、2001:「戦後日本の「サラリーマン」表象の変化一『朝日新聞』

    を事例に」 『社会学評論』205号、16−32頁。

左古輝人、2007:「何が社会と呼ばれていたか 明治期の用例研究」 『現代福祉研究』7     号、207−224頁。

左古、2008:「社会概念の再検討 近年の動向と展開へのてがかり」 『人文学報』392     号、131−153頁。

左古、2009a:「国家はどこから来てどこへ行くのか P・ボビットに寄せて」『人文学     報』407号、1−21頁。

左古、2009b:「国家と社会の概念系譜学的素描」、佐藤成基編『ナショナリズムとトラ     ンスナショナリズム』法政大学出版局、53−72頁。

skinner, Quentin.,1978=2009:『近代政治思想の基礎』門間都喜郎訳・春風社。

skinner, Quentin.,1989: State , Political innovation and Conceptual Change・ CUP・PP・90−131・

盛山和夫、2005:「構想としての探究」、 『〈社会〉への地 現代社会学の理論と方法     上』、勤草書房、11−32頁。

鈴木努、2006:「二〇〇五年衆議院選挙における三大紙の社説比較」 『マス・コミュニ     ケーション研究』69号、2−21頁。

竹沢尚一郎、2010:『社会とは何か』中公新書。

Uπy,John.,2000=2006:『社会を越える社会学』吉原直樹監訳、法政大学出版局。

Wallerstein,夏mmanue1.,1987: World System Analysis慰 ,Tumer&Giddens(eds.), Social Theory

    Today, Polity・

参照

関連したドキュメント

かれた議論の対象となっているわけである。さらに

 2 度の世界大戦を経験してからフランスとド イツを中心にして EU が形成されましたけれど も、私はこれを、 European-Citoyen 、あるい は

環境エネルギー 特集 1 1 低速モータドライブは、 高トルクを実現するが、

飲酒行動 に関連する心理社会的要因 としては,男 女 とも飲酒す る友達が多いほ ど,活気が高いほ ど, 飲酒頻度が多かった。 また,女子では,友達か ら飲

原著論文では、まず次の前提が明確化されて いる。ヒト EST ① 配列を解析し、遺伝子総数を推定 した研究では、使用したヒト EST のデータベース ② の中で出現頻度 1

子どもの年齢が上がるほど有意に得点が高かった。さ

い )

 起き始めたことにどう対処するか