• 検索結果がありません。

コーパス言語学 : 言語教育への応用と分析の実際

N/A
N/A
Protected

Academic year: 2021

シェア "コーパス言語学 : 言語教育への応用と分析の実際"

Copied!
23
0
0

読み込み中.... (全文を見る)

全文

(1)

Title

コーパス言語学 : 言語教育への応用と分析の実際

Author(s)

金城, 克哉

Citation

九州地区国立大学教育系・文系研究論文集, 2(1)

Issue Date

2014-10

URL

http://hdl.handle.net/20.500.12000/43387

Rights

(2)

コ ー パ ス 言 語 学 :

言 語 教 育 へ の 応 用 と 分 析 の 実 際

金 城 克 哉

世 紀 が 変 わ る 前 後 か ら 盛 ん に 研 究 の 場 で も 教 育 の 場 で も 「 コ ー パ ス 」 と い う 言 葉 を 耳 に す る よ う に な っ た 。「 コ ー パ ス に 基 づ く ○ ○ の 研 究 」と い っ た も の か ら 、「 コ ー パ ス を 利 用 し た 辞 書 」(『 コ ウ ビ ル ド 英 英 辞 典 』・『 ウ ィ ズ ダ ム 英 和・和 英 辞 典 』等 )、ま た 国 立 国 語 研 究 所 が 構 築 を 進 め て き た「 書 き 言 葉 均 衡 コ ー パ ス 」 と い っ た も の ま で 様 々 な 用 い ら れ 方 を し て い る 。ま た 、NHK の 英 会 話 番 組「 100 語 で ス タ ー ト ! 英 会 話 」( 2003~ 2005 年 放 映 ) で は 「 コ ー パ ス く ん 」 と い う キ ャ ラ ク タ ー が 登 場 し 、 こ の 「 コ ー パ ス 」 と い う 言 葉 が 一 般 に 広 く 知 ら れ る よ う に な っ た ( 投 野 2006)。 ま た 世 紀 が 改 ま っ て 以 降 、 現 在 ま で に 様 々 な コ ー パ ス 関 連 の 論 文 や 書 籍 が 世 に 出 た が 、 あ ら た め て こ の 「 コ ー パ ス 」 と は 一 体 何 な の か を 問 わ れ る と 一 般 の 人 は も と よ り 言 語 研 究 を 専 門 と し て い る 者 で さ え 、 答 え に 困 っ て し ま う こ と も 少 な く な い 。 コ ー パ ス は 言 語 研 究 や 言 語 教 育 と ど の よ う な 接 点 を 持 つ も の な の で あ ろ う か 。 本 論 で は コ ー パ ス を め ぐ る 基 本 的 な 事 柄 か ら そ の 応 用 、 簡 単 で は あ る が 実 際 の 分 析 の 手 順 ま で を 概 観 す る こ と を 目 的 と す る 。

1. コ ー パ ス と は 何 か ?

Longman Active Study Dictionary で は 、 Corpus を “ a large collection of written or spoken language, used for studying the language” と 定 義 づ け て い る 。 訳 す と 「 言 語 研 究 に 用 い ら れ る 書 き 言 葉 ・ 話 し 言 葉 双 方 の 膨 大 な 集 積( 物 )」と な る で あ ろ う か 。し か し な が ら 、こ れ だ け で は 大 変 大 雑 把 な 説 明 で 具 体 的 に ど う い っ た も の を 指 す の か わ か り に く い 。前 川 (2009:7)は 次 の よ う に コ ー パ ス を 特 徴 づ け て い る :

(3)

言 語 研 究 の た め の 大 規 模 な デ ー タ 。対 象 と す る 言 語 に お い て 実 際 に 用 い ら れ た 用 例 を 、そ の 言 語 の 実 情 を 正 確 に 反 映 す る よ う に 組 織 的 に 収 集 し て 、公 開 し た も の 。通 常 コ ン ピ ュ ー タ で 利 用 す る 。品 詞 情 報 な ど の 検 索 用 情 報 を 付 加 し た も の も 多 い 。

コ ン ピ ュ ー タ の 普 及 以 前 の 言 語 研 究 に お け る 用 例 収 集 は 、 書 籍 を 購 入 し 、 そ の 中 か ら 用 例 を 探 し 出 し 、 ノ ー ト や カ ー ド に 抜 き 書 き や 切 り 貼 り を す る と い う 大 変 労 力 の 要 る 作 業 を し て い た 。 し か し な が ら 、 パ ー ソ ナ ル ・ コ ン ピ ュ ー タ が 個 人 レ ベ ル で 活 用 で き る よ う に な り 、 従 来 は 個 人 で 取 り 扱 う こ と の 難 し か っ た 大 量 の デ ー タ ( コ ー パ ス ) を 利 用 し た 言 語 調 査 ・ 研 究 が 可 能 に な り 、 教 育 へ と 応 用 さ れ る よ う に な っ て き た ( 梅 咲 2005)。

2. な ぜ コ ー パ ス を 利 用 す る の か ?

Chomsky が 言 語 研 究 の 目 標 を 言 語 能 力 の 解 明 に 設 定 し て 以 来 、 理 論 言 語 学 は 主 に 研 究 者 の 内 省 に 基 づ い て 文 の 適 格 性 の 判 断 が な さ れ て き た 。 Chomsky が 非 文 と し た *Colorless green ideas sleep furiously と い う 有 名 な 文 を 目 に し た こ と が あ る 方 も 多 い と 思 う 。 こ の よ う な 例 に 限 ら ず 、 文 法 の 中 心 を 成 す 統 語 論 の 議 論 は 、 そ の ほ と ん ど が 研 究 者 の 内 省 に よ っ て 作 成 し た 文 を も と に 構 成 さ れ て き た 。 し か し な が ら 、 こ の よ う な 文 法 性 の 判 断 は 言 語 事 実 に 反 す る デ ー タ を 是 と し た り 、 研 究 者 の 個 人 語 (idiolect)に 影 響 さ れ た り す る 恐 れ も あ る ( 赤 野 他 )。そ の 一 方 、Chomsky の 目 指 す 言 語 理 論 と の 比 較 で 言 う な ら ば 、コ ー パ ス の 果 た す 役 割 は 特 定 の 文 法 理 論 の 構 築 に 貢 献 す る と い う よ り は 、 よ り 「 経 験 主 義 的 な 言 語 記 述 」( 齋 藤 他 2005: 4)を 目 指 し た 一 つ の 方 法 論 と い う こ と が で き る だ ろ う 。 研 究 と い う 側 面 か ら 言 え ば 、 具 体 的 に は 当 該 言 語 の 大 量 の 運 用 サ ン プ ル を 収 集 し 、 コ ロ ケ ー シ ョ ン 情 報 ( 後 述 ) や 文 法 情 報 、 文 体 情 報 、 社 会 言 語 学 的 情 報 な ど 様 々 な 情 報 を 容 易 に 検 索 し 得 ら れ る 点 に あ る( 大 曾 2006;砂 川 2011;

真 島 2011)。 さ ら に 、 言 語 教 育 と い う 視 点 か ら コ ー パ ス を 見 る と 、 実 際 の 言 語 の 使 用 状 況 が 把 握 で き る こ と で 、 そ れ が 教 材 開 発 や 教 材 分 析 へ と つ な が る ( 石 川 2008)。 ま た 学 習 者 の 産 出 し た デ ー タ を も と に 誤 用 の 傾 向 を 分 析 す る ば か り で な く 、 学 習 者 自 ら が 主 体 的 に 学 ぶ と い う 学 び の 変 化 へ と つ な が っ て い く 可 能

(4)

性 を 持 つ と 言 え る 。

3. ど の よ う な コ ー パ ス が あ る の か ?

新 聞 記 事 を CD-ROM 化 し た も の 、ま た( 利 用 は 一 部 の 者 に 限 ら れ て い る が )大 学 図 書 館 な ど を 通 じ て 利 用 で き る オ ン ラ イ ン の 新 聞 記 事 デ ー タ ベ ー ス や 雑 誌 デ ー タ ベ ー ス な ど は 「 広 義 の コ ー パ ス 」 と 呼 ば れ 、 言 語 研 究 の 目 的 の た め に デ ザ イ ン さ れ た コ ン ピ ュ ー タ 処 理 が 可 能 な 大 規 模 な デ ー タ と い う「 狭 義 の コ ー パ ス 」 と は 区 別 さ れ る 。 で は 後 者 の コ ー パ ス に は ど の よ う な も の が あ り 、 い か に 活 用 さ れ て い る の だ ろ う か 。 以 下 、 代 表 的 な コ ー パ ス を 紹 介 し よ う 。

3.1 ブ ラ ウ ン ・ コ ー パ ス (Brown Corpus)

上 述 し た よ う に 、 コ ー パ ス か ら は 様 々 な 情 報 を 得 る こ と が で き る が 、 特 定 の 1 冊 の 本 を 対 象 と し た 語 彙 研 究 や 索 引 作 成 等 で は な く 、 広 く 当 該 言 語 の 書 き 言 葉 も し く は 話 し 言 葉 の 代 表 サ ン プ ル と し て の コ ー パ ス を 構 築 す る た め に は ど の よ う な ジ ャ ン ル か ら ど の 程 度 サ ン プ リ ン グ を 行 う か と い う 綿 密 な 計 画 が 必 要 と な る 。 ブ ラ ウ ン ・ コ ー パ ス は そ う い っ た 計 画 に 基 づ い て 構 築 さ れ た 世 界 初 の 電 子 コ ー パ ス で 、 Brown 大 学 の W.N.Francis と H.Kucera に よ っ て 1964 年 に 完 成 し た も の で あ る 。総 語 数 は 約 100 万 語 、1961 年 の 編 集 当 時 に ア メ リ カ で 出 版 さ れ た 書 籍 や 新 聞 等 16 の テ キ ス ト カ テ ゴ リ ー を 代 表 す る 500 の テ キ ス ト か ら そ れ ぞ れ 平 均 2,000 語 を 抽 出 し て い る 。 こ の よ う に 、 単 に 入 手 可 能 な 書 籍 か ら 任 意 に 一 定 の 語 数 を 抽 出 す る の で は な く 、 明 確 な 設 計 に 基 づ く コ ー パ ス で あ る と い う 点 で も こ の ブ ラ ウ ン・コ ー パ ス の 持 つ 意 義 は 大 き い( 赤 野 2006,後 藤 2003)。

3.2 ブ リ テ ィ ッ シ ュ ・ ナ シ ョ ナ ル ・ コ ー パ ス (British National Corpus) こ れ は 1991 年 に 収 集 が 始 め ら れ 1994 年 に 完 成 し た イ ギ リ ス 英 語 の 書 き 言 葉 ・ 話 し 言 葉 双 方 の 様 々 な ジ ャ ン ル を 代 表 す る 1 億 語 か ら な る 大 規 模 な コ ー パ ス で あ る 。 そ の う ち 書 き 言 葉 は 全 体 の 90%を 占 め 、 地 方 紙 ・ 全 国 紙 の 新 聞 を 始 め 、 専 門 誌 か ら 一 般 大 衆 向 け の 雑 誌 ・ 小 説 、 手 紙 の 類 に 至 る ま で 様 々 な テ キ ス ト か ら 構 成 さ れ て い る 。 話 し 言 葉 の デ ー タ は 全 体 の 10%程 度 で あ り 、 社 会 階 級

(5)

や 年 齢 ・ 地 域 の 異 な る ボ ラ ン テ ィ ア が 録 音 し た 会 話 資 料 、 ビ ジ ネ ス シ ー ン か ら 国 会 の 会 議 、ラ ジ オ 番 組 ま で 、こ ち ら も 様 々 な テ キ ス ト か ら 成 る 。1994 年 の 完 成 後 は 新 し い テ キ ス ト は 加 え ら れ て い な い が 、 2001 年 と 2007 年 に 改 訂 が 行 わ れ て い る 。最 新 版 の BNC XML Edition( DVD 版 )は 個 人 で も 法 人 で も 購 入 で き る が 、 ウ ェ ブ 上 で も 簡 単 な 検 索 を 行 う こ と が で き る 。 BNC の ホ ー ム ペ ー ジ

( http://www.natcorp.ox.ac.uk/ ) を 利 用 す る こ と も で き る し 、 ブ リ ガ ム ヤ ン グ 大 学 の Mark Davies 氏 が 運 営 す る BYU-BNC (http://corpus.byu.edu/bnc/) の サ イ ト を 利 用 し て も よ い ( 石 川 他 2010)。

3.3 バ ン ク ・ オ ブ ・ イ ン グ リ ッ シ ュ (The Bank of English™)

The Bank of English™と は 、 約 6 億 5 千 万 語 に お よ ぶ 、 文 語 ・ 口 語 英 語 の デ ー タ ベ ー ス で あ る 。 こ の デ ー タ ベ ー ス は 1990 年 以 降 収 集 さ れ た 何 百 種 類 も の 文 語 ・ 口 語 の 様 々 な 情 報 か ら 成 り 立 っ て お り 、 イ ギ リ ス 英 語 ( 約 40% )、 ア メ リ カ 英 語 ( 30% )、 オ ー ス ト ラ リ ア 英 語 ・ ニ ュ ー ジ ー ラ ン ド 英 語 ・ カ ナ ダ 英 語

( 30% ) か ら 構 成 さ れ て い る 。 文 語 は 、 お も に 世 界 中 の 新 聞 、 雑 誌 、 テ レ ビ 、 ラ ジ オ 、 文 庫 本 に 始 ま り 、 ウ ェ ブ サ イ ト や チ ラ シ 、 カ タ ロ グ 、 レ ポ ー ト 、 手 紙 に 至 る ま で 、 さ ま ざ ま な 素 材 を 情 報 源 と し て い る 。 ま た 、 口 語 は 日 常 会 話 や ミ ー テ ィ ン グ 、 イ ン タ ビ ュ ー 、 議 論 を 始 め 、 テ レ ビ や ラ ジ オ の 録 音 な ど を 収 録 し て い る 。全 デ ー タ ベ ー ス の う ち 、約 4 千 万 語 は こ の よ う な 口 語 体 で あ る (参 照 引 用 : Japan Knowledge サ イ ト http://japanknowledge.com/ , 2013 年 現 在 )

3.4 コ ー パ ス ・ オ ブ ・ コ ン テ ン ポ ラ リ ー ・ ア メ リ カ ン ・ イ ン グ リ ッ シ ュ (Corpus of Contemporary American English, COCA)

オ ン ラ イ ン 上 で 無 料 で 利 用 で き る コ ー パ ス と し て は 現 在 最 大 の 均 衡 コ ー パ ス

( 2011 年 8 月 現 在 、総 語 数 4 億 2500 万 語 )。ブ リ ガ ム ヤ ン グ 大 学 (Brigham Young University)で 作 成 さ れ て い る も の で 、1990 年 か ら 2011 年 8 月( 現 在 )ま で の 話 し 言 葉 、小 説 、一 般 雑 誌 、新 聞 、学 術 誌 な ど か ら 毎 年 2000 万 語 を 追 加 し て い る 。ウ ェ ブ サ イ ト で は Erin M. Shaw 氏 に よ る デ ー タ 駆 動 型 語 彙 指 導( Teaching Vocabulary Through Data-driven Learning, 英 文 ) も 参 考 に す る こ と が で き

(6)

る (http://corpus.byu.edu/coca/ )。

3.5 現 代 日 本 語 書 き 言 葉 均 衡 コ ー パ ス

日 本 で は 、 大 学 共 同 利 用 機 関 法 人 人 間 文 化 研 究 機 構 国 立 国 語 研 究 所 と 文 部 科 学 省 科 学 研 究 費 特 定 領 域 研 究 「 日 本 語 コ ー パ ス 」 プ ロ ジ ェ ク ト が 共 同 で 「 現 代 日 本 語 書 き 言 葉 均 衡 コ ー パ ス 」( BCCWJ: Balanced Corpus of Contemporary Written Japanese) と い う 大 規 模 コ ー パ ス を 開 発 し て い る 。 こ れ は 約 1 億 480 万 語 か ら な る 書 き 言 葉 を 対 象 と し た コ ー パ ス で 、2013 年 8 月 現 在 、ウ ェ ブ 上 の

「 少 納 言 」と い う サ イ ト (http://www.kotonoha.gr.jp/shonagon/ )で こ の コ ー パ ス を 利 用 し 検 索 を 行 う こ と が で き る 。ま た 、2011 年 夏 か ら は 形 態 論 情 報( 形 態 素 解 析 情 報 ) を 利 用 し た 検 索 サ イ ト も 開 設 さ れ て い る 。

3.6 学 習 者 コ ー パ ス

上 述 し た 5 つ の コ ー パ ス は 母 語 話 者 の 言 語 使 用 例 を 収 集 し た も の で あ る が 、 学 習 者 コ ー パ ス と は 「 外 国 語 学 習 者 に よ っ て 実 際 に 用 い ら れ た 用 例 を 集 積 し た も の 」 と 考 え て い た だ け れ ば い い 。 つ ま り 、 外 国 語 学 習 者 が 産 出 し た 言 語 を 収 集 し た も の を 指 す 。 学 習 者 コ ー パ ス も 学 習 レ ベ ル を 統 一 す る た め に 単 純 均 一 な タ ス ク を 学 習 者 に 課 し 横 断 的 に サ ン プ リ ン グ を 行 っ た General Learner Corpus と 、 特 定 の 目 的 に 応 じ た 多 様 な タ ス ク ・ 調 査 項 目 ・ 学 習 者 ・ サ ン プ リ ン グ の デ ザ イ ン を 行 い 実 証 研 究 に 生 か そ う と す る Specific Learner Corpus が あ る ( 藤 田 1998)。

も っ と も 大 規 模 な も の は ベ ル ギ ー の Sylviane Granger 教 授 が コ ー デ ィ ネ ー タ ー を 務 め る 国 際 学 習 者 英 語 コ ー パ ス (International Corpus of Learner English, ICLE)で あ ろ う 。 現 在 、 Version2 の CD 付 き ハ ン ド ブ ッ ク が 発 売 さ れ て い る が 、 こ れ に は 日 本 を 含 む 世 界 16 か 国 の 中 上 級 レ ベ ル ~ 上 級 レ ベ ル 学 習 者 の 370 万 語 か ら 成 る ラ イ テ ィ ン グ デ ー タ が 収 め ら れ て い る 。 そ の 他 、 ロ ン グ マ ン 学 習 者 コ ー パ ス (Longman Learners’ Corpus)は 1000 万 語 か ら 成 り 、 様 々 な 背 景 を 持 つ 多 様 な レ ベ ル の 学 習 者 の デ ー タ を 扱 っ て い る 。 日 本 で は 神 戸 大 学 の 石 川 慎 一 郎 氏 が 構 築 し た ア ジ ア 圏 英 語 学 習 者 コ ー パ ス (CEEAUS、日 本 人 と 中 国

(7)

人 の 英 語 学 習 者 、 英 語 母 語 話 者 の 英 語 作 文 お よ び 日 本 語 母 語 話 者 の 日 本 語 作 文 か ら 成 る )や 名 古 屋 大 学 の 杉 浦 正 利 氏 に よ る Nagoya Interlanguage Corpu s of English (NICE)な ど が あ る 。日 本 語 に 関 し て は 、OPI を 利 用 し た KY コ ー パ ス な ど が あ る が 、2013 年 8 月 現 在 、東 京 外 国 語 大 学 も E ラ ー ニ ン グ を 活 用 し た 日 本 語 学 習 者 言 語 コ ー パ ス の 作 成 お よ び 日 本 語 学 習 者 誤 用 コ ー パ ス 作 成 を 進 め て い る ( http://cblle.tufs.ac.jp/llc/ja/index.php?menulang=ja ) 。

4. ど の よ う な 研 究 が な さ れ て い る の か

コ ー パ ス を 用 い た 言 語 研 究 は コ ー パ ス 言 語 学 (corpus linguistics)と 呼 ば れ 、

「 コ ン ピ ュ ー タ で 処 理 可 能 な 電 子 コ ー パ ス を 検 索 し て 言 語 分 析 ・ 記 述 を 行 う 言 語 学 一 般 」を 指 す と さ れ る( 齋 藤 他 2005: 3)。言 語 研 究 に は 従 来 、理 論 言 語 学 の 核 を 成 す と さ れ る 音 韻 ・ 形 態 ・ 統 語 ・ 意 味 の そ れ ぞ れ の 「 論 」 が あ り 、 そ れ と は 別 に 社 会 言 語 学 や 歴 史 言 語 学 な ど の 名 称 が 用 い ら れ て き た 。 そ れ に 対 し て

「 コ ー パ ス 言 語 学 」と い う 名 称 は 比 較 的 新 し い も の で 、「 コ ー パ ス 」と い う 言 語 資 料 を 名 に 冠 す る と い う 点 で 従 来 の 手 法 と は 異 な っ て お り 、 パ ー ソ ナ ル ・ コ ン ピ ュ ー タ の 普 及 ・ 操 作 性 や 容 量 の 向 上 と い っ た 背 景 も 手 伝 っ て 1990 年 代 か ら 広 ま っ て き た も の で あ る ( 田 野 村 2010)。

4.1.コ ロ ケ ー シ ョ ン 研 究

あ る 語 が 現 れ る 際 に 、 そ の 他 の 特 定 の 語 と の 結 び つ き が あ る と 認 め ら れ る 場 合 、 言 い 換 え れ ば 語 の 現 れ 方 に 一 定 の パ タ ー ン が 認 め ら れ る 場 合 、 そ の パ タ ー ン を「 コ ロ ケ ー シ ョ ン 」と 言 う( 赤 野 2006)。田 野 村 (2009:22)は コ ロ ケ ー シ ョ ン 研 究 は「 言 語 の 運 用 に 関 わ る 方 面 で の 応 用 的 価 値 が 期 待 さ れ る 」と し て い る 。 こ れ に は 、 辞 書 の 編 纂 、 外 国 語 教 育 な ら び に 学 習 、 母 国 語 の 運 用 な ど の 実 用 的 な 分 野 で の 利 用 が 含 ま れ る 。実 際 に 、Lewis(2000)等 の 語 彙 中 心 の 指 導 法 で は 指 導 項 目 の 中 で も 中 心 的 な 役 割 を 担 っ て い る ( 赤 野 2006)。

国 立 情 報 学 研 究 所 は ヤ フ ー 株 式 会 社 と の 契 約 に 基 づ き 2004 年 4 月 か ら 2005 年 10 月 ま で に 蓄 積 さ れ た 「 Yahoo!知 恵 袋 」 の デ ー タ 質 問 約 311 万 件 ・ 回 答 約 1,347 万 件 の デ ー タ を 提 供 し て い る 。金 城( 2011)で は 、こ の「 Yahoo!知 恵 袋 コ

(8)

ー パ ス 第 一 弾 」を 利 用 し 、「 読 み に く い 」・「 読 み づ ら い 」と い っ た 表 現 に 現 れ る

「 ~ に く い 」と「 ~ づ ら い 」に つ い て 調 査 を 行 い 、(i)「 ~ に く い 」表 現 が「 ~ づ ら い 」 表 現 の 約 5 倍 多 く 用 い ら れ て い る こ と 、 (ii)出 現 数 に 偏 り が あ る に も か か わ ら ず 、 存 在 動 詞 「 居 る 」 と の コ ロ ケ ー シ ョ ン で は 「 居 づ ら い 」 が 「 居 に く い 」を 上 回 る こ と 、(iii)従 来 の 指 摘 に 反 し て「 ~ づ ら い 」が コ ロ ケ ー シ ョ ン と し て 無 意 志 動 詞 と 結 び つ く ケ ー ス が あ る こ と な ど が 明 ら か と な っ て い る 。

4.2.コ ー パ ス 意 味 論

ス タ ッ ブ ズ( 2006)に 代 表 さ れ る コ ー パ ス を 用 い た 語 彙 意 味 論 で は 、「 意 味 は 使 用 で あ る 」と い う 考 え 方 を ベ ー ス に 、「 語 の 意 味 は 、そ れ が い か に 句 の 中 に 組 み 込 ま れ る か 、 そ れ が い か に 社 会 的 状 況 の 中 で 用 い ら れ る か に よ っ て 決 ま る 」

( 2006:26)と し 、「 大 規 模 な 集 成 テ ク ス ト か ら 得 ら れ た 観 察 デ ー タ を 主 な 証 拠 と し て 語 や 句 の 用 法 や 意 味 を 説 明 す る 」( 2006: 27)。

4.3.認 知 言 語 学 研 究

認 知 言 語 学 の 分 野 へ の コ ー パ ス 研 究 の 応 用 と し て 、ア リ ス・ダ イ グ ナ ン (Alice Daignan)の メ タ フ ァ ー 研 究 な ど が あ げ ら れ る ( ダ イ グ ナ ン 2010)。 概 念 メ タ フ ァ ー 理 論 の 先 駆 け 的 研 究 で あ る Lakoff & Johnson(1980)で は メ タ フ ァ ー が 身 体 的 経 験 に 基 づ き 思 考 や 知 識 を 構 成 す る も の で あ り 、 そ れ が イ デ オ ロ ギ ー 的 性 格 を 持 つ こ と な ど が 提 唱 さ れ て い る 。 ダ イ グ ナ ン の 研 究 で は 上 述 し た The Bank of English コ ー パ ス の う ち 、 タ グ 付 け ・ 修 正 が さ れ た 5600 万 語 を 用 い て 、 こ れ ら 概 念 メ タ フ ァ ー 理 論 の 提 唱 す る 事 柄 が コ ー パ ス デ ー タ を 通 し て 実 際 に 観 察 で き る か ど う か を 調 査 ・ 検 討 し て い る 。

4.4.通 時 的 研 究 ( 歴 史 言 語 学 )

2010 年 に 公 開 さ れ た The Corpus of Historical American English(COHA) は ア メ リ カ の ブ リ ガ ム ヤ ン グ 大 学 (Brigham Young University) で 構 築 運 営 さ れ て い る も の で あ る。COHA は 1810 年 代 か ら 2000 年 代 ま で の 過 去 200 年 の ア メ リ カ 英 語 か ら な る 4 億 1 千 万 語 の 大 規 模 コ ー パ ス で あ り 、 こ れ に よ っ て 英 語 の 通 時

(9)

的 な 変 化 を 知 る こ と が 可 能 と な る 。柴 崎( 2010)は COHA を 用 い て must need(s) お よ び must necessarily と そ の 異 形 態 ( must nedes な ど ) の 使 用 状 況 を 調 査 し 、こ れ ら の 表 現 が 1830 年 代 か ら 1840 年 代 を ピ ー ク に 徐 々 に 使 用 率 が 下 が り 、 1930 年 代 以 降 の 頻 度 は か な り 低 く 、現 在 で は ほ と ん ど 用 い ら れ な く な っ て い る こ と を 明 ら か に し て い る 。

一 方 、 日 本 語 に お い て も 国 会 会 議 録 を 用 い た 通 時 的 研 究 が な さ れ て い る 。 国 会 会 議 録 は 1947 年 か ら 現 在 ま で の 60 年 余 り の 日 本 語 の 話 し 言 葉 の 姿 を 捉 え た 言 語 研 究 に お い て 貴 重 な 資 料 で あ る ( 話 し 言 葉 と し て の 国 会 会 議 録 の 性 格 付 け に 関 し て は 松 田( 2008)の 議 論 を 参 照 の こ と )。田 野 村( 2008、2009)は こ の 国 会 会 議 録 を 用 い て 、 現 在 用 い ら れ て い る 「 十 分 な 」・「 個 人 的 な 」 は 過 去 に お い て「 十 分 の 」・「 個 人 的 の 」と い う 言 い 方 が な さ れ て お り 、「 の 」か ら「 な 」へ の 移 行 が 確 認 で き る こ と 、「 属 し な い > 属 さ な い 」な ど の 一 字 漢 語 複 合 サ 変 動 詞 の 活 用 の 変 化 と ゆ れ を 詳 細 に 追 う こ と が で き ( 五 段 化 の 率 が 高 ま っ て い る ) と し て い る 。 ま た 、 服 部 ( 2007) は 国 会 会 議 録 デ ー タ に 基 づ き 「 全 然 」 の 用 法 を 分 析 し 、 遅 く と も 昭 和 20 年 代 ご ろ ま で に 否 定 と の 共 起 の 制 約 が 強 ま る よ う に な っ た こ と を 明 ら か に し て い る 。

5. 言 語 教 育 へ の 応 用 5.1. 英 語 教 育

梅 咲 ( 2011) は コ ー パ ス 言 語 学 と 英 語 教 育 の 関 わ り を 表 1 の よ う に ま と め て い る 。 こ の う ち 、 母 語 話 者 コ ー パ ス を 利 用 し た 研 究 と し て 上 述 し た コ ー パ ス を 用 い た コ ロ ケ ー シ ョ ン 研 究 が あ る が 、そ の 核 心 は 、「 語 は パ タ ー ン を 成 す 」と い う こ と で あ っ た( 赤 野 2006)。Lewis(2000)等 は 語 彙 中 心 の 指 導 法 を 提 唱 し 、自 然 で 母 語 話 者 に 近 い 表 現 を 生 み 出 す た め に は 語 に 関 す る コ ロ ケ ー シ ョ ン 能 力 (collocational competence) が 不 可 欠 で あ る と す る 。 コ ロ ケ ー シ ョ ン や 文 法 パ タ ー ン は 句 表 現 (phraseology)と 呼 ば れ 、 一 定 の フ レ ー ズ が 1 つ の 単 位 と し て 意 味 を 担 い 機 能 す る と 考 え る 。 コ ン ピ ュ ー タ に 例 え る な ら ば 、 文 型 や 文 法 項 目 と い っ た ハ ー ド ウ ェ ア を 持 っ て い て も そ れ だ け で 文 が 成 り 立 つ わ け で は な く 、 そ こ に 単 語 と い う ソ フ ト ウ ェ ア が 必 要 と な る 。 こ の 2 つ が 組 み 合 わ さ っ て コ ン

(10)

ピ ュ ー タ が 動 く よ う に 、 従 来 は 文 法 ・ 文 型 と い う 枠 組 み を 与 え 、 そ の 枠 に 組 み 込 む た め に 、 生 徒 ・ 学 生 に で き る だ け た く さ ん の 単 語 を 覚 え る よ う 指 導 が な さ れ て き た 。 だ が 、 語 に は そ れ ぞ れ 共 起 し や す い 仲 間 が お り 、 そ う い っ た 仲 間 と と も に フ レ ー ズ と し て 語 を 習 得 さ せ る よ う に す る 、 そ の よ う な 視 点 が 必 要 な の で は な い か と い う 提 言 が な さ れ て い る 。

母 語 話 者 コ ー パ ス を 利 用 し た 言 語 研 究 に つ い て は 4 章 で 既 に 述 べ た 。 非 母 語 話 者 ( 学 習 者 ) コ ー パ ス を 利 用 し た 言 語 習 得 研 究 の 代 表 的 な も の は 誤 用 分 析 で あ る 。 International Corpus of Learner English の プ ロ ジ ェ ク ト で は 、 11 の 異 な る 母 語 の 英 語 学 習 者 の 作 文 デ ー タ を 収 集 し 、エ ラ ー 分 析 が 行 わ れ て い る( 藤 田 1998)。ま た 、野 地( 2008)は「 彼 は 犬 が 好 き だ 」の よ う な 状 態 動 詞 で の 目 的 格 表 示 が 初 級 L2 英 語 に お い て 目 的 格 で は な く 主 格 表 示 に な る エ ラ ー が 起 こ る の で は な い か と し て 発 話 コ ー パ ス (NICT JLE Corpus)を 用 い て 調 査 を 行 っ て い る 。こ の 発 話 コ ー パ ス は 全 米 外 国 語 教 育 協 会 (ACTFL)と ア ル ク 株 式 会 社 が 開 発 し た Standard Speaking Test の 音 声 資 料 を 書 き 起 こ し て タ グ 付 け し た も の で あ る 。

表 1 コ ー パ ス 言 語 学 と 英 語 教 育 と の 関 わ り ( 梅 咲 ( 2011) よ り )

コ ー パ ス の 間 接 利 用 と し て は 、 OUP の Graded Reader シ リ ー ズ や 中 高 の 教 科 書 を コ ー パ ス 化 し 、 コ ン コ ー ダ ン ス ソ フ ト を 利 用 し て 目 的 と す る 語 句 を キ ー ワ ー ド と し て KWIC (Key Words In Context) 形 式 で 出 力 し 学 習 者 に 提 示 し 、 そ れ に よ っ て 帰 納 的 学 習 が 効 果 的 で あ る と 考 え ら れ る 文 法 項 目 ・ 語 法 の 帰 能 的 ・ 発 見 的 な 学 習 を 目 指 す と い う 試 み が あ げ ら れ る 。 藤 田 ( 1998) は 中 学 生 に 不 定 詞

母語話者コーパスを利用した 言語研究

歴史言語学、社会言語学、語彙文 法、ディスコース・音声音韻研究、

第一言語習得 非母語話者(学習者)コーパス

を利用した言語習得研究 第二言語習得(誤用分析)

間接利用 教材・テスト作成、語彙リスト作 成・教材評価

コーパス言語学教育目的 英語学習目的

直接利用 コーパス自体の教育利

コーパス分析による言 語学的研究成果の英語 教育への応用

(11)

の 用 法 を 整 理 さ せ る た め に 400 語 レ ベ ル の 英 語 教 材 を コ ー パ ス に し て コ ン コ ー ダ ン ス ソ フ ト を 利 用 し た 教 材 を 作 成 し 、 帰 能 的 学 習 を 試 み て い る 。

コ ー パ ス 自 体 の 直 接 利 用 を 教 育 に 取 り 入 れ る 試 み と し て 、 中 條 他 ( 2006) は 初 級 英 語 学 習 者 を 対 象 と し た 日 英 パ ラ レ ル コ ー パ ス の 利 用 を 試 み 、 DDL( デ ー タ 駆 動 型 学 習 ) は CALLで 対 応 で き な い 部 分 を カ バ ー で き 、 ま た 「 自 分 で 調 べ て 理 解 す る 」 方 式 の 文 法 学 習 は 英 語 の 苦 手 意 識 の 強 い 学 習 者 の 興 味 を 引 き 出 す こ と が わ か っ た と し 、 remedial grammar( 文 法 再 学 習 ) の 指 導 方 法 と し て 有 効 で あ る と し て い る 。

ま た 中 島 ( 2008) は 、 従 来 の 短 時 間 で 効 率 的 に 学 ば せ る 演 繹 的 教 授 法 が 英 語 を「 暗 記 科 目 」と し て 学 習 者 に 定 着 さ せ て し ま っ た の で は な い か と の 反 省 か ら 、 限 ら れ た 時 間 内 に Parole 的 言 語 デ ー タ か ら 帰 納 的 に 言 語 シ ス テ ム や 文 法 の 仕 組 み を 抽 象 し 自 ら 構 築 す る 疑 似 体 験 を さ せ る た め に コ ー パ ス 検 索 シ ス テ ム の 活 用 が 有 効 で は な い か と 提 唱 し て い る 。 さ ら に 、 石 井 ( 2010) で は 上 級 学 習 者 向 け 英 英 辞 書 の 定 義 ・ 用 例 デ ー タ 約 900 万 語 を 横 断 的 に 全 文 検 索 で き る シ ス テ ム を 開 発 し 、 教 育 目 的 で の 辞 書 利 用 の 可 能 性 に つ い て 考 察 を 加 え て い る 。

5.2. 日 本 語 教 育

砂 川 ( 2010, 2011) は 外 国 語 教 育 に お い て は シ ラ バ ス デ ザ イ ン ( 何 を ど の 順 序 で 教 え る か ) が 重 要 で あ る と し 、 コ ー パ ス を 利 用 し た 教 育 用 の 語 彙 表 づ く り と 文 法 シ ラ バ ス 評 価 を 取 り 上 げ て い る 。2010 年 に 改 訂 に な っ た 日 本 語 能 力 試 験

( 2010 年 度 受 験 者 数 は 国 内 外 を 含 め 60 万 人 ) で は 「 場 面 に 応 じ た コ ミ ュ ニ ケ ー シ ョ ン 能 力 」 が 能 力 評 価 の 重 要 な 指 標 と な っ て い る が 、 砂 川 は 場 面 や 話 題 に 即 し て 語 彙 を 分 類 し 、 さ ら に 「 各 語 彙 の 難 易 度 や 使 用 域 を 表 示 し た 語 彙 表 が 必 要 」で あ る と す る( 砂 川 2010: 657)。こ の 場 面 に 応 じ た「 コ ミ ュ ニ ケ ー シ ョ ン 能 力 」 の 育 成 は 単 に 語 彙 を 増 や す と い う こ と に と ど ま ら な い 。 小 林 ( 2008) は 基 本 的 な 文 法 項 目 と は 何 か に つ い て 論 じ て い る が 、 我 々 の 日 常 会 話 に お い て 頻 出 の 「 い 形 容 詞 」 で は 非 過 去 肯 定 の 用 法 が 全 体 の 9 割 以 上 を 占 め 、 否 定 形 は ほ と ん ど 用 い ら れ て い な い こ と が 示 さ れ て い る 。 使 用 頻 度 が 低 い こ と を も っ て 直 ち に 文 法 シ ラ バ ス で 過 去 形 や 否 定 形 を 教 え る こ と を 見 直 さ な け れ ば な ら な い と

(12)

い う こ と に は な ら な い が 、 使 用 域 に 応 じ 、 ま た 学 習 者 の ニ ー ズ を 考 慮 し た 文 法 教 育 を 改 め て 見 直 す 契 機 に な る と 考 え ら れ る 。

日 本 人 の 日 本 語 活 用 に つ い て は 林 他 (2008)の 研 究 が あ る 。 近 年 理 工 系 の 大 学 院 で は 日 本 人 学 生 の 「 誤 字 ・ 脱 字 、 主 語 と 述 語 の 不 一 致 、 文 体 の 不 統 一 、 書 き 言 葉 と 話 し 言 葉 の 混 用 、 テ ニ オ ハ の 間 違 い 、 同 音 異 義 語 の 誤 用 、 修 飾 ・ 被 修 飾 の 関 係 の 不 明 、語 彙 の 不 足 」( 2008:11- 12、原 文 マ マ )な ど が 問 題 視 さ れ 慶 應 義 塾 大 学 や 高 知 大 学 で 「 日 本 語 技 法 」 や 「 科 学 技 術 日 本 語 」 な ど の 科 目 名 で 授 業 が 提 供 さ れ て い る と い う 。 林 他 は 大 学 院 生 が 専 門 の デ ィ ス コ ー ス ・ コ ミ ュ ニ テ ィ ( 互 い に 専 門 用 語 を 用 い て コ ミ ュ ニ ケ ー シ ョ ン を す る 専 門 家 集 団 ) の 一 員 に な る ま で の 過 程 に 注 目 し 、 3 人 の 博 士 課 程 進 学 者 の プ レ ゼ ン テ ー シ ョ ン の 仕 方 の 変 化 に つ い て 科 学 技 術 系 に 特 徴 的 な 内 容 ・ 目 的 ・ 形 式 を も っ た 表 現 形 式 を と り あ げ 、 語 彙 ・ 表 現 と 論 理 性 の 面 で 進 歩 が 見 ら れ て い る と 報 告 し て い る 。

ま た 、上 述 の コ ロ ケ ー シ ョ ン と の 関 連 で 言 え ば 、「 た だ す 」と い う 動 詞 は「 姿 勢 」「 元 」「 方 針 」な ど の 名 詞 と と も に 多 用 さ れ る と い う 知 識 の ほ か に 、「 元 を た だ す 」 と い う 表 現 が あ り 、 こ れ は 「 元 を た だ せ ば 」 と い う バ 形 で 用 い ら れ る の が 一 般 的 で あ り 、「 私 は 昨 日 元 を た だ し ま し た 」 や 「 明 日 元 を た だ し ま し ょ う 」 と い っ た ふ う に は 用 い ら れ な い と い う 用 法 上 の 知 識 も 身 に 着 け る 必 要 が あ ろ う 。 こ う い っ た 気 づ か れ に く い パ タ ー ン な ど は 教 師 の 直 観 や 偶 然 の 発 見 な ど に 頼 る の で は な く 、 コ ー パ ス に 基 づ い た 実 証 的 な デ ー タ に 裏 打 ち さ れ た 知 識 が 必 要 と な る ( 砂 川 2010)。

橋 本 ・ 河 原 ( 2008) は 「 胸 を 打 つ 」 や 「 足 を 洗 う 」 な ど 日 本 語 慣 用 句 の 曖 昧 性 解 消 技 術 の 確 立 に む け 慣 用 句 コ ー パ ス の 構 築 を 進 め て い る 。 英 語 の 場 合 は コ ー パ ス を 活 用 し た 学 習 辞 書 の 編 纂 が な さ れ て い る が 、 日 本 語 教 育 で は 日 本 語 学 習 者 が 利 用 で き る 類 義 語 や コ ロ ケ ー シ ョ ン 情 報 が 盛 り 込 ま れ た 学 習 辞 書 は な い 。 今 後 の 開 発 が 望 ま れ る 。

6. 分 析 の 実 際 6.1. 日 本 語 の 分 析

上 述 し た よ う に 、 オ ン ラ イ ン 上 で 既 に あ る コ ー パ ス デ ー タ を 利 用 す る ケ ー ス

(13)

( 「 BYU-BNC」 や 「 少 納 言 」 な ど ) 以 外 に 、 独 自 の デ ー タ を 解 析 す る 場 合 に は 、 解 析 用 の ソ フ ト ウ ェ ア が 必 要 と な る 。 以 下 、 日 本 語 と 英 語 い ず れ の 言 語 に も 対 応 し た ソ フ ト ウ ェ ア を 紹 介 し 、 実 際 の 解 析 の 進 め 方 の 手 順 を 示 す 。 読 者 も 実 際 に 試 し て も ら い た い 。 今 回 は 立 命 館 大 学 の 樋 口 耕 一 氏 が 開 発 し た テ キ ス ト マ イ ニ ン グ 用 の フ リ ー ソ フ ト ウ ェ ア KH Coder を 用 い る 。 KH Coder は http://khc.sourceforge.net/ よ り 入 手 可 能 。詳 し い 操 作 方 法 に つ い て は こ の サ イ ト の チ ュ ー ト リ ア ル や ダ ウ ン ロ ー ド の 際 に 付 属 す る マ ニ ュ ア ル を 参 照 の こ と 。

① 分 析 対 象 と な る サ ン プ ル コ ー パ ス を 作 成 す る 。

画 面 左 隅 の ス タ ー ト メ ニ ュ ー → す べ て の プ ロ グ ラ ム → ア ク セ サ リ → メ モ 帳 と 進 み 、メ モ 帳 に「 兄 が 猫 に え さ を や っ た 」と 入 力 。こ れ に test1と 名 称 を つ け て 保 存 す る 。 ( 一 般 に 用 い ら れ て い る Wordフ ァ イ ル を 直 接 KH Coderに 読 み 込 ま せ る こ と は で き な い た め 、 テ キ ス ト フ ァ イ ル の 形 式 に し て お く 。 デ ー タ の 量 が 大 き く な る と 上 記 の メ モ 帳 で は 何 か と 不 便 に な る 。 そ こ で 、 容 量 の 大 き い デ ー タ の 場 合 は 「 さ く ら エ デ ィ タ 」 な ど の こ れ も フ リ ー で 用 い る こ と の で き る テ キ ス ト エ デ ィ タ を 用 い る と よ い 。 )

② KH Coderに 対 象 フ ァ イ ル を 読 み 込 ま せ る 。

KH Coderを 起 動 し た ら 左 上 の プ ロ ジ ェ ク ト を ク リ ッ ク し 「 新 規 」 ボ タ ン を 押 す 。 新 規 プ ロ ジ ェ ク ト の ダ イ ア ロ グ ボ ッ ク ス が 開 い た ら 、 「 参 照 」 ボ タ ン を 押 し 、 test1の フ ァ イ ル を 選 択 し 、 OKボ タ ン を 押 す 。

図 1 KH Coderを 立 ち 上 げ た と こ ろ

(14)

図 2 新 規 プ ロ ジ ェ ク ト の 登 録 画 面

③ 前 処 理 の 実 行

現 在 の プ ロ ジ ェ ク ト の 部 分 に test1.txtと 表 示 さ れ て い る の を 確 認 し 、上 部 に あ る「 前 処 理 」か ら「 分 析 対 象 フ ァ イ ル の チ ェ ッ ク 」を 選 択 し 、ク リ ッ ク す る 。

「 こ の 処 理 に は 時 間 が か か る 場 合 が あ り ま す 。 続 行 し て よ ろ し い で す か ? 」 の ダ イ ア ロ グ ボ ッ ク ス で OKを 押 す 。 再 び 「 前 処 理 」 か ら 今 度 は 「 語 の 取 捨 選 択 」 を 選 び 、 現 れ た 品 詞 名 が 書 い て あ る ボ ッ ク ス を 下 へ た ど り 、 「 そ の 他 」 に チ ェ ッ ク を 入 れ る 。 OKを 押 す 。 再 度 「 前 処 理 」 か ら 「 前 処 理 の 実 行 」 を 選 択 し 、 OK を 押 す 。

図 3 前 処 理 を 実 行 し た 後 の 画 面 ( 総 抽 出 語 と 異 な り 語 数 が 示 さ れ る )

④ 抽 出 語 の 確 認

上 部 メ ニ ュ ー の 「 ツ ー ル 」 か ら 、 抽 出 語 → 抽 出 語 リ ス ト を 選 択 す る と 、 ダ イ

(15)

ア ロ グ ボ ッ ク ス が 開 く 。 今 回 は そ の ま ま OKを 押 す 。 す る と 、 エ ク セ ル が 立 ち 上 が り 、 分 析 対 象 と な っ た 文 の 解 析 結 果 が 示 さ れ る 。

図 4 「 兄 が 猫 に え さ を や っ た 」 の 解 析 結 果 ( エ ク セ ル 表 示 )

こ の よ う に 品 詞 ご と の 語 の 出 現 頻 度 を 示 す こ と も で き る し 、 頻 出 の 上 位 150 語 を 示 す こ と も で き る 。ま た 上 記 の 例 の よ う に 1文 だ け で は な く 、大 量 の 文 を 解 析 し 、 KWIC( ク イ ッ ク ) 表 示 す る こ と も で き る 。 次 に 示 す の は あ る デ ー タ に お け る 「 に く い 」 の KWIC表 示 例 で あ る :

図 5 「 に く い 」 の KWIC表 示

こ の KWICコ ン コ ー ダ ン ス で は 、 一 定 の 語 ( 上 記 の 場 合 は 「 に く い 」 ) を 中 心 に 揃 え 、 左 右 の 語 を 指 定 し て 頻 度 順 に 示 し た 一 覧 を 作 成 す る こ と も で き る 。

(16)

6.2. 英 語 の 分 析

同 じ KHCoder を 用 い て 英 語 も 分 析 で き る よ う に な っ た ( 2011 年 11月 26 日 更 新 Ver. 2.beta.27 )。 以 下 で サ ン プ ル 分 析 と し て 2008年 当 時 上 院 議 員 だ っ た オ バ マ 氏 が 行 っ た“ A More Perfect Union” と い う ス ピ ー チ を 見 て み よ う 。Yahooや Googleな ど の 検 索 エ ン ジ ン で Obama, race, speech と い う 検 索 文 字 を 入 力 し Enterキ ー を 押 す と Obama Race Speech: Read the Full Text と い う サ イ ト が 見 つ か る( 2011年 12月 現 在 )。こ こ に 掲 載 さ れ て い る 英 文 を コ ピ ー し て 、上 記 の 日 本 語 の 場 合 と 同 様 に メ モ 帳 に 貼 り 付 け 任 意 の フ ァ イ ル 名 を 付 し 、 テ キ ス ト フ ァ イ ル と し て 保 存 す る ( こ こ で は obama_race_speech.txtを 作 成 し た )。

日 本 語 の 手 順 と 同 様 に 、KHCoderを 立 ち 上 げ 、出 て き た ウ ィ ン ド ウ の 左 上 に あ る 「 プ ロ ジ ェ ク ト 」 を ク リ ッ ク す る 。 新 規 → 分 析 対 象 フ ァ イ ル と 進 み 、「 参 照 」 の ボ タ ン を 利 用 し て obama_race_speech.txtを 選 択 し 、「 OK」 を 押 す 。 こ こ か ら 1つ 日 本 語 の 場 合 と は 異 な る 操 作 を す る 。 同 じ 「 プ ロ ジ ェ ク ト 」 を ク リ ッ ク し 、 設 定 を 押 す と 、 以 下 の よ う な ウ ィ ン ド ウ が 現 れ る 。

図 6 設 定 の 画 面

(17)

こ こ で ラ ジ オ ボ タ ン の 3つ 目 、 Lemmatizationと い う 項 目 を 選 択 し 「 OK」 ボ タ ン を 押 し て 画 面 を 閉 じ る 。4番 目 の Stemmingは 動 詞 の -ing形 や 過 去 形 を 原 形 と し て カ ウ ン ト す る も の で 、Lemmatizationは よ り 詳 細 な 解 析 を 行 う と い う 程 度 に 理 解 し て お い て よ い だ ろ う ( 詳 細 は KHCoder付 属 の マ ニ ュ ア ル を 参 照 の こ と ) 。 こ の 画 面 を 閉 じ 、 最 初 に 立 ち 上 が っ た ウ ィ ン ド ウ に 戻 り 、 前 処 理 を ク リ ッ ク す る 。 す る と 「 分 析 フ ァ イ ル の チ ェ ッ ク 」 や 「 前 処 理 の 実 行 」 な ど の 項 目 が で て く る 。 こ こ で は 日 本 語 の よ う に 「 分 析 フ ァ イ ル の チ ェ ッ ク 」 が 選 択 で き な い よ う に な っ て い る ( こ の 機 能 は も と も と 半 角 カ タ カ ナ な ど を 検 索 し 修 正 す る た め の も の で あ り 、英 語 で は 必 要 が な い た め )。「 語 の 取 捨 選 択 」を ク リ ッ ク し 、 現 れ た ウ ィ ン ド ウ の 左 側 に あ る 品 詞 を 確 認 す る 。 日 本 語 よ り も ず っ と 品 詞 設 定 が 少 な い こ と が 確 認 で き る 。全 て の 語 を 検 索 す る た め に こ こ で は「 OTHER」に も チ ェ ッ ク を 入 れ 、「 OK」を 押 し て ウ ィ ン ド ウ を 閉 じ 、先 ほ ど の「 前 処 理 の 実 行 」 を 行 う 。

結 果 、総 抽 出 語 数 5,472語 、異 な り 語 数 1,249語 、文 186、段 落 61と い っ た 情 報 が 現 れ る 。頻 出 150語 を 見 る に は 、ツ ー ル → 抽 出 語 → 抽 出 語 リ ス ト と 進 み 、現 れ た ウ ィ ン ド ウ で 「 頻 出 150語 」 を 選 択 す る と Excelが 立 ち 上 が り 、 頻 度 順 位 表 が 表 示 さ れ る 。今 回 の ス ピ ー チ は 人 種 問 題 が 主 要 テ ー マ と な っ て い る 。で は white と blackと い う 語 の 頻 度 は ど う な っ て い る で あ ろ う か 。

表 2 頻 出 上 位 1 5 語

抽出語 出現回数

be 161

we 126

have 69

they 68

not 59

I 56

that 39

it 35

black 34

he 34

who 34

do 33

my 31

she 29

white 27

・・・ ・・・

(18)

be動 詞 や haveな ど 、 ど の よ う な テ ク ス ト で も 頻 出 の 語 の ほ か に 、 代 名 詞 で は 一 人 称 単 数 の Iよ り も 複 数 の Weが 2.5倍 多 く 表 れ て お り 、 blackが わ ず か だ が white の 頻 度 を 上 回 っ て い る こ と が わ か る 。

ま た 、た と え ば whiteと い う 語 の 前 後 の コ ン テ ク ス ト を 見 る に は KWIC表 示 を 用 い る 。 ツ ー ル → 抽 出 語 → KWICコ ン コ ー ダ ン ス と 進 み 、 表 示 さ れ た ウ ィ ン ド ウ の 検 索 枠 に whiteと 入 力 し Enterを 押 せ ば 次 の よ う な KWIC画 面 が 現 れ る 。

こ の KWIC 表 示 は 検 索 語 white を 中 心 に 前 後 の 文 脈 を 一 通 り 見 渡 せ る よ う に な っ て い る が 、 さ ら に 詳 し く ど の よ う な 語 と 共 起 し て い る か を 見 る に は 、 右 下 に あ る 集 計 ボ タ ン を 押 し 、 コ ロ ケ ー シ ョ ン 統 計 画 面 を 表 示 さ せ る 。

図 7 whiteの KWIC表 示

図 8 whiteの コ ロ ケ ー シ ョ ン 統 計 ( 直 近 の 右 側 の 語 の 頻 度 順 )

(19)

KH Coderは 大 変 使 い 勝 手 の よ い ソ フ ト ウ ェ ア で あ る が 、注 意 す べ き 点 も あ る 。 第 一 に 言 語 分 析 用 に 開 発 さ れ た ソ フ ト ウ ェ ア で は な い た め 、 こ こ で 用 い て い る 茶 筌 と い う 形 態 素 解 析 器 が 解 析 ( 形 態 素 に 分 割 ) で き な い 場 合 も 生 じ る 。 話 し 言 葉 な ど は エ ラ ー が 起 こ り や す い 。 第 二 に 、 前 処 理 の 結 果 と し て 総 抽 出 語 数 や 異 な り 語 数 が 表 示 さ れ る が 、 上 述 の よ う な 問 題 点 が あ る た め 、 全 体 の 語 数 を 正 確 に 示 す こ と が 難 し く 、 統 計 処 理 を す る 場 合 に は 注 意 が 必 要 と な る 。 第 三 に 、 100MB程 度 の 大 容 量 の デ ー タ も 解 析 す る こ と は で き る が 、非 常 に 時 間 が か か る こ と 、ま た 、用 い る PC側 に 分 析 対 象 フ ァ イ ル の 100倍 程 度 の 空 き 容 量 が 必 要 と な る 点 な ど に も 気 を 付 け た ほ う が よ い 。 大 容 量 デ ー タ の 解 析 の 場 合 は 適 切 な サ ン プ リ ン グ を 行 う と よ い だ ろ う 。こ こ で は KH Coderを 用 い た 分 析 方 法 を 紹 介 し た が 、 分 析 方 法 は こ れ だ け に 限 ら れ る わ け で は な い 。 こ れ を 端 緒 と し て 各 自 が 行 い や す い 方 法 で 分 析 を 進 め て も ら い た い 。

7. お わ り に

セ ク シ ョ ン 6 で 紹 介 し た 分 析 方 法 は コ ー パ ス を 用 い た 分 析 の ほ ん の 一 部 で し か な い 。 語 の 頻 度 な ど を 扱 う に は や は り 統 計 の 基 礎 知 識 も 必 要 と な る 。 本 格 的 に 複 数 の コ ー パ ス に つ い て そ れ ぞ れ 特 定 の 語 の 頻 度 を 調 査 し コ ー パ ス の 特 徴 を 探 る と い う よ う な 作 業 を 視 野 に 入 れ た 研 究 を す る 場 合 に は 、 石 川 慎 一 郎 著 『 英 語 コ ー パ ス と 言 語 教 育:デ ー タ と し て の テ ク ス ト 』( 大 修 館 書 店 )や 齋 藤 俊 雄・

中 村 純 作 ・ 赤 野 一 郎 ( 編 ) 『 改 訂 新 版 英 語 コ ー パ ス 言 語 学 基 礎 と 実 践 』 と い っ た 本 を 読 ま れ る こ と を お 勧 め す る 。 ま た 、 石 川 慎 一 郎 ・ 前 田 忠 彦 ・ 山 崎 誠

( 編 )『 言 語 研 究 の た め の 統 計 入 門 』で は 主 に 日 本 語 が と り あ げ ら れ て い る が 、 紹 介 さ れ て い る 分 析 手 法 ( 多 変 量 解 析 を 用 い た 分 析 ) は 大 変 参 考 に な る た め 、 こ ち ら も 併 せ て 読 ま れ る こ と を 勧 め た い 。

参 考 文 献

赤 野 一 郎 .2006.「 英 語 コ ー パ ス 言 語 学 と 英 語 教 育 」『 日 本 語 教 育 』130 号 , 11- 21

石 井 康 毅 .2010.「 学 習 者 向 け 英 英 辞 書 デ ー タ の 教 育 目 的 コ ー パ ス と し て の 活 用

(20)

可 能 性 の 考 察 」『 東 京 理 科 大 学 紀 要 教 養 篇 』 (43), 269-292

石 川 慎 一 郎 .2008.『 英 語 コ ー パ ス と 言 語 教 育:デ ー タ と し て の テ ク ス ト 』大 修 館 書 店

石 川 慎 一 郎 ・ 前 田 忠 彦 ・ 山 崎 誠 ( 編 ). 2011.『 言 語 研 究 の た め の 統 計 入 門 』 く ろ し お 出 版

梅 咲 敦 子 .2005.「 コ ー パ ス と は 何 か 」齋 藤 俊 雄・中 村 純 作・赤 野 一 郎( 編 )『 英 語 コ ー パ ス 言 語 学 ― 基 礎 と 実 践 ― 』( 改 訂 新 版 ) 研 究 社 , 21- 48

梅 咲 敦 子 . 2011.「 コ ー パ ス 言 語 学 の 手 法 を 英 語 教 育 に 活 か す (1)『 辞 書 と コ ー パ ス で 自 信 を も っ て 楽 し く 英 語 を 使 う 』た め の 方 策 」 『 言 語 と 文 化 』 (14), 55-71

大 曾 美 惠 子 . 2006.「 日 本 語 コ ー パ ス と 日 本 語 教 育 」『 日 本 語 教 育 』 130 号 , 3- 10

金 城 克 哉 .2011.「 コ ー パ ス 分 析 に 基 づ く『 ~ に く い 』・『 ~ づ ら い 』表 現 の 研 究 」 琉 球 大 学 留 学 生 セ ン タ ー 『 留 学 生 教 育 』 (8),19-35

後 藤 斉 . 2003.「 言 語 理 論 と 言 語 資 料 - コ ー パ ス と コ ー パ ス 以 外 の デ ー タ 」『 日 本 語 学 』 第 22 巻 , 6-15

齋 藤 俊 雄 ・ 中 村 純 作 ・ 赤 野 一 郎 ( 編 ) 『 改 訂 新 版 英 語 コ ー パ ス 言 語 学 基 礎 と 実 践 』 研 究 社

Shibasaki, Reijirou. 2010.The Corpus of Historical American English (COHA): A new tool for full-fledged studies of Late Modern English (1810s-2000s). Southern Review (25), 11-27

ス タ ッ ブ ズ ,マ イ ケ ル .南 出 康 世 ・ 石 川 慎 一 郎( 監 訳 )2006.『 コ ー パ ス 語 彙 意 味 論 』 研 究 社

砂 川 有 里 子 . 2009.「 コ ー パ ス を 活 用 し た 日 本 語 教 育 研 究 」『 人 口 知 能 学 会 誌 』 24 巻 5 号 , 656-664

砂 川 有 里 子 . 2011.「 日 本 語 教 育 へ の コ ー パ ス の 活 用 に 向 け て 」『 日 本 語 教 育 』 150 号 , 4-18

ダ イ グ ナ ン ,ア リ ス . 渡 辺 秀 樹 ・ 大 森 文 子 ・ 加 野 ま き み ・ 小 塚 良 孝 ( 訳 ) 2010.

『 コ ー パ ス を 活 用 し た 認 知 言 語 学 』 大 修 館 書 店

(21)

田 野 村 忠 温 .2008.「 大 規 模 な 電 子 資 料 に 見 る 現 代 日 本 語 の 動 態 」『 待 兼 山 論 叢 』

( 文 化 動 態 論 篇 )( 42) , 55-76

田 野 村 忠 温 .2009.「 コ ー パ ス か ら の コ ロ ケ ー シ ョ ン 情 報 抽 出 ― 分 析 手 法 の 検 討 と コ ロ ケ ー シ ョ ン ン 辞 典 項 目 の 試 作 ― 」『 阪 大 日 本 語 研 究 』 (21), 21-41 田 野 村 忠 温 .2010.「 コ ー パ ス を 用 い た 日 本 語 研 究 の 精 密 化 と 新 し い 研 究 領 域・

手 法 の 開 発 」『 人 口 知 能 学 会 誌 』 24 巻 5 号 , 647-655 投 野 由 紀 夫 . 2006.『 コ ー パ ス 超 入 門 』 小 学 館

中 尾 浩・赤 瀬 川 史 朗・ 宮 川 信 悟 .2002.『 コ ー パ ス 言 語 学 の 技 法 Ⅰ :テ キ ス ト 処 理 入 門 』 夏 目 書 房

中 島 浩 二 .2008.「 正 規 表 現 を 使 っ た 英 語 コ ー パ ス 検 索 シ ス テ ム の 開 発 と 帰 納 的 言 語 教 育 の 可 能 性 」 徳 島 大 学 『 言 語 文 化 研 究 』 16, 151-163

中 條 清 美・西 垣 知 佳 子 ・内 山 将 夫・ 山 崎 淳 史 .2006.「 初 級 英 語 学 習 者 を 対 象 と し た コ ー パ ス 利 用 学 習 の 試 み 」『 日 本 大 学 生 産 工 学 部 研 究 報 告 . B, 文 系 』( 39), 29-50

日 本 語 教 育 学 会( 編 )『 日 本 語 教 育 特 集:コ ー パ ス と 日 本 語 教 育 ― 現 状 と 課 題

― 』 130 号

野 地 美 幸 2008.「 L2 英 語 に お け る 目 的 格 標 示 : 日 本 人 英 語 学 習 者 の 発 話 コ ー パ ス 研 究 」『 上 越 教 育 大 学 研 究 紀 要 』 27, 173-180

橋 本 力・河 原 大 輔 .2008.「 日 本 語 慣 用 句 コ ー パ ス の 構 築 と 慣 用 句 曖 昧 性 解 消 の 試 み (語 彙 知 識 ) 電 子 情 報 通 信 学 会 技 術 研 究 報 告 . NLC, 『 言 語 理 解 と コ ミ ュ ニ ケ ー シ ョ ン 』 108(141), 1-6

服 部 匡 . 2010.「『 全 く 』 と 『 全 然 』 の 使 用 傾 向 の 変 遷 ― 国 会 会 議 録 の デ ー タ よ り ― 」『 同 志 社 女 子 大 学 総 合 文 化 研 究 所 紀 要 』 第 27 巻 , 162-167

林 洋 子 ・ 国 吉 ニ ル ソ ン ・ 野 口 ジ ュ デ ィ ― ・ 東 條 加 寿 子 2008.「 若 い 研 究 者 の 言 語 獲 得 (言 語 と コ ー パ ス ,思 考 と 言 語 一 般 )」『 電 子 情 報 通 信 学 会 技 術 研 究 報 告 . TL, 思 考 と 言 語 』 108(50), 11-16

藤 田 高 弘 1998.「 コ ー パ ス を 応 用 し た 英 語 教 育 研 究 と 英 語 学 習 : 現 状 と 可 能 性 の 考 察 」『 名 古 屋 大 学 教 育 学 部 附 属 中 高 等 学 校 紀 要 』 43, 169-174

真 島 知 秀 .2011.「 日 本 語 コ ー パ ス:概 要 か ら 利 用 ま で 」沖 縄 県 大 学 等 日 本 語 教

(22)

育 研 究 会 第 2 回 研 究 会 資 料

松 田 謙 次 郎 ( 編 ). 2008.『 国 会 会 議 録 を 使 っ た 日 本 語 研 究 』 ひ つ じ 書 房 前 川 喜 久 雄 「 導 入 コ ー パ ス と は 何 か 」『 国 文 学 :解 釈 と 鑑 賞 』 74(1), 6-14 Granger, Sylviane, Estelle Dagneaux, Fanny Meunier, Magali Paquot. 2009.

International Corpus of Learner English Version 2. Presses Universitaires de Louvain

Lakoff, George and Mark Johnson 1980. Metaphors We Live By. Chicago:

University of Chicago Press

Lewis, Michael. (ed) 2000. Teaching Collocation: Further Developments in the Lexical Approach. Hove: Language Teaching Publications

(23)

Corpus Linguistics:

An overview of itsapplication to language teaching and Analytical procedures

Katsuya Kinjo

This paper, firstly, tries to show the overview of corpus linguistics, which has been paid much attention in recent linguistic analysis. Definition of corpus, the purpose of using corpus, and the kinds of corpus will be shown.

Also provided is the recent studies utilizing corpus as their database;

variety of fields such as collocation analysis, semantics, cognitive linguistics, and historical linguistics are related to corpus studies. Second, it will be discussed how these corpus studies are applied to la nguage teaching, both teaching English and Japanese. Thirdly, it will be shown how to analyze corpus data using a free software, KH Coder, which has been developed by Dr. Koichi Higuchi at Ritsumeikan University.

注 : こ れ は 既 発 表 論 文 が 査 読 に よ り 修 正 し 掲 載 さ れ る も の で あ る 。

表 1  コ ー パ ス 言 語 学 と 英 語 教 育 と の 関 わ り ( 梅 咲 ( 2011) よ り )
図 7  whiteの KWIC表 示

参照

関連したドキュメント

Semantics of Meaning as Invariant Specified among Ambient Semiotic Array : A Methodology of Ecological Linguistics.. 宇都宮 裕章 1

In Chew, Patrik (ed.) Proceedings of the twenty-eighth annual meeting of the Berkeley Linguistics Society, February 15-18, 2002, Special session on Tibeto-Burman and Southeast Asian

The BASIC language has the advantage that even elementary and junior high school students can easily create programs as long as they understand the control structure of the

Prior to the publication of the whole corpus, which scheduled for 2022, we published the monitor version of the CEJC in December 2018. In this paper, we first outlined the

Systemic-Functional Analysis of the Problem- Solution Pattern in a Student and Professional Corpus of Technical Writing. The Computer Learner Corpus: a Versatile New Source of

Athanasiadow, Angeliki. On the subjectivity of intensifiers. Language Sciences 29. Le message publicitaire. Cognitive Linguistics, Cambridge: Cambridge University Press.

本稿では『日本語話し言葉コーパス』Corpus of

統合辞書 JUMAN++辞書獲得フロー 統合辞書 (異表記統合) Web Corpus 文節区切り解析済み Web Corpus Webコーパス辞書 表記揺れ認識 係り受け