• 検索結果がありません。

Microsoft Word - DEIM2012 冠詞誤り3

N/A
N/A
Protected

Academic year: 2021

シェア "Microsoft Word - DEIM2012 冠詞誤り3"

Copied!
8
0
0

読み込み中.... (全文を見る)

全文

(1)

DEIM Forum 2012 E9-2

Web 資源を利用した冠詞の用法に基づく冠詞誤り自動修正

尾﨑 弘明

太田 学

†岡山大学工学部 〒700-8530 岡山県岡山市北区津島中 3-1-1

‡岡山大学大学院自然科学研究科 〒700-8530 岡山県岡山市北区津島中 3-1-1

E-mail: †,‡{osaki,ohta}@de.cs.okayama-u.ac.jp

あらまし あらまし あらまし あらまし 英語を母語としない日本人が英語を使用する際によくある誤りの一つに,冠詞の用法の誤りがある. 本稿では,Web 検索やオンライン辞書などの Web 資源を用いて,冠詞の用法に基づいて冠詞の誤りを自動修正する システムを提案する.本研究では,24 の冠詞の用法をシステムが判断し,さらに検索エンジンから取得した検索結 果数を考慮して入力された英文の冠詞を修正する.評価実験で,提案手法と検索結果のみを用いて修正を行う方法 と修正精度を比較した結果,一般的な文章では精度に差は出なかったが,論文のように比較的使用頻度の低い単語 が多く使われる文章においては,提案手法の精度が上回り,提案手法の有効性を示せた. キーワード キーワード キーワード キーワード Web 資源,冠詞,誤り検出,誤り修正

Automatic Correction of Article Errors Based on the Usage of Articles Using

Web Resources

Hiroaki OSAKI

Manabu OHTA

†Faculty of Engineering, Okayama University, 3-1-1 Tsusima-naka, Kita-ku, Okayama, 700-8530 Japan

‡Graduate School of Natural Science and technology, Okayama University, 3-1-1 Tsusima-naka, Kita-ku, Okayama,

700-8530 Japan

E-mail: †,‡{osaki,ohta}@de.cs.okayama-u.ac.jp

Keyword Web resources, article, error detection error correction

1.

はじ め に

はじ め に

はじ め に

はじ め に

近 年 , グ ロ ー バ ル 化 が 進 み , 企 業 や 学 校 な ど で , 英 語 を 使 用 す る 機 会 が 増 加 し て い る . 大 学 で も 海 外 の 学 会 で の 発 表 や 英 語 で 論 文 を 執 筆 す る こ と も 多 い . し か し , 英 語 を 母 語 と し な い 日 本 人 は 英 語 の 用 法 を し ば し ば 誤 る こ と が あ る の で , 英 作 文 の 校 正 を 自 動 で 行 う シ ス テ ム が 望 ま れ る .特 に 日 本 語 に は な い 冠 詞 の 誤 り は , 日 本 人 の 書 く 英 作 文 に 多 く 含 ま れ て い る [2]. そ こ で 本 稿 で は , 英 語 の 冠 詞 の 誤 り を 自 動 で 修 正 す る 手 法 を 提 案 す る . 提 案 手 法 は , 岡 山 大 学 工 学 部 情 報 工 学 科 専 門 英 語 の 講 義 で 使 用 し て い る テ キ ス ト [1] の 中 の 冠 詞 の 用 法 に 基 づ い て 修 正 を 行 う . 例 え ば ,“ The

result can be shown by () simple computation.” と い う 英

文 の ()に 入 る 冠 詞 を 考 え る . computation は 数 え ら れ な い 名 詞 だ が ,こ の 場 合 simple と い う 対 象 を 個 別 化 す る 形 容 詞 が computation を 修 飾 し て い る . そ の た め , 他 の も の (例 え ば , new computation な ど )と 対 比 さ れ , そ う い う 性 質 を も つ も の と い う 意 味 で 個 別 化 さ れ る の で , 不 定 冠 詞 の a が 入 る . こ の 例 で は , 冠 詞 の 用 法 を 検 出 す る 際 , 対 象 を 個 別 化 す る 形 容 詞 が 名 詞 を 修 飾 し て い る か 否 か で 判 断 す る . こ の よ う な 特 定 の 単 語 に 依 存 す る 冠 詞 の 用 法 を シ ス テ ム に 実 装 し た . ま た そ の た め に は , こ の よ う な 対 象 を 個 別 化 す る 形 容 詞 の 単 語 リ ス ト な ど が 必 要 に な る . 本 研 究 で は , Web 上 に そ の よ う な リ ス ト が あ れ ば そ れ を 利 用 し , な い 場 合 は 検 索 エ ン ジ ン を 利 用 し て 作 成 す る . こ の よ う な リ ス ト の 作 成 方 法 は 4 節 で 説 明 す る . ま た , 修 正 に 利 用 す る 冠 詞 の 用 法 に つ い て は 3 節 で 説 明 す る . 本 研 究 で は [1]に 書 か れ て い る 冠 詞 の 用 法 を 修 正 ル ー ル と し て 冠 詞 修 正 シ ス テ ム に 実 装 す る だ け で な く , 検 索 エ ン ジ ン を 用 い て Web 検 索 し , そ の 検 索 結 果 数 も 修 正 の 判 断 に 利 用 で き る よ う に す る . 本 稿 で は , 2 節 で 関 連 研 究 , 3 節 で は 冠 詞 修 正 シ ス テ ム に 用 い る 冠 詞 の 用 法 , 4 節 で 提 案 す る 冠 詞 の 修 正 方 法 を 説 明 す る .5 節 で 評 価 実 験 と そ の 考 察 を 述 べ ,6 節 で ま と め る .

2.

関連 研 究

関連 研 究

関連 研 究

関連 研 究

冠 詞 の 誤 り 修 正 に 関 す る 研 究 は , 主 に コ ー パ ス を 用 い る も の と 検 索 エ ン ジ ン を 用 い る も の が あ る . 例 え ば

(2)

コ ー パ ス ベ ー ス で 冠 詞 の 誤 り を 修 正 す る も の と し て [5-8]が 挙 げ ら れ る . こ れ ら は , コ ー パ ス か ら 統 計 量 を 抽 出 し , そ れ に 基 づ い て 単 語 の 出 現 状 況 を ル ー ル と し て 獲 得 す る こ と に よ り , そ の ル ー ル を 用 い て 冠 詞 の 誤 り を 検 出 し て 修 正 す る . 問 題 点 と し て は , コ ー パ ス の 規 模 を 大 き く す る こ と が 困 難 で あ る 点 と 冠 詞 の 例 外 的 用 法 へ の 対 応 が 難 し い 点 が 挙 げ ら れ る . 一 方 , 検 索 エ ン ジ ン を 利 用 し た 冠 詞 の 修 正 で は , [3][4]な ど が 挙 げ ら れ る .こ れ ら は 検 索 エ ン ジ ン を 用 い て 検 索 結 果 数 を 比 較 し て 冠 詞 を 修 正 す る 手 法 を 提 案 し て い る .[3]で は ,コ ー パ ス ベ ー ス の も の よ り も 検 索 エ ン ジ ン を 用 い た も の の 方 が 良 い 結 果 が 出 る こ と が 報 告 さ れ て い る .ま た [3]で は ,検 索 ク エ リ の パ タ ー ン を 名 詞 の 単 数 形 と 複 数 形 の 場 合 に 分 け て 増 や す こ と で , 精 度 の 向 上 が 確 認 さ れ て い る の で , 本 研 究 で も そ れ を 採 用 し た . 他 に も ,[9]の よ う な 既 出 の 名 詞 に 着 目 し た ,最 大 エ ン ト ロ ピ ー 分 類 器 を 用 い た も の も あ る .

3.

冠詞 の 用 法

冠詞 の 用 法

冠詞 の 用 法

冠詞 の 用 法

本 節 で は [1] を 参 考 に 修 正 シ ス テ ム に 実 装 し た 冠 詞 の 用 法 に つ い て 説 明 す る .ま ず 名 詞 が 可 算 か 不 可 算 か , 単 数 形 か 複 数 形 か に 分 け て 冠 詞 の 用 法 を 述 べ , 次 に 不 定 冠 詞 , 定 冠 詞 , 無 冠 詞 の 用 法 に つ い て 説 明 す る .

3.1

可算

可算 /不可算名詞と

可算

可算

不 可 算 名詞と

不 可 算 名詞と

不 可 算 名詞と冠 詞 の用法

冠 詞 の用法

冠 詞 の用法

冠 詞 の用法

名 詞 が 可 算 か 不 可 算 か に よ る 冠 詞 の 用 法 を 表 1,2 に 示 す . こ れ ら の 表 の ○ は 可 能 な 組 み 合 わ せ で , ×は 通 常 不 可 能 な 組 み 合 わ せ に な る . 名 詞 が 可 算 か 不 可 算 か の 情 報 は 冠 詞 の 修 正 に お い て 有 用 な の で , 冠 詞 修 正 の 判 断 に 利 用 す る . ま た 逆 に , 可 算 名 詞 か 不 可 算 名 詞 か を 判 断 す る 上 で 表 1,2 の 情 報 が 利 用 で き る .

3.2

不定 冠 詞の用 法

不定 冠 詞の用 法

不定 冠 詞の用 法

不定 冠 詞の用 法

不 定 冠 詞 は 基 本 的 に 複 数 あ る も の の 一 つ を 取 り 上 げ た こ と を 表 す の に 使 わ れ る . 用 法 と し て は ,「 一 つ 」 と い う 意 味 で one と 同 じ 意 味 で 使 わ れ た り , 多 数 存 在 す る も の の 中 か ら 任 意 に 選 ん だ 一 つ と い う 意 味 を 表 し た り す る 用 法 な ど が あ る .具 体 的 な 用 法 を 以 下 に 示 す . (1) こ れ ま で に 存 在 し て い な か っ た 何 か が 新 た に 得 ら れ た り 発 生 し た り し た も の を 示 す

例 :From this, we can obtain an important theorem. こ の 場 合 生 成 や 発 見 な ど を 表 す 動 詞 と 組 み 合 わ さ れ る こ と が 多 い .

(2)不 定 冠 詞と 組 み合 わ され る 構 文 や 表現 で 用い ら れる

例 :There is a situation in which this approach is necessary.

(3) 対 象 を 個 別 化 す る 形 容 詞 に 修 飾 さ れ て い る

例 : The result can be shown by a simple computation.

3.3

定冠 詞の用 法

定冠 詞の用 法

定冠 詞の用 法

定冠 詞の用 法

定 冠 詞 は 基 本 的 に 対 象 の も の が 一 つ し か 存 在 し な

表 1 可算名詞と冠詞の組み合わせ

可 算 名 詞と 冠 詞 の 組み 合 わ せ

可 算 名 詞と 冠 詞 の 組み 合 わ せ

可 算 名 詞と 冠 詞 の 組み 合 わ せ

a/an the φ (無 冠 詞 ) 単 数 形 ○ ○ ○ 複 数 形 × ○ ○

表 2 不可算名詞と冠詞の組み合わせ

不 可 算 名詞 と 冠 詞 の組 み 合 わせ

不 可 算 名詞 と 冠 詞 の組 み 合 わせ

不 可 算 名詞 と 冠 詞 の組 み 合 わせ

a/an the φ (無 冠 詞 ) 単 数 形 × ○ ○ 複 数 形 × × × い こ と を 表 す . 3.2 節 と 同 様 に , 具 体 的 な 用 法 を 以 下 に 示 す . (4) 直 前 に 述 べ た も の を 指 す (5) 読 者 が み な 知 っ て い る と 思 わ れ る も の の 場 合 , 了 解 を 意 味 す る 形 容 詞 で 済 ま せ る と き

例 :the standard … ,the famous な ど

(6) the ~ of …の 形 で 対 象 ~の 性 質 や 特 徴 を 示 す

例 :The existence of such function is obvious.

(7) そ の 名 詞 節 の 内 容 が that 以 下 に 述 べ ら れ て い る こ

と を 示 す

例 :This property is due to the assumption that the noise

is Gaussian.

(8) そ の 個 数 だ け 存 在 す る 基 数 を 伴 う 名 詞

例 :When we view the line segment, the two endpoints

may not be visible.

(9) 普 通 名 詞 か ら 転 じ た 固 有 名 詞

例 :the United Nations, the White House な ど

(10)人 名 を 冠 し た 対 象

例 :the Fourier transform な ど

(11)最 上 級 の 前

例 :It is the easiest way to prove this theorem.

(12)定 冠 詞 と 組 み 合 わ さ れ る と 決 ま っ た も の

例 :the same as…, the past な ど

(13)特 定 の 形 容 詞 +of+名 詞 の 複 数 形 の 形

例 : some of the … , most of the … な ど

3.4

無冠 詞の用 法

無冠 詞の用 法

無冠 詞の用 法

無冠 詞の用 法

名 詞 が 無 冠 詞 に な る の は , 上 記 の 不 定 冠 詞 や 定 冠 詞 の 用 法 の 範 疇 に 入 ら な い 場 合 と い え る . 用 法 を 以 下 に 示 す . (14)単 数 形 な ら 不 定 冠 詞 の つ く 場 合 で 名 詞 が 複 数 形 の 場 合 (15)不 特 定 の 数 え ら れ な い 名 詞 例 :rain, snow な ど (16)ア ポ ス ト ロ フ ィ s を 伴 う 人 名 の 所 有 格 例 :Green’s theorem な ど (17)名 詞 が 列 記 さ れ て い て , 一 ま と ま り の 場 合 は 冒 頭 の 単 語 に の み 冠 詞 を つ け て 以 降 の 名 詞 の 冠 詞 を 省 略 す る

(3)

(18)動 詞 か ら 転 じ た 動 作 を 示 す 名 詞

例 :Application of this identity proves the theorem.

(19)特 定 の 形 容 詞 が つ い た 場 合

例 :In every case, each variable assumes a different value.

(20)記 号 を 固 有 の 対 象 と し て 扱 う 時

例 :Consider a line segment connecting point P and point Q.

(21)特 定 の 数 値 を 扱 う 時

例 :Consider a circle of radius 2.

(22)学 問 や 専 門 分 野 の 名 前

例 :mathematics, vector analysis な ど

(23)慣 用 句 的 な 表 現

例 :in general, for example な ど

(24)冠 詞 相 当 語 に 修 飾 さ れ て い る 例 :his, those な ど に 修 飾 さ れ て い る

4.

冠詞 誤 り 自動 修 正 シス テム

冠詞 誤 り 自動 修 正 シス テム

冠詞 誤 り 自動 修 正 シス テム

冠詞 誤 り 自動 修 正 シス テム

本 節 で は , 提 案 す る 冠 詞 の 自 動 修 正 シ ス テ ム に つ い て 説 明 す る .

4.1

システム概 要

システム概 要

システム概 要

システム概 要

こ こ で は , 冠 詞 修 正 シ ス テ ム の 処 理 の 流 れ を 説 明 す る (図 1). ま ず , 英 文 を 入 力 す る . 既 出 の 名 詞 に は 定 冠 詞 が つ き や す い の で ,入 力 す る 英 語 の 文 章 は 一 文 だ け で な く , 修 正 対 象 の 文 章 全 て を 入 力 す る . 次 に , 入 力 文 の 名 詞 句 に 対 し て , 名 詞 句 ご と に 3 節 で 挙 げ た 冠 詞 の 用 法 に 当 て は ま る か ど う か を 検 出 す る . ま た 同 時 に , 検 索 エ ン ジ ン を 用 い て そ の 名 詞 句 に お け る 3 つ の 冠 詞 パ タ ー ン の 検 索 結 果 数 を 取 得 す る . 最 後 に , こ れ ら 二 つ の 結 果 を 基 に 冠 詞 の 適 切 性 を 判 断 し , 不 適 切 な 場 合 は 修 正 案 を 提 示 す る . 以 下 で 冠 詞 の 用 法 の 検 出 , 検 索 結 果 数 の 取 得 , 冠 詞 の 修 正 に つ い て 詳 し く 説 明 す る .

4.2

冠詞の用法の検 出

冠詞の用法の検 出

冠詞の用法の検 出

冠詞の用法の検 出

入 力 文 の 名 詞 節 に 当 て は ま る 冠 詞 の 用 法 の 検 出 方 法 に つ い て 説 明 す る .用 法 は 3.1 節 で 述 べ た 可 算 /不 可 算 に よ る 用 法 と 3.2~ 3.4 節 の 冠 詞 の 用 法 (1)~ (24)を 調 べ る .

4.2.1

検出 手 法

検出 手 法

検出 手 法

検出 手 法

3.1 節 の 表 1,2 に 示 し た よ う に 名 詞 の 可 算 /不 可 算 の 判 別 は 冠 詞 を 検 討 す る 上 で 有 効 で あ る . よ っ て , オ ン ラ イ ン 辞 書 を 利 用 し て 可 算 /不 可 算 を 判 断 す る .し か し , 可 算 名 詞 と 不 可 算 名 詞 両 方 の 意 味 が あ る 場 合 は , 冠 詞 の 修 正 に 用 い な い . 3 節 の 冠 詞 の 用 法 の 検 出 方 法 を そ れ ぞ れ 説 明 す る (表 4). (4)の 用 法 に つ い て は , 対 象 の 名 詞 よ り も 前 の 文 を 見 て 判 断 す る . 詳 し く は 4.2.2 節 で 述 べ る . (6)~ (9), (11), (14)~ (17), (20), (21), (24)は 形 態 素 解 析 の 結 果 と 文 の 形 か ら 検 出 す る .(1)~ (3),(5),(10),(12),(13), (18), (19), (22), (23)は 特 定 の 単 語 に 依 存 す る た め ,

図 1 冠詞修正システムの概要

冠 詞 修 正シ ス テ ム の概 要

冠 詞 修 正シ ス テ ム の概 要

冠 詞 修 正シ ス テ ム の概 要

あ ら か じ め そ の 単 語 を 収 集 し リ ス ト を 作 成 す る か , あ る い は ,Web 上 に あ る 情 報 を 利 用 す る .(2),(13),(19) は [1]に あ る 例 文 の 構 文 や 表 現 を 用 い た . (10)で 用 い る 人 名 と (12), (18), (22), (23)に つ い て は Web 上 に あ る リ ス ト ま た は オ ン ラ イ ン 辞 書 か ら 抽 出 し た .(1)の 生 成 , 発 生 ,発 見 ,取 得 ,導 入 ,定 義 を 表 す 動 詞 と (5)の 了 解 を 意 味 す る 形 容 詞 は [1] に 挙 げ ら れ て い る 例 の 類 義 語 を オ ン ラ イ ン 辞 書 を 用 い て 収 集 し リ ス ト を 作 成 し た . ま た ,(1)で 用 い ら れ る 動 詞 の 対 象 に な る 名 詞 も 冠 詞 の 修 正 に 有 用 で あ る と 考 え ,リ ス ト を 作 成 し た .(1)の 名 詞 と (3)の 対 象 を 個 別 化 す る 形 容 詞 は Web 上 に リ ス ト が な か っ た の で ,検 索 エ ン ジ ン を 用 い て 単 語 を 収 集 し , リ ス ト を 作 成 し た . 単 語 の 収 集 方 法 は 4.2.3 節 で 述 べ る .

4.2.2

既出 の

既出 の

既出 の

既出 の 名 詞

名 詞

名 詞

名 詞

3 節 の (4)の 用 法 で は そ の 名 詞 が 既 出 か ど う か を そ の 名 詞 よ り 前 の 文 を 調 べ て 判 断 す る . 単 に 同 じ 単 語 が 出 現 し て い る か だ け で な く ,以 下 の よ う な 方 法 で 調 べ る . ・ ・・ ・ 検 討 す る 名 詞 句 に 名 詞 が 一 つ の 場 合 は 単 に そ の 名 詞 が 出 現 し て い る か ・ ・・ ・ 検 討 す る 名 詞 句 に 名 詞 が 熟 語 と し て 存 在 し て い る 場 合 , そ の 熟 語 ま た は 熟 語 の 最 後 の 名 詞 が 出 現 し て い る か

4.2.3

単語 の 収 集

単語 の 収 集

単語 の 収 集

単語 の 収 集

3 節 の (1) の 動 詞 の 対 象 と な る 名 詞 と (3) の 個 別 化 す る 形 容 詞 は Web 上 に リ ス ト が な い の で 検 索 エ ン ジ ン を 用 い て 単 語 を 収 集 し , リ ス ト を 作 成 す る . 検 索 に 用 い る ク エ リ は ,[1]の 例 文 に あ る 収 集 対 象 の 単 語 を 含 む 名 詞 句 と 対 象 を 個 別 化 す る 形 容 詞 は そ の 前 の 単 語 を , (1)の 動 詞 の 対 象 と な る 名 詞 は そ の 後 の 単 語 を 用 い る . 集 め る 単 語 の 部 分 を ワ イ ル ド カ ー ド に 置 き 換 え , こ れ を 検 索 ク エ リ と す る . 例 え ば “ The result can be shown

by a simple computation.”と い う 例 文 か ら 個 別 化 す る 形

容 詞 を 集 め る 場 合 ,“ by a * computation” と な る .

(1) の 場 合 は [1] の 例 文 と オ ン ラ イ ン 辞 書 で 集 め ら れ

(4)

示 す . (a) [1]の 例 文 か ら 収 集 対 象 の 単 語 を ワ イ ル ド カ ー ド に 置 き 換 え た 検 索 ク エ リ を 生 成 す る (b) (a)の ク エ リ を 用 い て 検 索 し , 検 索 結 果 の サ マ リ か ら ワ イ ル ド カ ー ド に マ ッ チ し た 名 詞 を 抽 出 す る . (c) 抽 出 し た 名 詞 が (1)の 用 法 と し て 使 わ れ る か を 確 認 す る た め に , ワ イ ル ド カ ー ド を 抽 出 し た 名 詞 に 置 き 換 え た 検 索 ク エ リ で 検 索 し , 冠 詞 の 部 分 を 他 の 冠 詞 に 置 き 換 え た 場 合 の 検 索 結 果 数 と 比 較 す る . (d) (c)で 得 ら れ た 検 索 結 果 数 の 一 番 多 い 冠 詞 が 元 の 冠 詞 と 同 じ で あ れ ば , そ の 名 詞 を リ ス ト に 加 え る . (e) 検 索 ク エ リ の 動 詞 を あ ら か じ め 集 め て お い た 動 詞 と 置 き 換 え , こ れ を 新 し い 検 索 ク エ リ と す る . そ し て ,(b)~ (d)の 処 理 を 行 う .こ れ を オ ン ラ イ ン 辞 書 で 集 め た (1)で 用 い る 動 詞 全 て で 行 う .

上 で 説 明 し た 手 順 を 例 文 “ We want to find a solution of

this equation.”を 用 い て 説 明 す る .(a)で は ,“ find a * of” を 検 索 ク エ リ と す る . (b)で は 検 索 結 果 の サ マ リ か ら * が 名 詞 の も の を 集 め る .例 え ば ,discovery と い う 名 詞 を 収 集 で き た と す る . (c)で , *に discovery を 挿 入 し , 元 の 不 定 冠 詞 の 場 合 と 冠 詞 を 定 冠 詞 , 無 冠 詞 に 変 更 し て 検 索 結 果 数 を 比 較 す る .そ し て ,(d)の 通 り 不 定 冠 詞 の 検 索 結 果 数 が 最 も 多 け れ ば discovery を 名 詞 の リ ス ト に 追 加 す る . 次 に (e)で , find を locate な ど の 別 の 動 詞 と 入 れ 替 え (b)~ (d)の 手 順 で こ の よ う な 名 詞 を さ ら に 収 集 す る . 一 方 ,(3)の 個 別 化 す る 形 容 詞 の 収 集 で は ,[1]の 例 文 の み を 用 い て 検 索 を 行 う . 以 下 に 手 順 を 示 す . (a) 検 索 ク エ リ を 例 文 か ら 作 成 す る (b) (a)の ク エ リ で 検 索 し , 検 索 結 果 の サ マ リ か ら ワ イ ル ド カ ー ド に マ ッ チ し た 形 容 詞 を 抽 出 す る . (c) こ れ ら の 形 容 詞 が そ の 用 法 と し て 使 わ れ る か を 確 認 す る た め に , ワ イ ル ド カ ー ド を 収 集 し た 形 容 詞 に 置 き 換 え た 検 索 ク エ リ で 検 索 し , さ ら に 冠 詞 の 部 分 を 他 の 冠 詞 に 置 き 換 え た 場 合 の 検 索 結 果 数 と 比 較 す る . (d) (c)で 得 ら れ た 検 索 結 果 数 の 一 番 多 い 冠 詞 が 元 の 例 文 の 冠 詞 と 同 じ で あ れ ば , そ の 形 容 詞 を リ ス ト に 加 え る . (e) 一 つ の 例 文 か ら な る べ く 多 く の 形 容 詞 を 収 集 す る た め に 検 索 ク エ リ の 形 容 詞 に つ づ く 名 詞 一 つ を 変 更 す る . ま ず , ワ イ ル ド カ ー ド を (d)で リ ス ト に 加 え た 形 容 詞 と 置 き 換 え , 置 き 換 え た 形 容 詞 の 後 の 単 語 一 つ を ワ イ ル ド カ ー ド に 置 き 換 え る . 次 に そ れ を 検 索 ク エ リ と し て 検 索 し , ワ イ ル ド カ ー ド に マ ッ チ し た 名 詞 を 抽 出 す る . 抽 出 し た 名 詞 を ワ イ ル ド カ ー ド と 置 き 換 え , 再 び 形 容 詞 を ワ イ ル ド カ ー ド に 置 き 換 え て 新 し い 検 索 ク エ リ と す る . そ し て ,再 度 (b)~ (d)を 行 う .こ れ を 最 初 の 検 索 で 収 集 し た 形 容 詞 全 て で 行 う . 3 節 の (3)の 対 象 を 個 別 化 す る 形 容 詞 の 例 文“ The result can be shown by a simple computation.” を 用 い て こ の 処

理 を 説 明 す る .(a)で は ,“ by a * computation”を 検 索 ク エ リ と す る . (b)で は 検 索 結 果 の サ マ リ か ら *が 形 容 詞 の も の を 集 め る .こ こ で 例 え ば new と い う 形 容 詞 を 抽 出 で き た と す る . (c)“ by a * computation” の *に new を 挿 入 し , 不 定 冠 詞 の a の 場 合 と そ れ を 定 冠 詞 , 無 冠 詞 に 変 更 し た 場 合 を 比 較 す る . そ し て , a の 検 索 結 果 数 が 多 い と き , new を 対 象 を 個 別 化 す る 形 容 詞 と し て リ ス ト に 追 加 し , 冠 詞 の 用 法 の 検 出 に 利 用 す る . 次 に

(e)で ,“ by a simple computation” に お い て simple を 集

め た 形 容 詞 に 置 き 変 え た 検 索 ク エ リ を 用 い て ,

computation 以 外 の 名 詞 を 収 集 す る .例 え ば ,先 ほ ど 得

ら れ た new を simple と 置 き 換 え ,“ by a new * ” と い う 検 索 フ レ ー ズ を 生 成 し , 今 度 は computation に 相 当 す る 名 詞 を 収 集 す る .例 え ば ,method が 収 集 で き た と す る と , 今 度 は “ by a * method” と い う フ レ ー ズ を 生 成 し て ,(b)~ (d)の 手 順 で 形 容 詞 を さ ら に 収 集 し ,対 象 を 個 別 化 す る 形 容 詞 の リ ス ト に 追 加 し て い く .

4.3

検索 結 果 数の取得

検索 結 果 数の取得

検索 結 果 数の取得

検索 結 果 数の取得

検 索 エ ン ジ ン を 用 い て 不 定 冠 詞 と 定 冠 詞 , 無 冠 詞 の 場 合 の 検 索 結 果 数 を 取 得 す る 方 法 に つ い て 説 明 す る .

4.3.1

検索 ク エ リの 生 成

検索 ク エ リの 生 成

検索 ク エ リの 生 成

検索 ク エ リの 生 成

検 索 ク エ リ は 名 詞 句 と そ れ に 名 詞 句 の 一 つ 前 の 単 語 を 加 え た も の を 用 い る . そ れ に 名 詞 句 の 最 後 の 名 詞 を 単 数 形 と 複 数 形 に 分 け た 6 パ タ ー ン を 検 索 ク エ リ と す る .“ I read a book.” を 例 に book に つ い て 検 索 ク エ リ を 生 成 し た 例 を 表 3 に 示 す . 検 索 ク エ リ を 単 数 形 と 複 数 形 に 拡 張 し た 6 パ タ ー ン で 検 索 を し た 方 が 良 い 結 果 が 得 ら れ る と い う 報 告 [3]か ら , こ れ を 採 用 し た .

4.3.2

検索 手 順

検索 手 順

検索 手 順

検索 手 順

表 3 に 示 し た 検 索 ク エ リ を 用 い て 検 索 を 実 行 す る . 以 下 に 検 索 の 手 順 を 示 す . (a)検 索 ク エ リ の 生 成 (b)検 索 エ ン ジ ン を 使 い , 6 パ タ ー ン の 検 索 ク エ リ 検 索 結 果 数 を 取 得 す る (c)検 索 結 果 数 が 閾 値 を 下 回 っ た 場 合 ,検 索 ク エ リ の 単 語 を 一 つ 減 ら し , (b)に 戻 り 再 検 索 を す る (d)検 索 結 果 数 が 閾 値 を 超 え た 場 合 ,そ れ を 結 果 と し て 利 用 す る . 本 研 究 で は 閾 値 は 0 に 設 定 し た .(c)に お い て 6 パ タ ー ン の 検 索 ク エ リ で 閾 値 を 下 回 っ た 場 合 , 複 合 名 詞 の 場 合 は 前 の 名 詞 を 減 ら し , 単 体 名 詞 が 場 合 は , 修 飾 し て い る 形 容 詞 や 副 詞 な ど を 削 除 し て 再 検 索 を 行 う .

4.4

冠詞の修正

冠詞の修正

冠詞の修正

冠詞の修正

4.2,4.3 節 の 結 果 を 基 に 修 正 を 行 う .ま ず ,4.2 節 の

(5)

表 3 検索クエリの作成例

検 索 ク エリ の 作 成 例

検 索 ク エリ の 作 成 例

検 索 ク エリ の 作 成 例

a/an the φ (無 冠 詞 )

単 数 形 read a book read the book read book

複 数 形 read a books read the books read books

冠 詞 の 用 法 の 検 出 の 結 果 に よ っ て 以 下 の 3 パ タ ー ン に 分 類 で き る . (1) 検 出 さ れ た 用 法 に よ っ て 使 用 す べ き 冠 詞 が 一 意 に 決 ま る . (2) 検 出 さ れ た 用 法 か ら 複 数 の 冠 詞 の 修 正 案 が 提 示 さ れ る . (3) 用 法 が 検 出 さ れ な い . 結 果 が (a) の 場 合 は そ の ま ま そ の 冠 詞 を 修 正 案 と し て 提 示 す る .結 果 が (b)の 場 合 は 考 え ら れ る 冠 詞 を 修 正 候 補 と し , そ の 修 正 候 補 を 4.3 節 の 検 索 結 果 数 を 用 い て 比 較 し ,修 正 案 を 決 定 す る .結 果 が (c)の 場 合 は ,表 1,2 に 従 っ て 不 定 冠 詞 ,定 冠 詞 ,無 冠 詞 を 検 索 結 果 数 で 比 較 し , 修 正 案 を 提 示 す る . 例 え ば (c)で , 名 詞 が 複 数 形 と だ け 分 か っ た 場 合 は , 定 冠 詞 と 無 冠 詞 の 場 合 が 考 え ら れ る . こ の 場 合 , 定 冠 詞 と 無 冠 詞 の 場 合 の 検 索 結 果 数 を 比 較 し , 修 正 案 を 決 定 す る .ま た ,(b)の 場 合 で は 用 法 の 組 み 合 わ せ に よ っ て は 例 外 的 に 冠 詞 が 一 意 的 に 決 ま る も の も あ る . そ の 場 合 は あ ら か じ め 実 装 し て お い た 例 外 パ タ ー ン で 修 正 案 を 決 定 す る . 例 え ば “ The result can be shown by *

simple computation.”を 考 え る .こ の 場 合 simple は「 対

象 を 個 別 化 す る 形 容 詞 」で ,computation は「 数 え ら れ な い 名 詞 」と な っ て い る が ,[1]に は ,数 え ら れ な い 名 詞 を 個 別 化 す る 形 容 詞 が 修 飾 し た 場 合 , 不 定 冠 詞 と す る と い う 規 則 が あ る . こ の よ う に , 例 外 的 な 規 則 が あ る 場 合 は そ れ を 優 先 し , そ う で な い 場 合 は , 検 出 さ れ た 用 法 の 候 補 を 検 索 結 果 数 で 比 較 し , そ れ を 修 正 案 と す る . ま た , 優 先 度 の 高 い 用 法 に つ い て は そ れ を 優 先 し , 修 正 案 を 決 定 す る . も し そ れ で 決 め ら れ な い 場 合 は 優 先 度 の な い 冠 詞 の 用 法 を 検 出 し た 場 合 と 同 じ 扱 い で , 修 正 案 を 決 定 す る . 優 先 す る 冠 詞 の 用 法 を 以 下 に 示 す . (16)ア ポ ス ト ロ フ ィ s を 伴 う 人 名 の 所 有 格 (21)特 定 の 数 値 を 扱 う 時 (23)慣 用 句 的 な 表 現 (24)冠 詞 相 当 語

5.

実験

実験

実験

実験

実 験 で は ,4.2.3 節 で 述 べ た 用 法 の 検 出 に 必 要 な 名 詞 お よ び 形 容 詞 の リ ス ト の 作 成 と , 冠 詞 誤 り の 修 正 精 度 の 評 価 実 験 に つ い て 述 べ る .

5.1 リ ス ト の 作 成

リ ス ト の作 成

リ ス ト の作 成

リ ス ト の作 成

3.2 節 の (1)で 用 い ら れ る 動 詞 の 目 的 語 に な る 名 詞 と (3) の 個 別 化 す る 形 容 詞 の リ ス ト を 作 成 し た . 検 索 エ ン ジ ン は Yahoo!検 索 WebAPI[10]を 用 い た .そ の 結 果 ,表 5 で 示 し た よ う に ,(1)で は 1,036 の 名 詞 ,(3)で は 3,458 の 形 容 詞 を 収 集 し た . 収 集 し た 名 詞 お よ び 形 容 詞 の 例 を 挙 げ る .(1)の 名 詞 で は , solution, method な ど が 収 集 で き た . こ れ は 発 見 や 定 義 な ど を 表 す 動 詞 の 目 的 語 に な っ て い た た め 収 集 さ れ た と 考 え ら れ る .(3)の 個 別 化 す る 形 容 詞 は さ ら に 多 く 収 集 で き た . ま た , 収 集 の 際 同 じ 形 容 詞 が 何 度 も 出 て く る こ と が 多 か っ た の で 信 頼 性 は 高 い と い え る . こ こ で は ,vivid,difficult な ど の 形 容 詞 が 収 集 さ れ た . ま た , 収 集 し た 名 詞 お よ び 形 容 詞 の 中 に は い く つ か 品 詞 が 違 う も の な ど も 含 ま れ る が , 用 法 の 検 出 は 形 態 素 解 析 に よ っ て 入 力 文 中 の 品 詞 を 判 断 し て か ら リ ス ト と 照 合 す る の で 問 題 な い .

5.2 冠 詞 誤 り の 修 正 実 験

冠 詞 誤 りの 修 正実 験

冠 詞 誤 りの 修 正実 験

冠 詞 誤 りの 修 正実 験

評 価 実 験 で は , 冠 詞 誤 り を 含 む 英 文 に 対 し て 冠 詞 の 自 動 修 正 を 試 み て そ の 修 正 精 度 を 評 価 し た .本 実 験 で は ,[1]の 冠 詞 を 扱 っ た 節 に 挙 げ ら れ て い る 英 文 と New York Times[14]の 記 事 ,論 文 の 抄 録 を 修 正 対 象 と し て 用 い た . 実 験 で は (i)こ れ ら 実 験 対 象 の 英 文 の 誤 り を 含 ま な い 正 解 デ ー タ と 同 じ 冠 詞 を 修 正 案 と し て 提 示 で き る か , (ii)冠 詞 の う ち 半 数 を ラ ン ダ ム に 誤 っ た 冠 詞 (無 冠 詞 も 含 む )に 置 き 換 え ,そ れ を 修 正 で き る か を 評 価 し た . 本 手 法 は 単 語 に 依 存 し て い る の で , ス ペ ル ミ ス , 冠 詞 以 外 の 単 語 の 誤 り は な い も の と 仮 定 す る . ま た , 実 験 は 提 案 手 法 と 検 索 結 果 数 の み を 用 い て 修 正 を 行 っ た 場 合 を 比 較 し た . 本 実 験 で も リ ス ト の 作 成 と 同 様 に 検 索 エ ン ジ ン は Yahoo!検 索 WebAPI[10]を 用 い た .オ ン ラ イ ン 辞 書 と し て は Weblio 英 和 和 英 辞 書 [11]を 用 い た .ま た , 人 名 に つ い て は 欧 羅 巴 人 名 録 [12], 米 国 国 勢 調 査 局 1990 Census Name Files[13]を 用 い た .

5.2.1 評 価 尺 度

評 価尺 度

評 価尺 度

評 価尺 度

評 価 尺 度 と し て 以 下 の 3 つ を 用 い る .F 値 の P は 適 合 率 , R は 再 現 率 の こ と で あ る .

実際の冠詞誤りの数

誤りの数

正しく修正された冠詞

再現率

=

修正された誤りの数

誤りの数

正しく修正された冠詞

適合率

=

R

P

PR

+

=

2

F値

5.2.2 実 験 結 果

実 験結 果

実 験結 果

実 験結 果

本 実 験 で は 検 索 結 果 数 の み を 用 い て 冠 詞 を 修 正 し た 場 合 と 提 案 手 法 と の 比 較 を 行 っ た . 検 索 結 果 数 の み を 用 い る 修 正 は , 表 3 の よ う な 6 パ タ ー ン の 検 索 結 果 数 を 比 較 し , 検 索 結 果 数 の 最 も 多 い 冠 詞 を 修 正 案 と す

(6)

る . ま た , 検 索 結 果 数 の 最 も 多 い 冠 詞 が 二 つ 以 上 あ る 場 合 に は , 修 正 案 を 一 つ に 絞 れ な い の で 修 正 を 行 わ な い . 様 々 な 文 章 で 評 価 を 行 う た め , 修 正 実 験 の 対 象 と し て 3 種 類 の 文 章 を 用 意 し た . そ れ ぞ れ の 実 験 結 果 を 以 下 に 示 す .

5.2.2.1 専 門 英 語 教

専 門英 語 教

専 門英 語 教 科 書

専 門英 語 教

科 書

科 書

科 書 の英

の英

の英 文 を 用い た 実 験

の英

文 を 用い た 実 験

文 を 用い た 実 験

文 を 用い た 実 験

[1]に あ る 英 文 を 用 い て 実 験 を 行 っ た .こ の 例 文 は 全 30 文 で 構 成 さ れ , 145 の 検 討 す べ き 名 詞 句 が あ っ た . ま た , こ の 英 文 は そ れ ぞ れ 単 文 で お 互 い に 関 連 は な い の で , 3.3 節 の (4)の 用 法 は 同 一 文 内 の 前 後 関 係 を み て 判 断 し た .実 験 結 果 を 表 6,7 に 示 す .表 6 は 得 ら れ た 修 正 案 が 正 解 デ ー タ と 一 致 し て い る か , 表 7 は 冠 詞 誤 り の 修 正 実 験 の 結 果 で , 無 作 為 に 正 解 デ ー タ の 冠 詞 の 半 数 (73 箇 所 )を 誤 っ た 冠 詞 に 入 れ 替 え て 実 験 を 行 っ た 結 果 で あ る . [1]の 英 文 は ,提 案 手 法 で 用 い た 冠 詞 の 用 法 を 説 明 す る 章 の 練 習 問 題 に な っ て い る の で , 英 文 中 に 検 出 で き る 冠 詞 の 用 法 が 多 く あ っ た . 表 6 や 表 7 の 評 価 で は , 検 索 結 果 数 を 用 い た 手 法 に 比 べ 高 く な っ た が , そ の 点 は 留 意 す る 必 要 が あ る .ま た ,[1]は 学 術 論 文 を 英 語 で 書 く た め の テ キ ス ト で も あ る の で , そ の 例 文 で は 使 用 頻 度 の 低 い 単 語 が 多 く 使 用 さ れ て い た . そ の た め , 検 索 結 果 数 を 用 い る 手 法 の 修 正 精 度 は 低 く な っ た と 考 え ら れ る . 本 実 験 で , 両 手 法 で 修 正 案 を 誤 っ た 箇 所 や 提 案 手 法 の み 誤 っ た 箇 所 , 提 案 手 法 の み 正 解 し た 箇 所 な ど に つ い て 述 べ る . 検 索 結 果 数 の み を 用 い た 手 法 は , 使 用 頻 度 の 低 い 単 語 が 使 わ れ て い る 場 合 に 間 違 い が 多 か っ た . ま た , 検 索 結 果 数 が 十 分 で も 修 正 案 を 間 違 う こ と も 多 少 あ っ た が , こ の 場 合 , 正 解 と 修 正 案 の 検 索 結 果 数 は 近 い こ と が 多 か っ た . 両 手 法 共 通 で 間 違 っ て い た 箇 所 は , 提 案 手 法 で 用 法 が 検 出 さ れ て い な い , ま た は 検 出 さ れ て い る が 複 数 の 用 法 が 検 出 さ れ て い て 修 正 案 を 決 定 で き ず に 検 索 結 果 数 を 用 い て 修 正 し て い る 場 合 が 多 か っ た . 提 案 手 法 の み で 誤 っ て い る 箇 所 に つ い て は , 4.4 節 で 挙 げ た 優 先 す る 冠 詞 の 用 法 以 外 が 検 出 さ れ て い る 場 合 で , 特 に 5.1 節 で 作 成 し た 名 詞 お よ び 形 容 詞 の リ ス ト を 用 い る (1), (3) の 用 法 が 検 出 さ れ た 場 合 と (6)の 用 法 が 検 出 さ れ た 場 合 が 多 か っ た .し か し ,提 案 手 法 の み 正 解 し て い る 箇 所 で も , 冠 詞 の 用 法 の (1), (3)が 検 出 さ れ て い る 場 合 が 多 か っ た .よ っ て ,作 成 し た 名 詞 お よ び 形 容 詞 リ ス ト は 有 効 だ が , 品 詞 の 収 集 方 法 等 に 改 善 の 余 地 が あ る .

5.2.2.2 New York Times を 用 い た 実 験

を用 い た 実験

を用 い た 実験

を用 い た 実験

New York Times の 記 事 一 つ を 用 い て 実 験 を 行 っ た .

こ の 記 事 は 51 文 で 構 成 さ れ ,398 の 検 討 す べ き 名 詞 句

表 4

検 出 方法 一 覧

検 出 方法 一 覧

検 出 方法 一 覧

検 出 方法 一 覧

検 出 方 法 冠 詞 の 用 法 前 方 参 照 (4) 直 前 に 述 べ た も の を 指 す 形 態 素 解 析 , 文 の 形 (6) the ~ of … の 形 で 対 象 ~の 性 質 や 特 徴 を 示 す (7)そ の 名 詞 句 の 内 容 が that 以 下 に 述 べ ら れ て い る こ と を 示 す (8)そ の 個 数 だ け 存 在 す る 基 数 を 伴 う 名 詞 (9)普 通 名 詞 か ら 転 じ た 固 有 名 詞 (11)最 上 級 の 前 (14)単 数 形 な ら 不 定 冠 詞 の つ く 場 合 で 名 詞 が 複 数 形 の 場 合 (15)不 特 定 の 数 え ら れ な い 名 詞 (16)ア ポ ス ト ロ フ ィ s を 伴 う 人 名 の 所 有 格 (17)名 詞 が 列 記 さ れ て る と き (20)記 号 を 固 有 の 対 象 と し て 扱 う 時 (21)特 定 の 数 値 を 扱 う 時 (24)冠 詞 相 当 語 [1]の 例 文 か ら 作 成 し た リ ス ト (2) 不 定 冠 詞 と 組 み 合 わ さ れ る 構 文 や 表 現 で 用 い ら れ る (13)特 定 の 形 容 詞 +of+名 詞 の 複 数 形 の 形 (19)特 定 の 形 容 詞 が つ い た 場 合 Web 上 に あ る リ ス ト , オ ン ラ イ ン 辞 書 (1) 新 た に 得 ら れ た り 発 生 し た り し た も の を 示 す (動 詞 ) (10)人 名 を 冠 し た 対 象 (12)定 冠 詞 と 組 み 合 わ さ れ る と 決 ま っ た も の (18)動 詞 か ら 転 じ た 動 作 を 示 す 名 詞 (22)学 問 や 専 門 分 野 の 名 前 (23)慣 用 句 的 な 表 現 検 索 エ ン ジ ン を 利 用 し て 作 成 し た リ ス ト (1) 新 た に 得 ら れ た り 発 生 し た り し た も の を 示 す (名 詞 ) (3) 対 象 を 個 別 化 す る 形 容 詞 に 修 飾 さ れ て い る

(7)

表 5

作 成 した 形 容 詞 およ び 名 詞の リ ス ト

作 成 した 形 容 詞 およ び 名 詞の リ ス ト

作 成 した 形 容 詞 およ び 名 詞の リ ス ト

作 成 した 形 容 詞 およ び 名 詞の リ ス ト

リ ス ト 個 数 (1)の 名 詞 1,036 (3)の 形 容 詞 3,458 正 解 誤 り 正 解 率 検 索 結 果 数 の み の 手 法 102 43 0.70 提 案 手 法 117 28 0.81

表 7

冠 詞 誤り の 修 正 性能

冠 詞 誤り の 修 正 性能

冠 詞 誤り の 修 正 性能

冠 詞 誤り の 修 正 性能 ([1]の英文

の 英 文

の 英 文

の 英 文 )

再 現 率 適 合 率 F 値 検 索 結 果 数 の み の 手 法 0.71 0.60 0.65 提 案 手 法 0.81 0.72 0.76 が あ っ た . 表 8, 9 に そ れ ぞ れ 表 6, 7 と 同 様 の 実 験 結 果 を 示 す .[1]の 英 文 に 対 す る 実 験 と 同 様 に 表 8 は 正 し い 英 文 を 入 力 と し て 与 え て 得 ら れ た 修 正 案 が そ の 正 解 と 一 致 し て い る か (正 し い も の を 正 し い と 出 せ る か ), 表 9 は 冠 詞 誤 り 修 正 実 験 の 結 果 で , 無 作 為 に 冠 詞 の 半 数 を 誤 っ た 冠 詞 に 置 換 し て 実 験 し た 結 果 を 表 す .

New York Times[14] で は 一 般 的 に 使 わ れ る 単 語 が

多 い た め , 十 分 な 検 索 結 果 数 を 得 る こ と が で き , [1] の 英 文 の 場 合 よ り 検 索 結 果 数 の み を 用 い た 手 法 の 精 度 が 高 く な っ た . 提 案 手 法 も 冠 詞 の 用 法 の 検 出 で 修 正 案 を 決 定 で き な い 場 合 は 検 索 結 果 数 を 用 い る が , 表 9 で 適 合 率 が 少 し 高 く な っ て い る . ま た , 表 8 で 二 つ の 手 法 の 正 解 率 は 同 じ に な っ た が , 検 索 結 果 数 の み を 用 い た 手 法 に お い て 検 索 結 果 数 が 同 じ で 最 多 の 冠 詞 が 二 つ 以 上 あ る 場 合 が , [1]の 英 文 で は 誤 り 43 件 の う ち 2 件 だ っ た が , こ の 場 合 63 件 の う ち 27 件 も あ っ た . 具 体 的 な 修 正 案 を 調 べ る と [1] の 英 文 の 場 合 と 大 体 同 じ よ う な 例 が 多 か っ た .

5.2.2.3 論 文 抄 録

論 文抄 録

論 文抄 録 を用 い た実 験

論 文抄 録

を用 い た実 験

を用 い た実 験

を用 い た実 験

論 文 抄 録 を 用 い た 実 験 で は , 英 語 圏 の 著 者 が 英 語 で 書 い た 論 文 の 抄 録 を 五 つ 用 い て 実 験 を 行 っ た . 全 47 文 の 中 に 334 箇 所 の 検 討 す べ き 名 詞 句 が あ っ た .表 10, 11 に 実 験 結 果 を 示 す . 5.2.2.1 節 の 実 験 と 同 じ く 表 10 は 得 ら れ た 修 正 案 が そ の 正 解 と 一 致 し て い る か ,表 11 は 冠 詞 誤 り 修 正 実 験 の 結 果 を 示 す . 冠 詞 修 正 案 の 適 切 性 評 価 の 実 験 で は , 使 用 頻 度 の 低 い 単 語 が 多 く 使 わ れ て い る た め , 修 正 精 度 は New York Times[14]を 用 い た と き に 比 べ 低 く な っ た .し か し ,提 案 手 法 は 検 索 結 果 数 の み を 用 い た 場 合 に 比 べ 単 語 の 使 用 頻 度 の 影 響 は 受 け に く い の で , 使 用 頻 度 の 低 い 単 語 が 増 え て も 精 度 の 減 少 は 小 さ い . 具 体 的 な 誤 っ た 修 正 事 例 を 調 べ る と [1] の 場 合 や

New York Ti mes[ 14] と 大 体 同 じ よ う な 例 が 多 か っ た .

正 解 誤 り 正 解 率 検 索 結 果 数 の み の 手 法 335 63 0.84 提 案 手 法 336 62 0.84

5.2.3 考 察 と 今 後 の 課 題

考 察 と今 後 の 課 題

考 察 と今 後 の 課 題

考 察 と今 後 の 課 題

[1] は 理 系 の 論 文 を 書 く 人 向 け の 著 書 で あ る の で , 冠 詞 の 用 法 に つ い て も , 理 系 の 論 文 に よ く あ る 用 法 が 多 い . そ の た め , New York Times の よ う な 一 般 的 な 単 語 が 使 わ れ る 文 章 を 校 正 す る 場 合 は , 検 索 結 果 数 を 用 い る 手 法 と 同 程 度 だ っ た と 考 え ら れ る . 今 後 の 課 題 と し て は , 用 法 の 追 加 や 用 法 の 検 出 方 法 と 検 出 し た 用 法 の 利 用 方 法 の 改 善 が 挙 げ ら れ る . 十 分 に 検 索 結 果 数 が 得 ら れ な い 場 合 は 検 索 ク エ リ の 生 成 方 法 を 工 夫 す る 必 要 も あ る .

6.

まと め

まと め

まと め

まと め

本 稿 で は , 岡 山 大 学 工 学 部 情 報 工 学 科 の 専 門 英 語 の 講 義 で 使 用 し て い る テ キ ス ト [1] に あ る 冠 詞 の 用 法 を 用 い て 冠 詞 を 自 動 修 正 す る 方 法 を 提 案 し た . 提 案 手 法 で は , Web 資 源 を 用 い て 入 力 さ れ た 英 文 か ら 予 め 定 め た 冠 詞 の 用 法 を 検 出 し , 検 出 さ れ た 用 法 と , 検 索 エ ン ジ ン に よ っ て 得 ら れ た 検 索 結 果 数 を 用 い て 冠 詞 の 修 正 を 行 う . ま た , 冠 詞 の 用 法 検 出 に 必 要 な 名 詞 や 形 容 詞 の リ ス ト を 検 索 エ ン ジ ン を 用 い て 作 成 し た . 評 価 実 験 で は 学 術 論 文 の 抄 録 や 一 般 的 な 文 章 と 考 え ら れ る 新 聞 記 事 を 用 い て , 検 索 結 果 数 の み を 用 い た 修 正 方 法 と 提 案 手 法 を 比 較 し た . 実 験 結 果 よ り , 学 術 論 文 な ど の 文 章 で は 本 手 法 は 検 索 結 果 数 の み を 用 い る 方 法 を 上 回 っ た . し か し , 一 般 的 な 文 章 の 場 合 は 検 索 結 果 数 の み を 用 い た 手 法 と あ ま り 精 度 に 差 は な か っ た . 今 後 の 課 題 と し て , 冠 詞 の 用 法 の 拡 充 や , 冠 詞 の 用 法 と 検 索 結 果 数 を 用 い た 冠 詞 の 修 正 方 法 の 改 善 が 挙 げ ら れ る .ま た ,

表 6

修 正 案の 適 切 性 評価

修 正 案の 適 切 性 評価

修 正 案の 適 切 性 評価

修 正 案の 適 切 性 評価 ([1]の英文

の 英 文

の 英 文 )

の 英 文

再 現 率 適 合 率 F 値 検 索 結 果 数 の み の 手 法 0.84 0.75 0.79 提 案 手 法 0.81 0.79 0.81

表 10

冠 詞誤 り の 修正 性能

冠 詞誤 り の 修正 性能

冠 詞誤 り の 修正 性能

冠 詞誤 り の 修正 性能 (論文

論 文

論 文 )

論 文

正 解 誤 り 正 解 率 検 索 結 果 数 の み の 手 法 259 75 0.78 提 案 手 法 269 65 0.81

表 11

冠 詞 誤り の 修 正 性能

冠 詞 誤り の 修 正 性能

冠 詞 誤り の 修 正 性能

冠 詞 誤り の 修 正 性能 (論文

論 文

論 文

論 文 )

再 現 率 適 合 率 F 値 検 索 結 果 数 の み の 手 法 0.74 0.67 0.70 提 案 手 法 0.80 0.74 0.77

表 8

修 正 案の 適 切 性 評価

修 正 案の 適 切 性 評価

修 正 案の 適 切 性 評価

修 正 案の 適 切 性 評価 (New York Times)

(8)

冠 詞 の 用 法 の 検 出 の た め 作 成 し た 名 詞 お よ び 形 容 詞 の リ ス ト に つ い て も さ ら に 精 査 し た い .

[1] 金 谷 健 一 “ こ れ な ら 書 け る 論 文 英 語 ― 理 系 の た め の 英 文 練 習 帳 ― ” 岡 山 大 学 大 学 院 自 然 科 学 研 究 科 2011 年 4 月 (第 1.0 版 ) [2] 河 合 敦 夫 , 杉 原 厚 吉 , 杉 江 昇 ,“ 英 文 の 誤 り を 検 出 す る シ ス テ ム ASPEC-I ” 情 報 処 理 論 文 誌

Nov.1984 Vol.25 No.6, pp.1072-1079, 2007

[3] 平 野 孝 佳 , 平 手 勇 宇 , 山 名 早 人 ,“ 検 索 エ ン ジ ン

を 用 い た 英 文 冠 詞 誤 り の 検 出 ”日 本 デ ー タ ベ ー ス 学 会 ,Letters vol.6, No.3, pp1-4, 2007

[4] 綱 嶋 祐 一 , 岡 田 壮 史 , 安 藤 一 秋 ,“ 検 索 エ ン ジ ン を 利 用 し た 多 言 語 作 文 支 援 ” 電 子 情 報 通 信 学 会 , 信 学 技 報 ET2007-97, pp.73-78, 2008 [5] 永 田 亮 , 井 口 達 也 , 脇 寺 健 太 , 桝 井 文 人 , 河 合 敦 夫 , 井 須 尚 紀 ,“ 前 置 詞 情 報 を 利 用 し た 冠 詞 誤 り 検 出 ” 電 子 情 報 通 信 学 会 論 文 誌 D-I, Vol.J88-D-I No.4, pp.873-881, 2005 [6] 乙 武 北 斗 , 荒 木 建 治 ,“ 単 語 出 現 状 況 の 特 徴 を 用 い た 英 文 誤 り の 検 出 お よ び 自 動 校 正 ” 社 団 法 人 情 報 処 理 学 会 , 研 究 報 告 , NL-171, pp.25-30, 2006 [7] 永 田 亮 , 若 菜 崇 宏 , 森 広 浩 一 郎 , 桝 井 文 人 , 河 合 敦 夫 , 井 須 尚 紀 ,“ 可 算 /不 可 算 の 判 定 に 基 づ い た 英 文 誤 り の 検 出 ” 電 子 情 報 通 信 学 会 論 文 誌 Vol. J89-D, No.8, pp.1777-1790, 2006 [8] 乙 武 北 斗 , 荒 木 建 治 ,“ 単 語 出 現 状 況 の 帰 納 的 学 習 に よ る 英 文 誤 り の 検 出 及 び 自 動 校 正 ” 電 子 情 報 通 信 学 会 論 文 誌 , D Vol.J90-D No.6 pp.1592-1601, 2007 [9] 竹内 裕 巳 , 河 合 敦 夫 , 永 田 亮 , 乙 武 北 斗 ,“ 英 文 自 動 冠 詞 付 与 に お け る 前 方 照 応 の 考 慮 ” 情 報 処 理 学 会 研 究 報 告 , Vol.2011-NL-204 No.10, pp.1-7, 2011 [10]Yahoo!JAPAN が 提 供 す る 検 索 WebAPI http://developer.yahoo.co.jp/webapi/search/ [11]Weblio 辞 書 英 和 和 英 辞 書 http://ejje.weblio.jp/ [12]欧 羅 巴 人 名 録 http://www.worldsys.org/europe/ [13]米 国 国 勢 調 査 局 に よ る 米 国 の 人 名 頻 度 順 リ ス ト

1990 Census Name Files

http://www.census.gov/genealogy/names/ [14]New York Times http://www.nytimes.com/

表 表
表 表表表 5   作 成 した 形 容 詞 およ び 名 詞の リ ス ト作 成 した 形 容 詞 およ び 名 詞の リ ス ト作 成 した 形 容 詞 およ び 名 詞の リ ス ト作 成 した 形 容 詞 およ び 名 詞の リ ス ト リ ス ト 個 数 (1)の 名 詞 1,036  (3)の 形 容 詞 3,458  正 解 誤 り  正 解 率 検 索 結 果 数 の み の 手 法 102  43  0.70  提 案 手 法 117  28  0.81  表表表表 7    冠 詞 誤り

参照

関連したドキュメント

平成 14 年( 2002 )に設立された能楽学会は, 「能楽」を学会名に冠し,その機関誌

健学科の基礎を築いた。医療短大部の4年制 大学への昇格は文部省の方針により,医学部

“Animal Headdresses on the Sealing of the Bactrian Documents”, Exegisti Monumenta: Festschrift in Honour of Nicholas Sims-Williams, ed. 1979, “Royal Power and Immortality, The myth

静岡大学 静岡キャンパス 静岡大学 浜松キャンパス 静岡県立大学 静岡県立大学短期大学部 東海大学 清水キャンパス

静岡大学 静岡キャンパス 静岡大学 浜松キャンパス 静岡県立大学 静岡県立大学短期大学部 東海大学 清水キャンパス

授業設計に基づく LUNA の利用 2 利用環境について(学外等から利用される場合) 3 履修情報が LUNA に連携するタイミング 3!.

ダブルディグリー留学とは、関西学院大学国際学部(SIS)に在籍しながら、海外の大学に留学し、それぞれの大学で修得し

c・昭和37(1962)年5月25曰,東京,曰比谷公会堂で開かれた参院選の