DEIM Forum 2012 E9-2
Web 資源を利用した冠詞の用法に基づく冠詞誤り自動修正
尾﨑 弘明
†太田 学
‡†岡山大学工学部 〒700-8530 岡山県岡山市北区津島中 3-1-1
‡岡山大学大学院自然科学研究科 〒700-8530 岡山県岡山市北区津島中 3-1-1
E-mail: †,‡{osaki,ohta}@de.cs.okayama-u.ac.jp
あらまし あらまし あらまし あらまし 英語を母語としない日本人が英語を使用する際によくある誤りの一つに,冠詞の用法の誤りがある. 本稿では,Web 検索やオンライン辞書などの Web 資源を用いて,冠詞の用法に基づいて冠詞の誤りを自動修正する システムを提案する.本研究では,24 の冠詞の用法をシステムが判断し,さらに検索エンジンから取得した検索結 果数を考慮して入力された英文の冠詞を修正する.評価実験で,提案手法と検索結果のみを用いて修正を行う方法 と修正精度を比較した結果,一般的な文章では精度に差は出なかったが,論文のように比較的使用頻度の低い単語 が多く使われる文章においては,提案手法の精度が上回り,提案手法の有効性を示せた. キーワード キーワード キーワード キーワード Web 資源,冠詞,誤り検出,誤り修正Automatic Correction of Article Errors Based on the Usage of Articles Using
Web Resources
Hiroaki OSAKI
†Manabu OHTA
‡†Faculty of Engineering, Okayama University, 3-1-1 Tsusima-naka, Kita-ku, Okayama, 700-8530 Japan
‡Graduate School of Natural Science and technology, Okayama University, 3-1-1 Tsusima-naka, Kita-ku, Okayama,
700-8530 Japan
E-mail: †,‡{osaki,ohta}@de.cs.okayama-u.ac.jp
Keyword Web resources, article, error detection error correction
1.
はじ め に
はじ め に
はじ め に
はじ め に
近 年 , グ ロ ー バ ル 化 が 進 み , 企 業 や 学 校 な ど で , 英 語 を 使 用 す る 機 会 が 増 加 し て い る . 大 学 で も 海 外 の 学 会 で の 発 表 や 英 語 で 論 文 を 執 筆 す る こ と も 多 い . し か し , 英 語 を 母 語 と し な い 日 本 人 は 英 語 の 用 法 を し ば し ば 誤 る こ と が あ る の で , 英 作 文 の 校 正 を 自 動 で 行 う シ ス テ ム が 望 ま れ る .特 に 日 本 語 に は な い 冠 詞 の 誤 り は , 日 本 人 の 書 く 英 作 文 に 多 く 含 ま れ て い る [2]. そ こ で 本 稿 で は , 英 語 の 冠 詞 の 誤 り を 自 動 で 修 正 す る 手 法 を 提 案 す る . 提 案 手 法 は , 岡 山 大 学 工 学 部 情 報 工 学 科 専 門 英 語 の 講 義 で 使 用 し て い る テ キ ス ト [1] の 中 の 冠 詞 の 用 法 に 基 づ い て 修 正 を 行 う . 例 え ば ,“ Theresult can be shown by () simple computation.” と い う 英
文 の ()に 入 る 冠 詞 を 考 え る . computation は 数 え ら れ な い 名 詞 だ が ,こ の 場 合 simple と い う 対 象 を 個 別 化 す る 形 容 詞 が computation を 修 飾 し て い る . そ の た め , 他 の も の (例 え ば , new computation な ど )と 対 比 さ れ , そ う い う 性 質 を も つ も の と い う 意 味 で 個 別 化 さ れ る の で , 不 定 冠 詞 の a が 入 る . こ の 例 で は , 冠 詞 の 用 法 を 検 出 す る 際 , 対 象 を 個 別 化 す る 形 容 詞 が 名 詞 を 修 飾 し て い る か 否 か で 判 断 す る . こ の よ う な 特 定 の 単 語 に 依 存 す る 冠 詞 の 用 法 を シ ス テ ム に 実 装 し た . ま た そ の た め に は , こ の よ う な 対 象 を 個 別 化 す る 形 容 詞 の 単 語 リ ス ト な ど が 必 要 に な る . 本 研 究 で は , Web 上 に そ の よ う な リ ス ト が あ れ ば そ れ を 利 用 し , な い 場 合 は 検 索 エ ン ジ ン を 利 用 し て 作 成 す る . こ の よ う な リ ス ト の 作 成 方 法 は 4 節 で 説 明 す る . ま た , 修 正 に 利 用 す る 冠 詞 の 用 法 に つ い て は 3 節 で 説 明 す る . 本 研 究 で は [1]に 書 か れ て い る 冠 詞 の 用 法 を 修 正 ル ー ル と し て 冠 詞 修 正 シ ス テ ム に 実 装 す る だ け で な く , 検 索 エ ン ジ ン を 用 い て Web 検 索 し , そ の 検 索 結 果 数 も 修 正 の 判 断 に 利 用 で き る よ う に す る . 本 稿 で は , 2 節 で 関 連 研 究 , 3 節 で は 冠 詞 修 正 シ ス テ ム に 用 い る 冠 詞 の 用 法 , 4 節 で 提 案 す る 冠 詞 の 修 正 方 法 を 説 明 す る .5 節 で 評 価 実 験 と そ の 考 察 を 述 べ ,6 節 で ま と め る .
2.
関連 研 究
関連 研 究
関連 研 究
関連 研 究
冠 詞 の 誤 り 修 正 に 関 す る 研 究 は , 主 に コ ー パ ス を 用 い る も の と 検 索 エ ン ジ ン を 用 い る も の が あ る . 例 え ばコ ー パ ス ベ ー ス で 冠 詞 の 誤 り を 修 正 す る も の と し て [5-8]が 挙 げ ら れ る . こ れ ら は , コ ー パ ス か ら 統 計 量 を 抽 出 し , そ れ に 基 づ い て 単 語 の 出 現 状 況 を ル ー ル と し て 獲 得 す る こ と に よ り , そ の ル ー ル を 用 い て 冠 詞 の 誤 り を 検 出 し て 修 正 す る . 問 題 点 と し て は , コ ー パ ス の 規 模 を 大 き く す る こ と が 困 難 で あ る 点 と 冠 詞 の 例 外 的 用 法 へ の 対 応 が 難 し い 点 が 挙 げ ら れ る . 一 方 , 検 索 エ ン ジ ン を 利 用 し た 冠 詞 の 修 正 で は , [3][4]な ど が 挙 げ ら れ る .こ れ ら は 検 索 エ ン ジ ン を 用 い て 検 索 結 果 数 を 比 較 し て 冠 詞 を 修 正 す る 手 法 を 提 案 し て い る .[3]で は ,コ ー パ ス ベ ー ス の も の よ り も 検 索 エ ン ジ ン を 用 い た も の の 方 が 良 い 結 果 が 出 る こ と が 報 告 さ れ て い る .ま た [3]で は ,検 索 ク エ リ の パ タ ー ン を 名 詞 の 単 数 形 と 複 数 形 の 場 合 に 分 け て 増 や す こ と で , 精 度 の 向 上 が 確 認 さ れ て い る の で , 本 研 究 で も そ れ を 採 用 し た . 他 に も ,[9]の よ う な 既 出 の 名 詞 に 着 目 し た ,最 大 エ ン ト ロ ピ ー 分 類 器 を 用 い た も の も あ る .
3.
冠詞 の 用 法
冠詞 の 用 法
冠詞 の 用 法
冠詞 の 用 法
本 節 で は [1] を 参 考 に 修 正 シ ス テ ム に 実 装 し た 冠 詞 の 用 法 に つ い て 説 明 す る .ま ず 名 詞 が 可 算 か 不 可 算 か , 単 数 形 か 複 数 形 か に 分 け て 冠 詞 の 用 法 を 述 べ , 次 に 不 定 冠 詞 , 定 冠 詞 , 無 冠 詞 の 用 法 に つ い て 説 明 す る .3.1
可算
可算 /不可算名詞と
可算
可算
不 可 算 名詞と
不 可 算 名詞と
不 可 算 名詞と冠 詞 の用法
冠 詞 の用法
冠 詞 の用法
冠 詞 の用法
名 詞 が 可 算 か 不 可 算 か に よ る 冠 詞 の 用 法 を 表 1,2 に 示 す . こ れ ら の 表 の ○ は 可 能 な 組 み 合 わ せ で , ×は 通 常 不 可 能 な 組 み 合 わ せ に な る . 名 詞 が 可 算 か 不 可 算 か の 情 報 は 冠 詞 の 修 正 に お い て 有 用 な の で , 冠 詞 修 正 の 判 断 に 利 用 す る . ま た 逆 に , 可 算 名 詞 か 不 可 算 名 詞 か を 判 断 す る 上 で 表 1,2 の 情 報 が 利 用 で き る .3.2
不定 冠 詞の用 法
不定 冠 詞の用 法
不定 冠 詞の用 法
不定 冠 詞の用 法
不 定 冠 詞 は 基 本 的 に 複 数 あ る も の の 一 つ を 取 り 上 げ た こ と を 表 す の に 使 わ れ る . 用 法 と し て は ,「 一 つ 」 と い う 意 味 で one と 同 じ 意 味 で 使 わ れ た り , 多 数 存 在 す る も の の 中 か ら 任 意 に 選 ん だ 一 つ と い う 意 味 を 表 し た り す る 用 法 な ど が あ る .具 体 的 な 用 法 を 以 下 に 示 す . (1) こ れ ま で に 存 在 し て い な か っ た 何 か が 新 た に 得 ら れ た り 発 生 し た り し た も の を 示 す例 :From this, we can obtain an important theorem. こ の 場 合 生 成 や 発 見 な ど を 表 す 動 詞 と 組 み 合 わ さ れ る こ と が 多 い .
(2)不 定 冠 詞と 組 み合 わ され る 構 文 や 表現 で 用い ら れる
例 :There is a situation in which this approach is necessary.
(3) 対 象 を 個 別 化 す る 形 容 詞 に 修 飾 さ れ て い る
例 : The result can be shown by a simple computation.
3.3
定冠 詞の用 法
定冠 詞の用 法
定冠 詞の用 法
定冠 詞の用 法
定 冠 詞 は 基 本 的 に 対 象 の も の が 一 つ し か 存 在 し な表
表
表
表 1 可算名詞と冠詞の組み合わせ
可 算 名 詞と 冠 詞 の 組み 合 わ せ
可 算 名 詞と 冠 詞 の 組み 合 わ せ
可 算 名 詞と 冠 詞 の 組み 合 わ せ
a/an the φ (無 冠 詞 ) 単 数 形 ○ ○ ○ 複 数 形 × ○ ○表
表
表
表 2 不可算名詞と冠詞の組み合わせ
不 可 算 名詞 と 冠 詞 の組 み 合 わせ
不 可 算 名詞 と 冠 詞 の組 み 合 わせ
不 可 算 名詞 と 冠 詞 の組 み 合 わせ
a/an the φ (無 冠 詞 ) 単 数 形 × ○ ○ 複 数 形 × × × い こ と を 表 す . 3.2 節 と 同 様 に , 具 体 的 な 用 法 を 以 下 に 示 す . (4) 直 前 に 述 べ た も の を 指 す (5) 読 者 が み な 知 っ て い る と 思 わ れ る も の の 場 合 , 了 解 を 意 味 す る 形 容 詞 で 済 ま せ る と き例 :the standard … ,the famous な ど
(6) the ~ of …の 形 で 対 象 ~の 性 質 や 特 徴 を 示 す
例 :The existence of such function is obvious.
(7) そ の 名 詞 節 の 内 容 が that 以 下 に 述 べ ら れ て い る こ
と を 示 す
例 :This property is due to the assumption that the noise
is Gaussian.
(8) そ の 個 数 だ け 存 在 す る 基 数 を 伴 う 名 詞
例 :When we view the line segment, the two endpoints
may not be visible.
(9) 普 通 名 詞 か ら 転 じ た 固 有 名 詞
例 :the United Nations, the White House な ど
(10)人 名 を 冠 し た 対 象
例 :the Fourier transform な ど
(11)最 上 級 の 前
例 :It is the easiest way to prove this theorem.
(12)定 冠 詞 と 組 み 合 わ さ れ る と 決 ま っ た も の
例 :the same as…, the past な ど
(13)特 定 の 形 容 詞 +of+名 詞 の 複 数 形 の 形
例 : some of the … , most of the … な ど
3.4
無冠 詞の用 法
無冠 詞の用 法
無冠 詞の用 法
無冠 詞の用 法
名 詞 が 無 冠 詞 に な る の は , 上 記 の 不 定 冠 詞 や 定 冠 詞 の 用 法 の 範 疇 に 入 ら な い 場 合 と い え る . 用 法 を 以 下 に 示 す . (14)単 数 形 な ら 不 定 冠 詞 の つ く 場 合 で 名 詞 が 複 数 形 の 場 合 (15)不 特 定 の 数 え ら れ な い 名 詞 例 :rain, snow な ど (16)ア ポ ス ト ロ フ ィ s を 伴 う 人 名 の 所 有 格 例 :Green’s theorem な ど (17)名 詞 が 列 記 さ れ て い て , 一 ま と ま り の 場 合 は 冒 頭 の 単 語 に の み 冠 詞 を つ け て 以 降 の 名 詞 の 冠 詞 を 省 略 す る(18)動 詞 か ら 転 じ た 動 作 を 示 す 名 詞
例 :Application of this identity proves the theorem.
(19)特 定 の 形 容 詞 が つ い た 場 合
例 :In every case, each variable assumes a different value.
(20)記 号 を 固 有 の 対 象 と し て 扱 う 時
例 :Consider a line segment connecting point P and point Q.
(21)特 定 の 数 値 を 扱 う 時
例 :Consider a circle of radius 2.
(22)学 問 や 専 門 分 野 の 名 前
例 :mathematics, vector analysis な ど
(23)慣 用 句 的 な 表 現
例 :in general, for example な ど
(24)冠 詞 相 当 語 に 修 飾 さ れ て い る 例 :his, those な ど に 修 飾 さ れ て い る
4.
冠詞 誤 り 自動 修 正 シス テム
冠詞 誤 り 自動 修 正 シス テム
冠詞 誤 り 自動 修 正 シス テム
冠詞 誤 り 自動 修 正 シス テム
本 節 で は , 提 案 す る 冠 詞 の 自 動 修 正 シ ス テ ム に つ い て 説 明 す る .4.1
システム概 要
システム概 要
システム概 要
システム概 要
こ こ で は , 冠 詞 修 正 シ ス テ ム の 処 理 の 流 れ を 説 明 す る (図 1). ま ず , 英 文 を 入 力 す る . 既 出 の 名 詞 に は 定 冠 詞 が つ き や す い の で ,入 力 す る 英 語 の 文 章 は 一 文 だ け で な く , 修 正 対 象 の 文 章 全 て を 入 力 す る . 次 に , 入 力 文 の 名 詞 句 に 対 し て , 名 詞 句 ご と に 3 節 で 挙 げ た 冠 詞 の 用 法 に 当 て は ま る か ど う か を 検 出 す る . ま た 同 時 に , 検 索 エ ン ジ ン を 用 い て そ の 名 詞 句 に お け る 3 つ の 冠 詞 パ タ ー ン の 検 索 結 果 数 を 取 得 す る . 最 後 に , こ れ ら 二 つ の 結 果 を 基 に 冠 詞 の 適 切 性 を 判 断 し , 不 適 切 な 場 合 は 修 正 案 を 提 示 す る . 以 下 で 冠 詞 の 用 法 の 検 出 , 検 索 結 果 数 の 取 得 , 冠 詞 の 修 正 に つ い て 詳 し く 説 明 す る .4.2
冠詞の用法の検 出
冠詞の用法の検 出
冠詞の用法の検 出
冠詞の用法の検 出
入 力 文 の 名 詞 節 に 当 て は ま る 冠 詞 の 用 法 の 検 出 方 法 に つ い て 説 明 す る .用 法 は 3.1 節 で 述 べ た 可 算 /不 可 算 に よ る 用 法 と 3.2~ 3.4 節 の 冠 詞 の 用 法 (1)~ (24)を 調 べ る .4.2.1
検出 手 法
検出 手 法
検出 手 法
検出 手 法
3.1 節 の 表 1,2 に 示 し た よ う に 名 詞 の 可 算 /不 可 算 の 判 別 は 冠 詞 を 検 討 す る 上 で 有 効 で あ る . よ っ て , オ ン ラ イ ン 辞 書 を 利 用 し て 可 算 /不 可 算 を 判 断 す る .し か し , 可 算 名 詞 と 不 可 算 名 詞 両 方 の 意 味 が あ る 場 合 は , 冠 詞 の 修 正 に 用 い な い . 3 節 の 冠 詞 の 用 法 の 検 出 方 法 を そ れ ぞ れ 説 明 す る (表 4). (4)の 用 法 に つ い て は , 対 象 の 名 詞 よ り も 前 の 文 を 見 て 判 断 す る . 詳 し く は 4.2.2 節 で 述 べ る . (6)~ (9), (11), (14)~ (17), (20), (21), (24)は 形 態 素 解 析 の 結 果 と 文 の 形 か ら 検 出 す る .(1)~ (3),(5),(10),(12),(13), (18), (19), (22), (23)は 特 定 の 単 語 に 依 存 す る た め ,図
図
図
図 1 冠詞修正システムの概要
冠 詞 修 正シ ス テ ム の概 要
冠 詞 修 正シ ス テ ム の概 要
冠 詞 修 正シ ス テ ム の概 要
あ ら か じ め そ の 単 語 を 収 集 し リ ス ト を 作 成 す る か , あ る い は ,Web 上 に あ る 情 報 を 利 用 す る .(2),(13),(19) は [1]に あ る 例 文 の 構 文 や 表 現 を 用 い た . (10)で 用 い る 人 名 と (12), (18), (22), (23)に つ い て は Web 上 に あ る リ ス ト ま た は オ ン ラ イ ン 辞 書 か ら 抽 出 し た .(1)の 生 成 , 発 生 ,発 見 ,取 得 ,導 入 ,定 義 を 表 す 動 詞 と (5)の 了 解 を 意 味 す る 形 容 詞 は [1] に 挙 げ ら れ て い る 例 の 類 義 語 を オ ン ラ イ ン 辞 書 を 用 い て 収 集 し リ ス ト を 作 成 し た . ま た ,(1)で 用 い ら れ る 動 詞 の 対 象 に な る 名 詞 も 冠 詞 の 修 正 に 有 用 で あ る と 考 え ,リ ス ト を 作 成 し た .(1)の 名 詞 と (3)の 対 象 を 個 別 化 す る 形 容 詞 は Web 上 に リ ス ト が な か っ た の で ,検 索 エ ン ジ ン を 用 い て 単 語 を 収 集 し , リ ス ト を 作 成 し た . 単 語 の 収 集 方 法 は 4.2.3 節 で 述 べ る .4.2.2
既出 の
既出 の
既出 の
既出 の 名 詞
名 詞
名 詞
名 詞
3 節 の (4)の 用 法 で は そ の 名 詞 が 既 出 か ど う か を そ の 名 詞 よ り 前 の 文 を 調 べ て 判 断 す る . 単 に 同 じ 単 語 が 出 現 し て い る か だ け で な く ,以 下 の よ う な 方 法 で 調 べ る . ・ ・・ ・ 検 討 す る 名 詞 句 に 名 詞 が 一 つ の 場 合 は 単 に そ の 名 詞 が 出 現 し て い る か ・ ・・ ・ 検 討 す る 名 詞 句 に 名 詞 が 熟 語 と し て 存 在 し て い る 場 合 , そ の 熟 語 ま た は 熟 語 の 最 後 の 名 詞 が 出 現 し て い る か4.2.3
単語 の 収 集
単語 の 収 集
単語 の 収 集
単語 の 収 集
3 節 の (1) の 動 詞 の 対 象 と な る 名 詞 と (3) の 個 別 化 す る 形 容 詞 は Web 上 に リ ス ト が な い の で 検 索 エ ン ジ ン を 用 い て 単 語 を 収 集 し , リ ス ト を 作 成 す る . 検 索 に 用 い る ク エ リ は ,[1]の 例 文 に あ る 収 集 対 象 の 単 語 を 含 む 名 詞 句 と 対 象 を 個 別 化 す る 形 容 詞 は そ の 前 の 単 語 を , (1)の 動 詞 の 対 象 と な る 名 詞 は そ の 後 の 単 語 を 用 い る . 集 め る 単 語 の 部 分 を ワ イ ル ド カ ー ド に 置 き 換 え , こ れ を 検 索 ク エ リ と す る . 例 え ば “ The result can be shownby a simple computation.”と い う 例 文 か ら 個 別 化 す る 形
容 詞 を 集 め る 場 合 ,“ by a * computation” と な る .
(1) の 場 合 は [1] の 例 文 と オ ン ラ イ ン 辞 書 で 集 め ら れ
示 す . (a) [1]の 例 文 か ら 収 集 対 象 の 単 語 を ワ イ ル ド カ ー ド に 置 き 換 え た 検 索 ク エ リ を 生 成 す る (b) (a)の ク エ リ を 用 い て 検 索 し , 検 索 結 果 の サ マ リ か ら ワ イ ル ド カ ー ド に マ ッ チ し た 名 詞 を 抽 出 す る . (c) 抽 出 し た 名 詞 が (1)の 用 法 と し て 使 わ れ る か を 確 認 す る た め に , ワ イ ル ド カ ー ド を 抽 出 し た 名 詞 に 置 き 換 え た 検 索 ク エ リ で 検 索 し , 冠 詞 の 部 分 を 他 の 冠 詞 に 置 き 換 え た 場 合 の 検 索 結 果 数 と 比 較 す る . (d) (c)で 得 ら れ た 検 索 結 果 数 の 一 番 多 い 冠 詞 が 元 の 冠 詞 と 同 じ で あ れ ば , そ の 名 詞 を リ ス ト に 加 え る . (e) 検 索 ク エ リ の 動 詞 を あ ら か じ め 集 め て お い た 動 詞 と 置 き 換 え , こ れ を 新 し い 検 索 ク エ リ と す る . そ し て ,(b)~ (d)の 処 理 を 行 う .こ れ を オ ン ラ イ ン 辞 書 で 集 め た (1)で 用 い る 動 詞 全 て で 行 う .
上 で 説 明 し た 手 順 を 例 文 “ We want to find a solution of
this equation.”を 用 い て 説 明 す る .(a)で は ,“ find a * of” を 検 索 ク エ リ と す る . (b)で は 検 索 結 果 の サ マ リ か ら * が 名 詞 の も の を 集 め る .例 え ば ,discovery と い う 名 詞 を 収 集 で き た と す る . (c)で , *に discovery を 挿 入 し , 元 の 不 定 冠 詞 の 場 合 と 冠 詞 を 定 冠 詞 , 無 冠 詞 に 変 更 し て 検 索 結 果 数 を 比 較 す る .そ し て ,(d)の 通 り 不 定 冠 詞 の 検 索 結 果 数 が 最 も 多 け れ ば discovery を 名 詞 の リ ス ト に 追 加 す る . 次 に (e)で , find を locate な ど の 別 の 動 詞 と 入 れ 替 え (b)~ (d)の 手 順 で こ の よ う な 名 詞 を さ ら に 収 集 す る . 一 方 ,(3)の 個 別 化 す る 形 容 詞 の 収 集 で は ,[1]の 例 文 の み を 用 い て 検 索 を 行 う . 以 下 に 手 順 を 示 す . (a) 検 索 ク エ リ を 例 文 か ら 作 成 す る (b) (a)の ク エ リ で 検 索 し , 検 索 結 果 の サ マ リ か ら ワ イ ル ド カ ー ド に マ ッ チ し た 形 容 詞 を 抽 出 す る . (c) こ れ ら の 形 容 詞 が そ の 用 法 と し て 使 わ れ る か を 確 認 す る た め に , ワ イ ル ド カ ー ド を 収 集 し た 形 容 詞 に 置 き 換 え た 検 索 ク エ リ で 検 索 し , さ ら に 冠 詞 の 部 分 を 他 の 冠 詞 に 置 き 換 え た 場 合 の 検 索 結 果 数 と 比 較 す る . (d) (c)で 得 ら れ た 検 索 結 果 数 の 一 番 多 い 冠 詞 が 元 の 例 文 の 冠 詞 と 同 じ で あ れ ば , そ の 形 容 詞 を リ ス ト に 加 え る . (e) 一 つ の 例 文 か ら な る べ く 多 く の 形 容 詞 を 収 集 す る た め に 検 索 ク エ リ の 形 容 詞 に つ づ く 名 詞 一 つ を 変 更 す る . ま ず , ワ イ ル ド カ ー ド を (d)で リ ス ト に 加 え た 形 容 詞 と 置 き 換 え , 置 き 換 え た 形 容 詞 の 後 の 単 語 一 つ を ワ イ ル ド カ ー ド に 置 き 換 え る . 次 に そ れ を 検 索 ク エ リ と し て 検 索 し , ワ イ ル ド カ ー ド に マ ッ チ し た 名 詞 を 抽 出 す る . 抽 出 し た 名 詞 を ワ イ ル ド カ ー ド と 置 き 換 え , 再 び 形 容 詞 を ワ イ ル ド カ ー ド に 置 き 換 え て 新 し い 検 索 ク エ リ と す る . そ し て ,再 度 (b)~ (d)を 行 う .こ れ を 最 初 の 検 索 で 収 集 し た 形 容 詞 全 て で 行 う . 3 節 の (3)の 対 象 を 個 別 化 す る 形 容 詞 の 例 文“ The result can be shown by a simple computation.” を 用 い て こ の 処
理 を 説 明 す る .(a)で は ,“ by a * computation”を 検 索 ク エ リ と す る . (b)で は 検 索 結 果 の サ マ リ か ら *が 形 容 詞 の も の を 集 め る .こ こ で 例 え ば new と い う 形 容 詞 を 抽 出 で き た と す る . (c)“ by a * computation” の *に new を 挿 入 し , 不 定 冠 詞 の a の 場 合 と そ れ を 定 冠 詞 , 無 冠 詞 に 変 更 し た 場 合 を 比 較 す る . そ し て , a の 検 索 結 果 数 が 多 い と き , new を 対 象 を 個 別 化 す る 形 容 詞 と し て リ ス ト に 追 加 し , 冠 詞 の 用 法 の 検 出 に 利 用 す る . 次 に
(e)で ,“ by a simple computation” に お い て simple を 集
め た 形 容 詞 に 置 き 変 え た 検 索 ク エ リ を 用 い て ,
computation 以 外 の 名 詞 を 収 集 す る .例 え ば ,先 ほ ど 得
ら れ た new を simple と 置 き 換 え ,“ by a new * ” と い う 検 索 フ レ ー ズ を 生 成 し , 今 度 は computation に 相 当 す る 名 詞 を 収 集 す る .例 え ば ,method が 収 集 で き た と す る と , 今 度 は “ by a * method” と い う フ レ ー ズ を 生 成 し て ,(b)~ (d)の 手 順 で 形 容 詞 を さ ら に 収 集 し ,対 象 を 個 別 化 す る 形 容 詞 の リ ス ト に 追 加 し て い く .
4.3
検索 結 果 数の取得
検索 結 果 数の取得
検索 結 果 数の取得
検索 結 果 数の取得
検 索 エ ン ジ ン を 用 い て 不 定 冠 詞 と 定 冠 詞 , 無 冠 詞 の 場 合 の 検 索 結 果 数 を 取 得 す る 方 法 に つ い て 説 明 す る .4.3.1
検索 ク エ リの 生 成
検索 ク エ リの 生 成
検索 ク エ リの 生 成
検索 ク エ リの 生 成
検 索 ク エ リ は 名 詞 句 と そ れ に 名 詞 句 の 一 つ 前 の 単 語 を 加 え た も の を 用 い る . そ れ に 名 詞 句 の 最 後 の 名 詞 を 単 数 形 と 複 数 形 に 分 け た 6 パ タ ー ン を 検 索 ク エ リ と す る .“ I read a book.” を 例 に book に つ い て 検 索 ク エ リ を 生 成 し た 例 を 表 3 に 示 す . 検 索 ク エ リ を 単 数 形 と 複 数 形 に 拡 張 し た 6 パ タ ー ン で 検 索 を し た 方 が 良 い 結 果 が 得 ら れ る と い う 報 告 [3]か ら , こ れ を 採 用 し た .4.3.2
検索 手 順
検索 手 順
検索 手 順
検索 手 順
表 3 に 示 し た 検 索 ク エ リ を 用 い て 検 索 を 実 行 す る . 以 下 に 検 索 の 手 順 を 示 す . (a)検 索 ク エ リ の 生 成 (b)検 索 エ ン ジ ン を 使 い , 6 パ タ ー ン の 検 索 ク エ リ 検 索 結 果 数 を 取 得 す る (c)検 索 結 果 数 が 閾 値 を 下 回 っ た 場 合 ,検 索 ク エ リ の 単 語 を 一 つ 減 ら し , (b)に 戻 り 再 検 索 を す る (d)検 索 結 果 数 が 閾 値 を 超 え た 場 合 ,そ れ を 結 果 と し て 利 用 す る . 本 研 究 で は 閾 値 は 0 に 設 定 し た .(c)に お い て 6 パ タ ー ン の 検 索 ク エ リ で 閾 値 を 下 回 っ た 場 合 , 複 合 名 詞 の 場 合 は 前 の 名 詞 を 減 ら し , 単 体 名 詞 が 場 合 は , 修 飾 し て い る 形 容 詞 や 副 詞 な ど を 削 除 し て 再 検 索 を 行 う .4.4
冠詞の修正
冠詞の修正
冠詞の修正
冠詞の修正
4.2,4.3 節 の 結 果 を 基 に 修 正 を 行 う .ま ず ,4.2 節 の表
表
表
表 3 検索クエリの作成例
検 索 ク エリ の 作 成 例
検 索 ク エリ の 作 成 例
検 索 ク エリ の 作 成 例
a/an the φ (無 冠 詞 )
単 数 形 read a book read the book read book
複 数 形 read a books read the books read books
冠 詞 の 用 法 の 検 出 の 結 果 に よ っ て 以 下 の 3 パ タ ー ン に 分 類 で き る . (1) 検 出 さ れ た 用 法 に よ っ て 使 用 す べ き 冠 詞 が 一 意 に 決 ま る . (2) 検 出 さ れ た 用 法 か ら 複 数 の 冠 詞 の 修 正 案 が 提 示 さ れ る . (3) 用 法 が 検 出 さ れ な い . 結 果 が (a) の 場 合 は そ の ま ま そ の 冠 詞 を 修 正 案 と し て 提 示 す る .結 果 が (b)の 場 合 は 考 え ら れ る 冠 詞 を 修 正 候 補 と し , そ の 修 正 候 補 を 4.3 節 の 検 索 結 果 数 を 用 い て 比 較 し ,修 正 案 を 決 定 す る .結 果 が (c)の 場 合 は ,表 1,2 に 従 っ て 不 定 冠 詞 ,定 冠 詞 ,無 冠 詞 を 検 索 結 果 数 で 比 較 し , 修 正 案 を 提 示 す る . 例 え ば (c)で , 名 詞 が 複 数 形 と だ け 分 か っ た 場 合 は , 定 冠 詞 と 無 冠 詞 の 場 合 が 考 え ら れ る . こ の 場 合 , 定 冠 詞 と 無 冠 詞 の 場 合 の 検 索 結 果 数 を 比 較 し , 修 正 案 を 決 定 す る .ま た ,(b)の 場 合 で は 用 法 の 組 み 合 わ せ に よ っ て は 例 外 的 に 冠 詞 が 一 意 的 に 決 ま る も の も あ る . そ の 場 合 は あ ら か じ め 実 装 し て お い た 例 外 パ タ ー ン で 修 正 案 を 決 定 す る . 例 え ば “ The result can be shown by *
simple computation.”を 考 え る .こ の 場 合 simple は「 対
象 を 個 別 化 す る 形 容 詞 」で ,computation は「 数 え ら れ な い 名 詞 」と な っ て い る が ,[1]に は ,数 え ら れ な い 名 詞 を 個 別 化 す る 形 容 詞 が 修 飾 し た 場 合 , 不 定 冠 詞 と す る と い う 規 則 が あ る . こ の よ う に , 例 外 的 な 規 則 が あ る 場 合 は そ れ を 優 先 し , そ う で な い 場 合 は , 検 出 さ れ た 用 法 の 候 補 を 検 索 結 果 数 で 比 較 し , そ れ を 修 正 案 と す る . ま た , 優 先 度 の 高 い 用 法 に つ い て は そ れ を 優 先 し , 修 正 案 を 決 定 す る . も し そ れ で 決 め ら れ な い 場 合 は 優 先 度 の な い 冠 詞 の 用 法 を 検 出 し た 場 合 と 同 じ 扱 い で , 修 正 案 を 決 定 す る . 優 先 す る 冠 詞 の 用 法 を 以 下 に 示 す . (16)ア ポ ス ト ロ フ ィ s を 伴 う 人 名 の 所 有 格 (21)特 定 の 数 値 を 扱 う 時 (23)慣 用 句 的 な 表 現 (24)冠 詞 相 当 語
5.
実験
実験
実験
実験
実 験 で は ,4.2.3 節 で 述 べ た 用 法 の 検 出 に 必 要 な 名 詞 お よ び 形 容 詞 の リ ス ト の 作 成 と , 冠 詞 誤 り の 修 正 精 度 の 評 価 実 験 に つ い て 述 べ る .5.1 リ ス ト の 作 成
リ ス ト の作 成
リ ス ト の作 成
リ ス ト の作 成
3.2 節 の (1)で 用 い ら れ る 動 詞 の 目 的 語 に な る 名 詞 と (3) の 個 別 化 す る 形 容 詞 の リ ス ト を 作 成 し た . 検 索 エ ン ジ ン は Yahoo!検 索 WebAPI[10]を 用 い た .そ の 結 果 ,表 5 で 示 し た よ う に ,(1)で は 1,036 の 名 詞 ,(3)で は 3,458 の 形 容 詞 を 収 集 し た . 収 集 し た 名 詞 お よ び 形 容 詞 の 例 を 挙 げ る .(1)の 名 詞 で は , solution, method な ど が 収 集 で き た . こ れ は 発 見 や 定 義 な ど を 表 す 動 詞 の 目 的 語 に な っ て い た た め 収 集 さ れ た と 考 え ら れ る .(3)の 個 別 化 す る 形 容 詞 は さ ら に 多 く 収 集 で き た . ま た , 収 集 の 際 同 じ 形 容 詞 が 何 度 も 出 て く る こ と が 多 か っ た の で 信 頼 性 は 高 い と い え る . こ こ で は ,vivid,difficult な ど の 形 容 詞 が 収 集 さ れ た . ま た , 収 集 し た 名 詞 お よ び 形 容 詞 の 中 に は い く つ か 品 詞 が 違 う も の な ど も 含 ま れ る が , 用 法 の 検 出 は 形 態 素 解 析 に よ っ て 入 力 文 中 の 品 詞 を 判 断 し て か ら リ ス ト と 照 合 す る の で 問 題 な い .5.2 冠 詞 誤 り の 修 正 実 験
冠 詞 誤 りの 修 正実 験
冠 詞 誤 りの 修 正実 験
冠 詞 誤 りの 修 正実 験
評 価 実 験 で は , 冠 詞 誤 り を 含 む 英 文 に 対 し て 冠 詞 の 自 動 修 正 を 試 み て そ の 修 正 精 度 を 評 価 し た .本 実 験 で は ,[1]の 冠 詞 を 扱 っ た 節 に 挙 げ ら れ て い る 英 文 と New York Times[14]の 記 事 ,論 文 の 抄 録 を 修 正 対 象 と し て 用 い た . 実 験 で は (i)こ れ ら 実 験 対 象 の 英 文 の 誤 り を 含 ま な い 正 解 デ ー タ と 同 じ 冠 詞 を 修 正 案 と し て 提 示 で き る か , (ii)冠 詞 の う ち 半 数 を ラ ン ダ ム に 誤 っ た 冠 詞 (無 冠 詞 も 含 む )に 置 き 換 え ,そ れ を 修 正 で き る か を 評 価 し た . 本 手 法 は 単 語 に 依 存 し て い る の で , ス ペ ル ミ ス , 冠 詞 以 外 の 単 語 の 誤 り は な い も の と 仮 定 す る . ま た , 実 験 は 提 案 手 法 と 検 索 結 果 数 の み を 用 い て 修 正 を 行 っ た 場 合 を 比 較 し た . 本 実 験 で も リ ス ト の 作 成 と 同 様 に 検 索 エ ン ジ ン は Yahoo!検 索 WebAPI[10]を 用 い た .オ ン ラ イ ン 辞 書 と し て は Weblio 英 和 和 英 辞 書 [11]を 用 い た .ま た , 人 名 に つ い て は 欧 羅 巴 人 名 録 [12], 米 国 国 勢 調 査 局 1990 Census Name Files[13]を 用 い た .5.2.1 評 価 尺 度
評 価尺 度
評 価尺 度
評 価尺 度
評 価 尺 度 と し て 以 下 の 3 つ を 用 い る .F 値 の P は 適 合 率 , R は 再 現 率 の こ と で あ る .実際の冠詞誤りの数
誤りの数
正しく修正された冠詞
再現率
=
修正された誤りの数
誤りの数
正しく修正された冠詞
適合率
=
R
P
PR
+
=
2
F値
5.2.2 実 験 結 果
実 験結 果
実 験結 果
実 験結 果
本 実 験 で は 検 索 結 果 数 の み を 用 い て 冠 詞 を 修 正 し た 場 合 と 提 案 手 法 と の 比 較 を 行 っ た . 検 索 結 果 数 の み を 用 い る 修 正 は , 表 3 の よ う な 6 パ タ ー ン の 検 索 結 果 数 を 比 較 し , 検 索 結 果 数 の 最 も 多 い 冠 詞 を 修 正 案 と する . ま た , 検 索 結 果 数 の 最 も 多 い 冠 詞 が 二 つ 以 上 あ る 場 合 に は , 修 正 案 を 一 つ に 絞 れ な い の で 修 正 を 行 わ な い . 様 々 な 文 章 で 評 価 を 行 う た め , 修 正 実 験 の 対 象 と し て 3 種 類 の 文 章 を 用 意 し た . そ れ ぞ れ の 実 験 結 果 を 以 下 に 示 す .
5.2.2.1 専 門 英 語 教
専 門英 語 教
専 門英 語 教 科 書
専 門英 語 教
科 書
科 書
科 書 の英
の英
の英 文 を 用い た 実 験
の英
文 を 用い た 実 験
文 を 用い た 実 験
文 を 用い た 実 験
[1]に あ る 英 文 を 用 い て 実 験 を 行 っ た .こ の 例 文 は 全 30 文 で 構 成 さ れ , 145 の 検 討 す べ き 名 詞 句 が あ っ た . ま た , こ の 英 文 は そ れ ぞ れ 単 文 で お 互 い に 関 連 は な い の で , 3.3 節 の (4)の 用 法 は 同 一 文 内 の 前 後 関 係 を み て 判 断 し た .実 験 結 果 を 表 6,7 に 示 す .表 6 は 得 ら れ た 修 正 案 が 正 解 デ ー タ と 一 致 し て い る か , 表 7 は 冠 詞 誤 り の 修 正 実 験 の 結 果 で , 無 作 為 に 正 解 デ ー タ の 冠 詞 の 半 数 (73 箇 所 )を 誤 っ た 冠 詞 に 入 れ 替 え て 実 験 を 行 っ た 結 果 で あ る . [1]の 英 文 は ,提 案 手 法 で 用 い た 冠 詞 の 用 法 を 説 明 す る 章 の 練 習 問 題 に な っ て い る の で , 英 文 中 に 検 出 で き る 冠 詞 の 用 法 が 多 く あ っ た . 表 6 や 表 7 の 評 価 で は , 検 索 結 果 数 を 用 い た 手 法 に 比 べ 高 く な っ た が , そ の 点 は 留 意 す る 必 要 が あ る .ま た ,[1]は 学 術 論 文 を 英 語 で 書 く た め の テ キ ス ト で も あ る の で , そ の 例 文 で は 使 用 頻 度 の 低 い 単 語 が 多 く 使 用 さ れ て い た . そ の た め , 検 索 結 果 数 を 用 い る 手 法 の 修 正 精 度 は 低 く な っ た と 考 え ら れ る . 本 実 験 で , 両 手 法 で 修 正 案 を 誤 っ た 箇 所 や 提 案 手 法 の み 誤 っ た 箇 所 , 提 案 手 法 の み 正 解 し た 箇 所 な ど に つ い て 述 べ る . 検 索 結 果 数 の み を 用 い た 手 法 は , 使 用 頻 度 の 低 い 単 語 が 使 わ れ て い る 場 合 に 間 違 い が 多 か っ た . ま た , 検 索 結 果 数 が 十 分 で も 修 正 案 を 間 違 う こ と も 多 少 あ っ た が , こ の 場 合 , 正 解 と 修 正 案 の 検 索 結 果 数 は 近 い こ と が 多 か っ た . 両 手 法 共 通 で 間 違 っ て い た 箇 所 は , 提 案 手 法 で 用 法 が 検 出 さ れ て い な い , ま た は 検 出 さ れ て い る が 複 数 の 用 法 が 検 出 さ れ て い て 修 正 案 を 決 定 で き ず に 検 索 結 果 数 を 用 い て 修 正 し て い る 場 合 が 多 か っ た . 提 案 手 法 の み で 誤 っ て い る 箇 所 に つ い て は , 4.4 節 で 挙 げ た 優 先 す る 冠 詞 の 用 法 以 外 が 検 出 さ れ て い る 場 合 で , 特 に 5.1 節 で 作 成 し た 名 詞 お よ び 形 容 詞 の リ ス ト を 用 い る (1), (3) の 用 法 が 検 出 さ れ た 場 合 と (6)の 用 法 が 検 出 さ れ た 場 合 が 多 か っ た .し か し ,提 案 手 法 の み 正 解 し て い る 箇 所 で も , 冠 詞 の 用 法 の (1), (3)が 検 出 さ れ て い る 場 合 が 多 か っ た .よ っ て ,作 成 し た 名 詞 お よ び 形 容 詞 リ ス ト は 有 効 だ が , 品 詞 の 収 集 方 法 等 に 改 善 の 余 地 が あ る .5.2.2.2 New York Times を 用 い た 実 験
を用 い た 実験
を用 い た 実験
を用 い た 実験
New York Times の 記 事 一 つ を 用 い て 実 験 を 行 っ た .
こ の 記 事 は 51 文 で 構 成 さ れ ,398 の 検 討 す べ き 名 詞 句
表
表
表
表 4
検 出 方法 一 覧
検 出 方法 一 覧
検 出 方法 一 覧
検 出 方法 一 覧
検 出 方 法 冠 詞 の 用 法 前 方 参 照 (4) 直 前 に 述 べ た も の を 指 す 形 態 素 解 析 , 文 の 形 (6) the ~ of … の 形 で 対 象 ~の 性 質 や 特 徴 を 示 す (7)そ の 名 詞 句 の 内 容 が that 以 下 に 述 べ ら れ て い る こ と を 示 す (8)そ の 個 数 だ け 存 在 す る 基 数 を 伴 う 名 詞 (9)普 通 名 詞 か ら 転 じ た 固 有 名 詞 (11)最 上 級 の 前 (14)単 数 形 な ら 不 定 冠 詞 の つ く 場 合 で 名 詞 が 複 数 形 の 場 合 (15)不 特 定 の 数 え ら れ な い 名 詞 (16)ア ポ ス ト ロ フ ィ s を 伴 う 人 名 の 所 有 格 (17)名 詞 が 列 記 さ れ て る と き (20)記 号 を 固 有 の 対 象 と し て 扱 う 時 (21)特 定 の 数 値 を 扱 う 時 (24)冠 詞 相 当 語 [1]の 例 文 か ら 作 成 し た リ ス ト (2) 不 定 冠 詞 と 組 み 合 わ さ れ る 構 文 や 表 現 で 用 い ら れ る (13)特 定 の 形 容 詞 +of+名 詞 の 複 数 形 の 形 (19)特 定 の 形 容 詞 が つ い た 場 合 Web 上 に あ る リ ス ト , オ ン ラ イ ン 辞 書 (1) 新 た に 得 ら れ た り 発 生 し た り し た も の を 示 す (動 詞 ) (10)人 名 を 冠 し た 対 象 (12)定 冠 詞 と 組 み 合 わ さ れ る と 決 ま っ た も の (18)動 詞 か ら 転 じ た 動 作 を 示 す 名 詞 (22)学 問 や 専 門 分 野 の 名 前 (23)慣 用 句 的 な 表 現 検 索 エ ン ジ ン を 利 用 し て 作 成 し た リ ス ト (1) 新 た に 得 ら れ た り 発 生 し た り し た も の を 示 す (名 詞 ) (3) 対 象 を 個 別 化 す る 形 容 詞 に 修 飾 さ れ て い る表
表
表
表 5
作 成 した 形 容 詞 およ び 名 詞の リ ス ト
作 成 した 形 容 詞 およ び 名 詞の リ ス ト
作 成 した 形 容 詞 およ び 名 詞の リ ス ト
作 成 した 形 容 詞 およ び 名 詞の リ ス ト
リ ス ト 個 数 (1)の 名 詞 1,036 (3)の 形 容 詞 3,458 正 解 誤 り 正 解 率 検 索 結 果 数 の み の 手 法 102 43 0.70 提 案 手 法 117 28 0.81表
表
表
表 7
冠 詞 誤り の 修 正 性能
冠 詞 誤り の 修 正 性能
冠 詞 誤り の 修 正 性能
冠 詞 誤り の 修 正 性能 ([1]の英文
の 英 文
の 英 文
の 英 文 )
再 現 率 適 合 率 F 値 検 索 結 果 数 の み の 手 法 0.71 0.60 0.65 提 案 手 法 0.81 0.72 0.76 が あ っ た . 表 8, 9 に そ れ ぞ れ 表 6, 7 と 同 様 の 実 験 結 果 を 示 す .[1]の 英 文 に 対 す る 実 験 と 同 様 に 表 8 は 正 し い 英 文 を 入 力 と し て 与 え て 得 ら れ た 修 正 案 が そ の 正 解 と 一 致 し て い る か (正 し い も の を 正 し い と 出 せ る か ), 表 9 は 冠 詞 誤 り 修 正 実 験 の 結 果 で , 無 作 為 に 冠 詞 の 半 数 を 誤 っ た 冠 詞 に 置 換 し て 実 験 し た 結 果 を 表 す .New York Times[14] で は 一 般 的 に 使 わ れ る 単 語 が
多 い た め , 十 分 な 検 索 結 果 数 を 得 る こ と が で き , [1] の 英 文 の 場 合 よ り 検 索 結 果 数 の み を 用 い た 手 法 の 精 度 が 高 く な っ た . 提 案 手 法 も 冠 詞 の 用 法 の 検 出 で 修 正 案 を 決 定 で き な い 場 合 は 検 索 結 果 数 を 用 い る が , 表 9 で 適 合 率 が 少 し 高 く な っ て い る . ま た , 表 8 で 二 つ の 手 法 の 正 解 率 は 同 じ に な っ た が , 検 索 結 果 数 の み を 用 い た 手 法 に お い て 検 索 結 果 数 が 同 じ で 最 多 の 冠 詞 が 二 つ 以 上 あ る 場 合 が , [1]の 英 文 で は 誤 り 43 件 の う ち 2 件 だ っ た が , こ の 場 合 63 件 の う ち 27 件 も あ っ た . 具 体 的 な 修 正 案 を 調 べ る と [1] の 英 文 の 場 合 と 大 体 同 じ よ う な 例 が 多 か っ た .
5.2.2.3 論 文 抄 録
論 文抄 録
論 文抄 録 を用 い た実 験
論 文抄 録
を用 い た実 験
を用 い た実 験
を用 い た実 験
論 文 抄 録 を 用 い た 実 験 で は , 英 語 圏 の 著 者 が 英 語 で 書 い た 論 文 の 抄 録 を 五 つ 用 い て 実 験 を 行 っ た . 全 47 文 の 中 に 334 箇 所 の 検 討 す べ き 名 詞 句 が あ っ た .表 10, 11 に 実 験 結 果 を 示 す . 5.2.2.1 節 の 実 験 と 同 じ く 表 10 は 得 ら れ た 修 正 案 が そ の 正 解 と 一 致 し て い る か ,表 11 は 冠 詞 誤 り 修 正 実 験 の 結 果 を 示 す . 冠 詞 修 正 案 の 適 切 性 評 価 の 実 験 で は , 使 用 頻 度 の 低 い 単 語 が 多 く 使 わ れ て い る た め , 修 正 精 度 は New York Times[14]を 用 い た と き に 比 べ 低 く な っ た .し か し ,提 案 手 法 は 検 索 結 果 数 の み を 用 い た 場 合 に 比 べ 単 語 の 使 用 頻 度 の 影 響 は 受 け に く い の で , 使 用 頻 度 の 低 い 単 語 が 増 え て も 精 度 の 減 少 は 小 さ い . 具 体 的 な 誤 っ た 修 正 事 例 を 調 べ る と [1] の 場 合 やNew York Ti mes[ 14] と 大 体 同 じ よ う な 例 が 多 か っ た .
正 解 誤 り 正 解 率 検 索 結 果 数 の み の 手 法 335 63 0.84 提 案 手 法 336 62 0.84
5.2.3 考 察 と 今 後 の 課 題
考 察 と今 後 の 課 題
考 察 と今 後 の 課 題
考 察 と今 後 の 課 題
[1] は 理 系 の 論 文 を 書 く 人 向 け の 著 書 で あ る の で , 冠 詞 の 用 法 に つ い て も , 理 系 の 論 文 に よ く あ る 用 法 が 多 い . そ の た め , New York Times の よ う な 一 般 的 な 単 語 が 使 わ れ る 文 章 を 校 正 す る 場 合 は , 検 索 結 果 数 を 用 い る 手 法 と 同 程 度 だ っ た と 考 え ら れ る . 今 後 の 課 題 と し て は , 用 法 の 追 加 や 用 法 の 検 出 方 法 と 検 出 し た 用 法 の 利 用 方 法 の 改 善 が 挙 げ ら れ る . 十 分 に 検 索 結 果 数 が 得 ら れ な い 場 合 は 検 索 ク エ リ の 生 成 方 法 を 工 夫 す る 必 要 も あ る .6.
まと め
まと め
まと め
まと め
本 稿 で は , 岡 山 大 学 工 学 部 情 報 工 学 科 の 専 門 英 語 の 講 義 で 使 用 し て い る テ キ ス ト [1] に あ る 冠 詞 の 用 法 を 用 い て 冠 詞 を 自 動 修 正 す る 方 法 を 提 案 し た . 提 案 手 法 で は , Web 資 源 を 用 い て 入 力 さ れ た 英 文 か ら 予 め 定 め た 冠 詞 の 用 法 を 検 出 し , 検 出 さ れ た 用 法 と , 検 索 エ ン ジ ン に よ っ て 得 ら れ た 検 索 結 果 数 を 用 い て 冠 詞 の 修 正 を 行 う . ま た , 冠 詞 の 用 法 検 出 に 必 要 な 名 詞 や 形 容 詞 の リ ス ト を 検 索 エ ン ジ ン を 用 い て 作 成 し た . 評 価 実 験 で は 学 術 論 文 の 抄 録 や 一 般 的 な 文 章 と 考 え ら れ る 新 聞 記 事 を 用 い て , 検 索 結 果 数 の み を 用 い た 修 正 方 法 と 提 案 手 法 を 比 較 し た . 実 験 結 果 よ り , 学 術 論 文 な ど の 文 章 で は 本 手 法 は 検 索 結 果 数 の み を 用 い る 方 法 を 上 回 っ た . し か し , 一 般 的 な 文 章 の 場 合 は 検 索 結 果 数 の み を 用 い た 手 法 と あ ま り 精 度 に 差 は な か っ た . 今 後 の 課 題 と し て , 冠 詞 の 用 法 の 拡 充 や , 冠 詞 の 用 法 と 検 索 結 果 数 を 用 い た 冠 詞 の 修 正 方 法 の 改 善 が 挙 げ ら れ る .ま た ,表
表
表
表 6
修 正 案の 適 切 性 評価
修 正 案の 適 切 性 評価
修 正 案の 適 切 性 評価
修 正 案の 適 切 性 評価 ([1]の英文
の 英 文
の 英 文 )
の 英 文
再 現 率 適 合 率 F 値 検 索 結 果 数 の み の 手 法 0.84 0.75 0.79 提 案 手 法 0.81 0.79 0.81表
表
表
表 10
冠 詞誤 り の 修正 性能
冠 詞誤 り の 修正 性能
冠 詞誤 り の 修正 性能
冠 詞誤 り の 修正 性能 (論文
論 文
論 文 )
論 文
正 解 誤 り 正 解 率 検 索 結 果 数 の み の 手 法 259 75 0.78 提 案 手 法 269 65 0.81表
表
表
表 11
冠 詞 誤り の 修 正 性能
冠 詞 誤り の 修 正 性能
冠 詞 誤り の 修 正 性能
冠 詞 誤り の 修 正 性能 (論文
論 文
論 文
論 文 )
再 現 率 適 合 率 F 値 検 索 結 果 数 の み の 手 法 0.74 0.67 0.70 提 案 手 法 0.80 0.74 0.77表
表
表
表 8
修 正 案の 適 切 性 評価
修 正 案の 適 切 性 評価
修 正 案の 適 切 性 評価
修 正 案の 適 切 性 評価 (New York Times)
表
表
表
冠 詞 の 用 法 の 検 出 の た め 作 成 し た 名 詞 お よ び 形 容 詞 の リ ス ト に つ い て も さ ら に 精 査 し た い .
参
参
参
参
考
考
考
考
文
文
文
文
献
献
献
献
[1] 金 谷 健 一 “ こ れ な ら 書 け る 論 文 英 語 ― 理 系 の た め の 英 文 練 習 帳 ― ” 岡 山 大 学 大 学 院 自 然 科 学 研 究 科 2011 年 4 月 (第 1.0 版 ) [2] 河 合 敦 夫 , 杉 原 厚 吉 , 杉 江 昇 ,“ 英 文 の 誤 り を 検 出 す る シ ス テ ム ASPEC-I ” 情 報 処 理 論 文 誌Nov.1984 Vol.25 No.6, pp.1072-1079, 2007
[3] 平 野 孝 佳 , 平 手 勇 宇 , 山 名 早 人 ,“ 検 索 エ ン ジ ン
を 用 い た 英 文 冠 詞 誤 り の 検 出 ”日 本 デ ー タ ベ ー ス 学 会 ,Letters vol.6, No.3, pp1-4, 2007
[4] 綱 嶋 祐 一 , 岡 田 壮 史 , 安 藤 一 秋 ,“ 検 索 エ ン ジ ン を 利 用 し た 多 言 語 作 文 支 援 ” 電 子 情 報 通 信 学 会 , 信 学 技 報 ET2007-97, pp.73-78, 2008 [5] 永 田 亮 , 井 口 達 也 , 脇 寺 健 太 , 桝 井 文 人 , 河 合 敦 夫 , 井 須 尚 紀 ,“ 前 置 詞 情 報 を 利 用 し た 冠 詞 誤 り 検 出 ” 電 子 情 報 通 信 学 会 論 文 誌 D-I, Vol.J88-D-I No.4, pp.873-881, 2005 [6] 乙 武 北 斗 , 荒 木 建 治 ,“ 単 語 出 現 状 況 の 特 徴 を 用 い た 英 文 誤 り の 検 出 お よ び 自 動 校 正 ” 社 団 法 人 情 報 処 理 学 会 , 研 究 報 告 , NL-171, pp.25-30, 2006 [7] 永 田 亮 , 若 菜 崇 宏 , 森 広 浩 一 郎 , 桝 井 文 人 , 河 合 敦 夫 , 井 須 尚 紀 ,“ 可 算 /不 可 算 の 判 定 に 基 づ い た 英 文 誤 り の 検 出 ” 電 子 情 報 通 信 学 会 論 文 誌 Vol. J89-D, No.8, pp.1777-1790, 2006 [8] 乙 武 北 斗 , 荒 木 建 治 ,“ 単 語 出 現 状 況 の 帰 納 的 学 習 に よ る 英 文 誤 り の 検 出 及 び 自 動 校 正 ” 電 子 情 報 通 信 学 会 論 文 誌 , D Vol.J90-D No.6 pp.1592-1601, 2007 [9] 竹内 裕 巳 , 河 合 敦 夫 , 永 田 亮 , 乙 武 北 斗 ,“ 英 文 自 動 冠 詞 付 与 に お け る 前 方 照 応 の 考 慮 ” 情 報 処 理 学 会 研 究 報 告 , Vol.2011-NL-204 No.10, pp.1-7, 2011 [10]Yahoo!JAPAN が 提 供 す る 検 索 WebAPI http://developer.yahoo.co.jp/webapi/search/ [11]Weblio 辞 書 英 和 和 英 辞 書 http://ejje.weblio.jp/ [12]欧 羅 巴 人 名 録 http://www.worldsys.org/europe/ [13]米 国 国 勢 調 査 局 に よ る 米 国 の 人 名 頻 度 順 リ ス ト
1990 Census Name Files
http://www.census.gov/genealogy/names/ [14]New York Times http://www.nytimes.com/