柔軟な文生成方式
8
0
0
全文
(2) 本研究は,語と語の直接の関係を表層表現によ. クから依存ツリーに変換する際に生じ る関係情. り表示したネットワーク型の構造から文を生成す. 報の書き換えについて述べ,5 節で,依存ツリー. ることを目的とする.深層に踏み込んだ意味的構. からの文生成手法について述べる.最後に 6 節で. 造を用いず,表層上の関係表現により表示した構. 本論文をまとめる.. 造から文生成処理を柔軟に行うことができる枠 2. 依存ネット ワーク. 組みの構築を目指す. 本論文では,表層上の関係により表現したネッ. 語をノードとし,ノードとノード の直接の関係. トワーク型の構造を定義する.ネットワークを構. を示すアークを持つネットワーク型の構造を依存. 成するノード 間のアークに設定した関係情報や. ネットワークと定義する.. 向きを書き換えることで,文生成を行うことが 可能なモデルを示す.. アークには,ノードに対する関係の向きと関係 情報を持つ.ノードには,ノード の素性,文生成. ここでは,ネットワーク型の構造を依存ネット. を行う際に用いる文生成順序情報,関係の書き換. ワークと呼び,依存ネットワーク上の関係の書き. えを行った際に生じる関係情報の書き換え規則を. 換えにより得ることができる木構造を依存ツリー. 持つ.. と呼ぶこととする.依存ネットワークおよび依存 ツリーは本稿内で定義する.. 依存ネットワークは,原文におけるノード の位 置の情報を持たずノード とノード との直接の関. この手法は,依存ネットワーク上で関係の書き 換え可能なノード を指定することで異なる表現. 係を表層表現を用いて表示した構造である.図 1 に依存ネットワークの例を示す.. 形式の文を生成することができる. 同一の依存ネットワークから異なるノードを指. w4. w1. 定して得た文は,同じ構造から得た別の文という. R(1,3). 解釈ができる.これは,言い換え文を生成する手. R(6,8) R(5,3). 法と関係が深い.. R(2,3). 本提案に先立ち報告したものとして依存構造を. w6. R(5,4) R(5,8). w3 w5 w6 R(7,8) hr1 , r2 , · · · , rn i@ {r1 → rp , · · · , rn → rq }@(素性){ri → rj }. w2. 利用した言い換え文の自動生成3) がある.この報. w7. 図 1 依存ネットワーク例. 告は,単文を対象とし依存ネットワーク上のノー ドの書き換えによって生じる語を関係付けている 表層表現が消失することによる言い換え結果への. wi はノード を表す.ノード は自立語に対応す. 影響について述べたものである.この論文におい. る.ノードが用言に対応する場合,基本型 (原形). ても,依存ネットワーク上の関係を書き換えるこ. を設定し時制,時相,様相などはノードの素性と. とによって言い換え文の生成を行っている.これ. して扱う.. は,依存ネットワーク上のノード 間の関係の書き. wi と wj を結ぶアークはノード 間の関係のつな. 換え規則を固定で与え言い換え文を生成し 評価. がりを意味し ,矢印の向きは関係の向きを示す.. した結果について報告したものである.. wi と wj を結ぶアークには表層表現を用いて関係. 本論文では,この報告で述べた文生成手法に対 しより柔軟な文を生成できるよう拡張したモデ. 情報を表し,R(wi , wj ) と表現する.図 1 は,関 係情報 R(wi , wj ) を R(i, j) で表現した.. hr1 , r2 , · · · , rn i@ は,文生成順序情報を意味し,. ルについて述べる. 本論文の構成は,まず,2 節で依存ネットワー. 関係情報 rp =R(wi , wj ) と rq =R(wx , wy ) が与え. クについて述べ,3 節で,依存ネットワークと依. られた場合に rp ,rq のど ちらを先に出力するかを. 存ツリーついて述べる.4 節で,依存ネットワー. 決定する情報として用いる.@ は文生成順序情. −30− 2.
(3) 報を持つノード を指す.h· · · , rp , · · · , rq , · · ·i@ が. この依存ツリーは,表層文を構文解析すること. 指定されている場合,rp で関係付けられている. で得られる係り受け関係と一致する構造を持つ.. ノード を先に出力し ,rq で関係付けられている. 依存ネットワークを依存ツリーに変換する場合,. ノード を出力する.すべての関係情報に対して. 変換を開始するノードを指定する.この時に指定. 出力が終わると自ノード を出力し 文生成処理を. する「変換を開始するノード 」をエントリノード. 終えることを意味する情報である.つまり,文生. と呼ぶ.. 成順序情報は文生成結果におけるノード と関係. エントリノードから関係情報の書き換えを行い. するノード との表層文中の位置関係を指定した. ながら,依存ネットワークをトラバースすること. ものである.. で,エントリノードを文末表現とする文に該当す. {r1 → rp , · · · , rn → rq }@( 素性 ){ri → rj } は,. る依存ツリーへの変換操作を行う. 図 3 に示す依存ネットワークを依存ツリーに変. 依存ネットワークの関係の書き換えが生じた場合 の関係情報の書き換え規則である.受け身表現へ. 換する流れを説明する.. の変換を行うための表層格シフト情報や依存ネッ トワーク上のノードの書き換えが可能かの情報を. w1. R(1,4) w4. 4 節にて述べる.. w2. 図 2 に依存ネットワークの具体例を示す.. . . . . . $#% "! !! #% , , , {} (){ } } {} (){. -, . "#+! % !
(4) . {}. , (){. エントリノード. R(3,4). 設定する.関係情報の書き換え規則については,. w3. R(2,4). 図 3 依存ツリー変換元構造 }. &$ # ! !. ,. ! ')$(&! * #+% $##%% , 1000. { {} (){ {} (){. , } (. ){. 図 3 のノード (w3 ) をエントリノード に指定す }. } }. る.w3 には,w4 に対し R(3, 4) の関係を設定し ている.これは,w3 から w4 に対する関係である ため,w3 をルートノードとする木構造ではない.. 図 2 依存ネットワーク具体例. そのため,w4 から w3 への関係の向きの変換が必 要である.R(w3 , w4 ) に対応する関係 R(w4 , w3 ). 図 2 は, 「 太郎が花子にあげた厚い本を次郎が. が存在する場合は,関係の向きの書き換えを行い,. 1000 円で買った」を依存ネットワークで表現し. w4 に制御をトラバースする.w4 には,すでに書. たものである.ノード には語の表層表現が対応. き換えを行った R(w4 , w3 ) 以外に,R(w1 , w4 ) と. し ,ノード とノード を関係付けている関係情報. R(w2 , w4 ) の関係が存在するが,いづれも,w1 ,w2. には,表層格が対応する.文生成順序情報には表. から w4 への関係であるため w4 をルートノード. 層格をそのまま用い,生成結果の文において好ま. とする木構造である.したがって,関係の書き換. しい順序を設定する.. えの必要はない.その結果,w3 をルートノード とする木構造に変換でき,図 4 に示す依存ツリー. 3. 依存ネット ワークと依存ツリー. が得られる.. 依存ネットワークは,図 1 で示したノード (w5 ). 図 3 のノード (w3 ) をエントリノード に指定し. ように,1 つのノードが複数の関係先を持つ構造. た場合,R(3, 4) に対応する逆向きの関係 R(4, 3). である.文生成を行う前段の処理として,ネット. が存在しない場合,関係情報の書き換えを行うこ. ワーク構造を木構造に変換する.ここでは,依存. とができず,w3 をエントリノード とする依存ツ. ネットワークを木構造に変換して得た構造を依存. リーに変換できない構造であることを意味する.. ツリーと呼ぶ.. 関係情報の書き換えが可能かど うかの情報は,. −31− 3.
(5) 係の向きを変更する場合に用いる情報である.@. R(1,4). w1. w4 w2. の左辺に記述した {} 内の情報は,ノード (“わた. エントリノード. R(4,3). す”) と関係情報 (“に ”) の間で関係の書き換えが. w3. 生じた場合に影響を受ける関係を指す.この場. R(2,4). 合,ノード (“わたす”) に関係情報 (“が ”) で関係 図 4 依存ツリー変換後構造. 付けているノード との関係を関係情報 (“に ”) に. 関係先ノード の関係情報の書き換え規則に設定 しているかに依存する.4 節で,詳細な動作につ. 書き換えることを指す.@の右辺に記述した {} 内の情報は,関係の書き換え後の関係情報 (“に ”) に対する情報である. 「に→φ」と設定している. いて述べる.. 場合,関係の書き換えた後に関係情報 (“に ”) が 消滅し,ノードとノードの関係のみが残ることを. 4. 関係情報の書き換え. 依存ネットワークから依存ツリーに変換するた めには,関係情報の書き換えが必要となる場合が ある. 関係情報の書き換えの基本的な動作を単文の依 存ネットワークにより説明し,連体修飾による埋 め込み構造を持つ複文においても依存ツリーに 変換できることを説明する.. 意味する. @の左辺の {} 内に情報を記述していない書き 換え規則は,関係情報の書き換えを行った時に影 響を受ける関係情報がないことを意味する. 図 5 に示した依存ネットワーク上のノード (“ 本”) をエントリノードに指定して得た依存ツリー を図 6 に示す..
(6). . 4.1 基本的な書き換え動作. . 図 5 に具体例を示し,依存ネットワークから依. . 存ツリーへの変換の基本的な流れと関係情報の 書き換え規則について説明する..
(7). . . 図 6 ノード (“本”) をエントリノード とした場 合の依存ツリー. .
(8) , ,
(9) } ( ){ { {} (){
(10) } } {} (){. . エントリノード をノード (“本”) にすることで,. R(“本”,“わたす”) を R(“わたす”,“本”) へ書き換. }. える必要がある.このとき参照する書き換え規則 はノード (“わたす”) に設定している「 {} @ { を. 図 5 具体例:変換元依存ネットワーク. →φ } 」を用いる.関係情報 (“を ”) の書き換えに. 図 5 に示す依存ネットワークでは,以下の関係. は,@の右辺に情報を設定していないため他の関 係情報に影響を与えない.したがって,関係の向. 情報の書き換え規則を設定している.. きのみ書き換える.関係情報 (“を ”) は, 「 { を→. • { が→に } @ (受け身){ に→φ }. φ } 」に従い関係のみが残り,表層上の関係が消. • {} @ (){ を→φ }. 滅した状態となる.以上の処理により,ノード (“. • {} @ (){ が→φ } 関係情報の書き換え規則「 { が→に } @ (受け 身){ に→φ } 」は,ノード (“わたす”) に対し関 係情報 (“に ”) で関係付けられているノード の関. 本”) をエントリノード とする依存ツリーを得る. 同様に,ノード (“花子”) をエントリノード に した時の関係情報の書き換えについて説明する.. −32− 4. ノード (“花子”) には,R(“花子”,“わたす”) を.
(11) 設定している.先に説明した場合同様に関係の. ノード (“花子”) をエントリノードとして指定し. 向きの書き換えが必要である.R(“わたす”,“花. た場合を例にネットワーク上のノードをトラバー. 子”) の関係を作るため,ノード (“わたす”) に設. スして関係情報を書き換える流れを説明する.. 定した関係情報の書き換え規則を参照する.ノー. R(“花子”,“わたす”) を R(“わたす”,“花子”) へ. ド (“わたす”) には,関係情報 (“に ”) 関する書き. の書き換えは,図 7 に示したとおりである.ノー. 換え規則として「 { が→に } @ (受け身){ に→φ. ド (“わたす”) には,R(“太郎”,“わたす”) と R(“. } 」を設定している.この書き換え規則には,関. 本”,“わたす”) の関係を設定している.ノード (“. 係情報 (“に ”) に対する関係の書き換えを行うこ. 太郎”) には,さらに先の関係が存在しないため,. とで影響を受ける関係情報として「が」を設定し. R(“太郎”,“わたす”) が成立する.ノード (“本”). ている.そのため,関係情報 (“が ”) により関係. は,R(“本”,“なくす”) の関係があるため,関係. 付けているノード (“太郎”) との関係を関係情報. の書き換え処理をノード (“本”) に移動する.. (“に ”) に置き換える.元々の関係情報 (“に ”) は,. ノード (“本”) では,R(“本”,“なくす”) から R(“. { に→φ } の情報により関係の方向のみ残され,. なくす”,“本”) への関係の書き換えが必要となる.. 表層上の関係が消滅する.さらに,書き換え規則. したがって,ノード (“なくす”) に設定している. には,ノード (“わたす”) の素性情報を定義して. 関係の書き換え規則に基づき R(“本”,“なくす”). いるため,ノード (“わたす”) に素性 (“受け身”). を R(“なくす”,“本”) に書き換える.書き換えの. を追加する.このようにして得た依存ツリーを図. 影響を受ける関係情報として「が→に」を設定し. 7 に示す.. ているため,R(“次郎”,“なくす”) の関係情報の. . . 置き換えが生じる.. . このようにして得た依存ツリーを図 9 に示す.. .
(12) . . . . . 図 7 ノード (“花子”) をエントリノード とした 場合の依存ツリー. . . .
(13) . . 図 9 ノード (“花子”) をエントリノードに指定した この手法は,連体修飾節による埋め込み構造を. 依存ツリー. もつ文に対しても適用することができる. 次に,ノード (“本”) をエントリノード に指定. 4.2 連体修飾節を含む埋め込み文. 図 8 に連体修飾節による埋め込み構造をもつ文 の依存ネットワークを示し,関係の書き換えが単 文の場合同様に行えることを示す.. . . . . . . < , , > } ( ){ { {}@(){ } {}@(){ }.
(14) . }. . . した場合について説明する.ノード (“本”) には,. R(“本”,“わたす”) と R(“本”,“なくす”) の 2 つの 関係がある.この 2 つの関係をノード (“本”) に 対する関係に書き換える.この書き換え操作は, これまでに述べた手法により行う.その結果,図. ){ . < , , >@ }@( { {}@(){ } } {}@(){. 図 8 埋め込み構造を持つ文の依存ネットワーク. 10 に示す依存ツリーを得る. 図 10 に示す依存ツリーでは,2 つの依存ネット. }. ワークが表層上の関係を持たずにノード (“本”) に関係している構造である.このことから,2 つ の文が並列でノード (“本”) を修辞する構造を示 す依存ツリーであることを示している.. −33− 5.
(15) . . . . . .
(16) . ノード を並べ,関係情報を付与し文生成を行う.. . これにより,最初に「太郎が」が選ばれ次に「花 子に」という順序でノード を文として出力する. 関係するノードの出力が終了すると,自ノードの 出力を行う.このとき,用言に相当するノードに. 図 10 ノード (“本”) をエントリノードに指定した. は,素性情報が付属している場合がある.図 6 で. 依存ツリー. は,ノード (“わたす”) に素性「過去」が付属し. 以上に述べたように,この手法は,関係の書き. ている.そのため,ノード (“わたす”) を出力す. 換え規則を設定可能であれば ,すべてのノード. る前に素性に基づいて語形変化を行い出力する.. をエント リノードして指定した依存ツリーを得. その結果「太郎が花子にわたした」という文を得. ることが可能である.. る.ノード (“わたす”) の生成が終了すると,文 生成処理は,ノード (“本”) に戻り,ノード (“わ. 5. 文 生 成. たす”) の文生成結果と R(“わたす”,“本”) によっ. 文の生成は,依存ツリーに変換した構造を用い て行う.依存ツリーは,エントリノードとして指 定したノード をルート ノード とする木構造であ る.ノード とノード を関係付けている情報は関. て,ノード (“本”) の出力を行う.このとき,関係 情報 R(“わたす”,“本”) が「φ」であるため,表 層上の関係表現を出力せず, 「 太郎が花子にわた した本」を文生成結果として得る. 表 1 に各ノードをエントリノードとして得た文. 係をマークする表層上の表現を設定した情報で ある.したがって,文生成処理は用言に対応する. を示す.. ノード に設定した素性に基づく語形変化を行う. 表 1 文生成結果例 (I). 処理と関係付けが存在するノード に関係情報を. エントリ. 付与し線形に並べる処理となる.. わたす 太郎 花子 本. 図 5 に示した依存ネットワークを用い文生成の 流れを説明する. まず,ノード (“本”) をエント リノード とした. 生成文 太郎が花子に本をわたした 花子に本をわたした太郎 太郎に本をわたされた花子 太郎が花子にわたした本. 文生成について述べる.ノード (“本”) をエント リノードとして依存ツリーに変換する (図 6).次 に,ノード (“本”) はノード (“わたす”) との関係 が存在する.ノード (“本”) を文として出力する ためには,ノード (“わたす”) に対する関係が文 に変換できている必要がある.そのため,文生 成処理をノード (“わたす”) に移す.ノード (“わ たす”) には,R(“太郎”,“わたす”) と R(“花子”,“ わたす”) の関係がある.それぞれの関係先には, その先の関係が存在しないため,R(“太郎”,“わた す”) と R(“花子”,“わたす”) の関係を文に変換す る処理を行う.このときに用いる情報が文生成順 序情報である.図 5 では,ノード (“わたす”) の 文生成順序情報に<が,に,を>@を設定してい る.文生成処理では,この文生成順序情報に従い. 同様の手法で,図 8 に示した構造から生成した 文を表 2 に示す. 表 2 に示した生成文のうちエント リノード に 「 本」を指定して得た文は,ノード (“本”) に文 生成順序情報を設定していないため 2 つの文を 得る. 表 2 に示した生成文は,ノードに設定している 文生成順序情報にしたがって処理したものであ る.ノード (“なくす”) をエントリノード として 出力した文では,ノード (“なくす”) の文生成情 報<が , で , を>@にしたがって文を生成してい るため関係情報 (“を ”) でノード (“なくす”) と関 係付けている埋め込み構造を持つ文がノード (“. −34− 6.
(17) 表 2 文生成結果例 (II) エントリ なくす 次郎 公園 本 わたす 太郎 花子. 生成文 次郎が公園で太郎が花子にわたした本をなくした 公園で太郎が花子にわたした本をなくした次郎 次郎が太郎が花子にわたした本をなくした公園 太郎が花子にわたした公園で次郎になくされた本 公園で次郎になくされた太郎が花子にわたした本 太郎が花子に公園で次郎になくされた本をわたした 花子に公園で次郎になくされた本をわたした太郎 太郎に公園で次郎になくされた本をわたされた花子.
(18) . なくす”) の直前に現れる.. . 生成した文の中で,語と語の関係を示すのは,. 1. 1. 語に付属した表層上の関係表現である.表層上. . の関係表現は比較的自由に関係先の語と関係を 持つ.そのため,本来の関係先の間に埋め込み文. 2. 1. など 複雑な構造を持つ文が存在すると語と語の 関係が不明確になる場合がある.表 2 に示した. . . 3. 図 11 ノード の深さ例. ノード (“なくす”) をエントリノード として出力 した例では,ノード (“公園”) の本来の関係先は. 公園”) は双方とも関係するノード を持たないた. ノード (“なくす”) であるが,出力文では,ノー. めノード の深さは 1 となる.ノード (“なくす”). ド (“なくす”),ノード (“わたす”) のど ちらに関. を深さに加え,ノード (“本”) に対するノード (“. 係付けているのか不明確である.. なくす”) の関係の深さは 2 となる.このように. そこで,各ノードを文として出力順序を選択す. して,ノード (“わたす”) に対する関係の深さは,. る際,ノード が持つ関係の深さを求め関係の深. ノード (“太郎”) が 1,ノード (“本”) が 3 となり,. さの制約を文生成順序情報とともに用いた処理. ノード (“本”) の方がより複雑な構造を持つ関係. を行う.. であることが分かる.. 図 9 に示したノード (“花子”) をエントリノー. したがって,ノード (“本”) に対する関係から文. ド に指定して得た依存ツリーを用いノード が持. 生成処理を行う.同様に,ノード (“なくす”) に. つ関係の深さを導入した文生成について述べる.. ついても出力順序の選択が必要となる.このと. まず,関係の深さについて説明する.関係の深. き,ノード (“なくす”) には,2 つの関係を設定し. さの情報が必要なノードは,複数のノードとの関. ているが,いづれのノード も関係の深さは 1 であ. 係付けが存在する場合である.したがって,図 9. る.ここで,文生成順序情報を参照し,ノード の. に示したノード (“わたす”) を出力する場合に必. 出力順序を決定する. その結果,図 9 の依存ツリーより, 「 公園で次. 要となる.図 11 にノード の深さの取得例を示す. ノード に付与した数字がノード (“わたす”) に 対するノードの深さを示している.依存ツリーを. 郎になくされた本を太郎にわたされた花子」を 得る.. 再帰的に移動し,関係するノードの個数が多いも. 文生成処理において関係の深さの制約を与える. のを代表するノードの深さとして選択し自ノード. ことで,表 2 に示した出力結果は,表 3 に示す結. を加えノード の深さとする.図 11 では,ノード. 果となる.. (“なくす”) に対し ,ノード (“次郎”),ノード (“. −35− 7. 表 3 に示した出力結果では,複雑な構造を持つ.
(19) 表 3 文生成結果例 (III) エントリ なくす 次郎 公園 本 わたす 太郎 花子. 生成文 太郎が花子にわたした本を次郎が公園でなくした 太郎が花子にわたした本を公園でなくした次郎 太郎が花子にわたした本を次郎がなくした公園 太郎が花子にわたした公園で次郎になくされた本 公園で次郎になくされた太郎が花子にわたした本 公園で次郎になくされた本を太郎が花子にわたした 公園で次郎になくされた本を花子にわたした太郎 公園で次郎になくされた本を太郎にわたされた花子. ノード から先に出力するため,単純な構造を持. 参 考. つノード を本来の関係先のノード の近くに配置. 文 献. 1) 尾崎正太郎,黒橋禎夫,長尾真: “意味ネット. ワークからの文章生成.” 情報処理学会,自 然言語研究会,NL120-20.(1997).. することができる. 6. ま と め. 2) 関洋平,飯島正,原田賢一:. “意味焦点駆動 文生成.” 情報処理学会,自然言語処理研究 会報告,NL131-11.(1999).. 本論文では,語と語の直接の関係を表層表現に より表示した依存ネットワークを定義した.依存. 3) 中野滋徳, 足立顕, 牧野武則: “依存構造を. 利用した言い換え文の自動生成.” 情報処理 学会,自然言語処理研究会報告,NL159-26. (2004).. ネットワーク上に配置したノード の関係を書き 換えることで関係の書き換えが可能なノード を エント リノード とする依存ツリーへの変換手法. 4) 中野滋徳, 足立顕, 牧野武則: “複文構造に. を述べた.文生成では,依存ツリーから表層文を. おける言い換えについて.” 情報処理学会,自 然言語処理研究会報告,NL160-10.(2004).. 得る手法について述べた. 本論文では,依存ネットワークから文を生成す. 5) 山脇拓, 中野滋徳,足立顕,牧野武則:. “ 依存ネットワークをもとにしたパラグラフ要 約.” 情報処理学会,自然言語処理研究会報 告,NL160-6.(2004).. るための手法についてのみ述べた. 同一の依存ネットワークより異なるノードを指 定して得た文は,同じ構造から得た別の文という 捉え方ができ,一種の言い換え文生成手法とも言 える. そのため,本手法の評価は,複文構造における 言い換えについて 4) で行う. また,言い換え文生成とは別に,依存ネットワー クをもとにしたパラグラフ要約5) で要約結果の表 示に本提案モデルの応用例を示す. 本論文で提案したモデルでは,文生成処理で ノードを提題化する手法等は扱わなかった.今後 は,ノードの提題化等について扱う枠組みの導入 を目指す.. 8. −36−.
(20)
図
関連したドキュメント
A tendency toward dependence was seen in 15.9% of the total population of students, and was higher for 2nd and 3rd grade junior high school students and among girls. Children with
事業セグメントごとの資本コスト(WACC)を算定するためには、BS を作成後、まず株
本文のように推測することの根拠の一つとして、 Eickmann, a.a.O..
Q7
自然言語というのは、生得 な文法 があるということです。 生まれつき に、人 に わっている 力を って乳幼児が獲得できる言語だという え です。 語の それ自 も、 から
を育成することを使命としており、その実現に向けて、すべての学生が卒業時に学部の区別なく共通に
を育成することを使命としており、その実現に向けて、すべての学生が卒業時に学部の区別なく共通に
大村 その場合に、なぜ成り立たなくなったのか ということ、つまりあの図式でいうと基本的には S1 という 場