• 検索結果がありません。

自然言語情報処理データ・べ一ス 自然言語の標準化一

N/A
N/A
Protected

Academic year: 2021

シェア "自然言語情報処理データ・べ一ス 自然言語の標準化一"

Copied!
8
0
0

読み込み中.... (全文を見る)

全文

(1)

自然言語情報処理データ・べ一ス

自然言語の標準化一

(昭和49年10月31日 原稿受付)

情報工学教室吉田  将

九州産業大学  藤   田      毅 長崎大学    鶴   丸   弘   昭

Data Base for Natural Language Information Processing

      Normalization of Natural Language

by Sho YOS且IDA

    Takeshi FUJITA

    Hiτoaki TSURUMARU

   It is useful for the simpli丘cation of宮emantic processiロg in tlle皿atural lnnguage system to tτansform natural language input into a kind白f formally de丘ned intermediate hnguage. If this fOrmalizatiOn were reali肥d, many peOple, wit110Ut SpeCial training, Can deSCribe VaSt amOUnt Of natural language information data bases in this formalized language, and that it beoomes easier to utilize these data bases. However the complete transform飢ion is very di缶cult for the various 日exibilities and ambiguities o「加tural language.

   This paper descrihes a method of decomposing ordinary Japanese sentenoes into a set of simple sentential forms, whicll we call tl1巴norma]form sentences, and a set of connective relations between the normal form sentence.

   In genera1, a Japanese senteロce is composed of one or more bunsetsu s(Sentence units).

eacll o「wllieh is composed of an independent word and zero or more annex words. The part of speech of the independent words are cla5sified as ハ1 (ロouロ),」戸 (verb or adjective) and 〆1dr

(adverb).

   Decomposition into the normal form is performed tbrough the syntactic nnalysis related to th。 dep・nden・y r色1・ti。・・am。・g b・nsets・ ・in a senten・e and th・・egm蝋・ti。・・f w・・ds withi・

each bunsetsu. The dependency relations between two bunsetsu s in a sentence訂e chssi丘ed as follo、Ψing expression forms.

   ユ.NP t・p・ h蒜a−ga utsk;shii『( TM…・i・b・・u・if・L汀    2・PN・・p・ uts㌣shii ha量a ( beautiful nower

3.PP typ, ・h社。k・ t・utsukushii b・(lt)i…hil…db・・utif・1.・う    4、NN t・p・ sa碧m n°h需a ・he・町bl・・s・皿 つ

‥ハp・ t°

冝F°utsu睾shi「 Cv・・y b…・if・1つ 6・・い・… ノ:u霊『( j・…b・vの

7・硫・typ・ ta│n yu;il「 ¶亡very・1・wl・ })

   These seven forms are further clコssined aocording to the di∬erence of bunsets11 s structure・

and to each of them tlle decompositioll rules are sho、m as foUws.

   ♪JP type ・ inu・ni hoe・rare・ta,,( {(He) 、、,as barked at b}, a do9†㌔)

   Its口ormal「orm

(2)

    ∫,=二inu ga hoeru lthe case of inu , to hoeru1 =・=lsubject]g司

      [皿10de of hoeru =[auxili証ry verb[passive]lrareru[[the case oいi・ピ 1・ rarerゴ       ==Iindiエect objectl ni][mode of {rarerゴ=[auxiliary verb[pnst, perfect]]ta]】]

  P」Vtype  oshie・t{∋morau eigo ,( English which is taughガ,.)

  Its normal forlIl

    eigo [speci6cation of ° eigo°,=5ゴ]

    5i=eigo wo oshi《…ru 匡lle case of」℃igo to ㌔゜oshieru,,=[object]wo]

      lmode of oshieru丹=Iauxiliary verb [request, possihle request]] temorau]

  PP type◆ kuyashii・to omou°,ぐ (1)think lt regrettable,㌔)

  Its皿ormaUorm

    5∈kuyユshii

    5,=:5to omou 【specilicatio皿of 5=5∫] 工the case of 5 to」omou =[designation]to]

  Brackets [∵㍗indicate auxiliary informntion of th已1eft word.

  The decomposition mles for a sentence are de加ed using the deoo皿pos三t▲on b且sed on the dependency relati⑪n as mentioned aboΨe.

  The greater part of Japanese e工cept the ide回matic expressbロs is covered in tllis paper alコd so it may be concluded that the decomposition of∫apanese in亡o its normal form is possible.

However t}le semantic classi丘cation of words is necessa」ry for practica1 皿achine processing.

because tlle size of dictionary for the decomposition must be actual in size. It is remained ns the next problem to give lhe rule of interpエetation to the result oいhe decompositiol1.

       間の係り受けの有無と文節内での自立語・付属語の区切  1・ ま え が き      りが与えられたときに係り受けの意味を求める方法とモ

社会の惜報化が進むにつれ,だれでもが特別な訓練を   れに必要な辞書の種類・形式などが求められている。本 受けることなく自然言語によって各種の情報処理ができ   鵠文ではそれらの方法を基礎にして係り受けの関係にあ ることが要請されてきつつある。また,自然言語は,そ   る二文節どうしの標準形分解の定義・方法を求め,さら の記述能力が塁富である故,広分野にわたる質問応答シ   にそれを用いて文の標準形分解の定義・方法を求める。

ステム等の対象言語として,またメタ言語として利用価

       .−         2, 日本語文と標準形文との関係 値が大きい。一方,自然言語は膨大なっえ,あいまいさ

がある故,機械処理に不向きな面ももっている。自然言    日本語文は慣用句的な表現など一部の例外を除くと,

語のもつあいまいさは本質的なものであり,これを完全   臼)のような係り受けの構造をもつ文(これを4・で述 に無くすることは困難である。機械処理のためには可能   べるように標準形の文と設定している)を基本として,

な限りあいまいさのない表現を用いることが望ましい   それに修飾,接続,様相添加などを施して得られたもの が,一方,自然言語の良さであるだれでもが使えるとい   と解釈することができる・

う性質を損なわないようにすることが必要である。この

      ひエ      はシ

㌻㌶巖㌶驚:;;:曇㌶一亡工≡書

一タ・ペースをこの言語を用いて記述することにより多

くの人がデータ・ペースの作成に参加でき,また種々の    ここで,1V増幡1(f=1,2,… Fπ)は体言に格助詞が 自然言語情報データ・ベースの利用が容易になるであろ   付いたもの,・Pは用言を表わす。

う。なお,自然言語文の標療化によって原文のもってい       例  脚, 報で  熔恒  :削

ない。

 本論文では,日本語文が一定の形の文(標準形文)の    標準形の文から一般の文は次のような手順で構成され 集まりとそれらの接続関係の集まりとに変換・分解でき   る。

ること,およびモの方法について述べる。         ユ.文末の述語Pに助動詞・補助用言を付けて標準  鵠文(1)および(2)では,日本語文の二文節間の係   形の文で表現されていることを別の立場(受身・使役な り受けの有無を,主として品詞水準で求めるのに必要な  ど)で表現したり,撤相を記述したり,助詞を付けて意 情報,それをもとに構文分析を行なう方法,さらに文妨   味を変化させたりする。このとき, 1V!;号臨.1 の格助詞を

る欄醐なわれないように硫されていなければなら   工二⊆≡ヨー

(3)

変換しなければならない場合がある。      これらの基本形について、それぞれ二文節聞の係り受  例・私杢 目う→私匹 習わ童ゑ      け開係を標準形分解することを3.で調べ,それを利用  2.文末の述語Pに終助詞,文節の最{炎に間投助詞   して文を標準形分解することを4,で調べる。

を付けて感歎・強調などを表わす。      標準形の文は,我々の自然言語システムの意味の基本  例.英語を 習う→英語を塾 習う蛙       構文の概念から導びかれてきたものである4間。 意味の  3.格助詞の前または後に副助詞,係助詞などを付け   基本構文は数段階のレベルのものを考えているがモの一・

て意味を変化させたり,叙述の形式を規定したりする。   つは,各Pについて係りうる格の種類と,モの格で代  例・英語を 習う→英語をぜ 習う         入可能な1Vの語群を規定したもの (これはFilhnore          一芦英語だけを 習う        のca5e frameの概念とも類似している6})をいう。こ  4.文末の述語Pを連用修飾するPや丸,(副詞)を   れはPの意味を一つの側面から定義したものであるが,

挿入する。       これによって直接,標準形文との間の対応をとることが  例.英語を 習う→英語を 正しく 習う      でき,システムの記述言語と対象言語との関連付けが容  5.文末の述語Pと趣用.並立または連用接続するPを   易となる。

挿入する。      また,意味の基本構文は,文の性質として一般に成立  例.英語を 習う→楽しみながら 莱…吾を 習う    する,格の衝突禁止の原則(一つのPに複数個のNが  6.1V,を連体修飾するPまたは1V,あるいは連体並   同一格で係ることはない)を用いると,構文分折でのあ

立するNを挿入する。       いまいさを減らすためにも有効である。

 例.英語を 習う→正しい 英語を 習う

・.以上のようにし℃酬脚文噺しく加えられ 3・騨形分解砺法

た各Pを,1V舳副形の文節を挿入して醒飾する。(この   3.1予備的車項

連文節もまた,そのPを文末述語とする標準形の文か    本論文では係り受けの種類が与えられているとして標 ら生成されたものとみなすことができる。そこで,この   準形分解の方法を述べるが,係り受けの極類を求める過 連文節に対しも1.〜6.のような操作を施す)。     程では.辞書の量を減らすために標準の形に変換して処  例.行って藁語を 習う→学校に 行って     理しており,標準形分解の過程とは相互に依存しあった        英謡を 習う       部分が多い。また,係り受けの租類を一意的に決めるこ        →近所の 学校に      とは困難な場合が多いが,その場合はそれぞれの可能な        行って 英語を 習う  種類に対応して幾通りかの標準形文が生成されることに  8.以上の1.〜7.によってできた文の各語に,さら   なる。係り受けの種類の決定および標準形分解に必要な に1.〜7.のようにして修飾,様相添加,意味の変化な   辞書・表には次のものがある。

どを行なう。       1VP辞書:1VP形でのN・(助詞)・Pの可能な組合  一般の文から標準形の文を求めるには,上述の手順と  せを見出しとし・助詞の意味・PN形への転置可能性な は逆に分解していくことを考えればよいわけであるが,   どを示したもの。

そのためには二文節間の係り受けの種類文節内の自立    PP辞書:PP形でのP・(助詞)・Pの可能な組合せ 語・付属齋の区切りとその意味を求める必要がある。二   を見出しとし・その係り受けの種類助詞の意味・挿入 文節間の係り受けの趣類は次の基本形に分けられる。    可能なNなどを示したもの。

 i) 」VP形(連用格関係)       Nα辞書:jVと格助詞を含む助詞の列の可能な組合せ  ii)P1∨形(連体格閲係)       を見出しとし・各助詞の意味などを示したもの。

 iii)PP形(連用様態関係,連用接続関係,連用並   p古辞書:Pと格助詞を含む助詞の列の可能な組合せ       立関係)      を見出しとし,各助詞の意味,挿入可能なNなどを示  iv)1v1Ψ形(体言一体言関係,辿体並立関係)     したもの。

 v)週d。P形(連用副詞鴎係)         α辞書:助詞の可能な組合せの列を見出しとし.各助  vi).4記V形(辿休副詞関係)      詞の意味、列に抑入可能な格助詞などを示したもの。

vii)!i御遅御形(副詞一副詞関係)       」VP形療準形変換表:1V細田P眠rl・削hηm形からN  ()内は係り受けの種類を示す。(文献1)参照)   枯脳PΩ止形形への変換讃。1苫しくは文献2)を参照さ なお,連体詞,接続詞の場合については省略する。     れたい。なお、以下では助詞をロ・ロの組合せからなる

(4)

列をα,助動詞または捕助用言を占,αと占の組合せか     Pに対するNの格=いイ。]●(ノ4σ)北Aピ)

らなる列をβで表わす。また,N,, P」,・4幽,などと表    ロ.βがかβ のとき わす場合,∫は同一文中でのN,P,4,.の文頭からのそ      →1鴫九

れそれの出現順位を示すものとする。       以下はi.A.イ.の処理を行なう。なお,β の各語  つぎに・標準形の表現形式について簡単に説明する。   の意味決定はPP形の処理に準じる。

 単語(活用語はつねに終止形とする)を甜とする。    i.BNαP}祉形の場合 表現1U11晦…f〃p1C4r1)(▲竺)…(A,。 )を形式と呼ぶ(η    イ.αが格助詞σを台むとき

≧1)。ここで()内の表現は省略可能とする。         一・1V。P時止形…αの各語の意味は1㌦辞書から求  A叫は拍∫の捕助情報であり,表現[凡.,=γ]また       める。

は表現H丑山=111HR2町=γ2]…[R斑…ニア国]]で表     ロ.αが格助詞を含まないとき

わされる伽〉ユ)。ここで,R副は 塒の轍柑一勒の    →N。・爆、L形…α辞書から復活可能な格助詞α 規定 軌の様態1…などで表現されるメタ表現であり,      とその挿入位置を求め,αをロ 塒とγの関係を表わす。γは表現([M工(F)であり,       を含むα に変換する。

ルfは意味情報一Fはその形式である。意味情報ル∫ ,ハ4∫   以下,i. B.イ.の処理を行なう。

があって.M」がルf をさらに説明する意味惜報であると    i.CNαPβの場合

き,表現ハイ,[ル『」で表わし,M1,ル占,…,ルfrの意味の     イ。αが格助詞ロを含むとき いずれかであることを示すとき,表現』rh随,…, Mτ      →凡Pβ

で表わす。標準形は以上に述べた形式で表わされる。    以下,1.Aの処理を行なう。

 特に語叫に付属語叫.1(=αまたはめが接続した     ロ.αが格助詞を含まないとき

表現を含む文節があるとき,モれに対応した形式におけ      →1Vピ昨…α辞書力・ら梅助詞ロを復活してα る叫の捕助情報A即を次のように表わす。       をα・に変換し,i. C.イ.によっ   [叫の様相=[ハイ。州If与、(」耐.1)]       て1VαP祉形に変換可能なものを採  たとえば,喰べ・てい・たかっ・た・の形式を次のよ       用する。

うに表わす。      例1・犬 まで吠え られ・た

  食べるr食べる・の様相=1捕助用罰藷左細ている  →犬唱に吠え られ た

     1・ている・の様相=1助動詞[願望]]たい1・た     →犬 が吠える

     い・の様相一酬詞[過去読了]]た]]]   IS献が吠える[ 1版る に対する 犬 の格=

       [主格]が]1 吠える の様相=[助動詞[受  3.2 係り受け関係の標準形分解

       身Ilられる[1 られる」に対する の格  文中で係り受けの関係にある二文節が与えられたと    ⇒

き・これを酬形撒る方法榔る・ @  1謡慧鷲繋三;鷲霊

㌶㌶麓麟麗驚慧嚥する.  [様相一[囎屹完了]脚I

       ii) Plv形係り受けの標準形分解

  5・=M㈲月・㈲    (2) 一般に馴胸場合次のよう畷換する。

等号の右辺を1VP形標準形武と呼ぷ。ただし、ロは格    →Pl錐形N

助詞・記号5 は文を指示するメタ記号である(fを文     →(1V。・)P杜止形…ピは格助詞。 NP辞笹で転置の可 番号と呼ぷことがある)。・㌔は表現      能性とピを求める。

  [Pに対するNの格二[ルf。]ロ(▲つ1       一己(押山Pグ押P形標準形変換表から逆にP直を生成  であり,工 はαの付属語の情報である。標準形式         し・可能な格助詞ロを求める。

に台致しない1VP形は次のような変換を行なう。      以下は1VP形の処理と同様。求められた」VP形拐i準

i.Aw、の場合(ただし。は格助詞)  形鵡・その剛形酬形式の部分標鞠式と呼ぶ・

  イゴ脳のとき        酬形係り受けの標準形を次のよ引碇義する・

    _N。.P。。形_肝形酬形変換表を用いる。  ^咽の規定=∫・」(・4轟・)

 なお,σ≠〆のとき占の補助情報」白を次のように     昂=〈1VP形標準形式〉         (3)

表わす(再 ほ占のモの他の補助情報)。         ただし,ゴはPの番号。また(3)の第一行を特に,

(5)

  ⇒ ぷ=死ぬ[ 死ぬ,の様相=〔助動詞[過去 完       _     、

例a3㌫来る前日   ㌔梁

    一予来るとき の加     綻の格醐・と・のときは押・として形式的に記号S

すなわち・Nを劇する部分酬形式にN始醐 を用いることにする。

合巳まない場合とがある・      例3.4くやしい.と思う 1il)PP形蜘受けの鞠形分解      一.くやしい∫、と思う

る三言が用言に係る蹴次のように分けて卿 ⇒1岳㌢思う[5の規定一己】[格一㈱

A・恥・形P・B・P・・P・C・P・占P・D・P βP・  1∫、_くやしい

iii・AP・綱Pゆ場合      。.。が係鰯または副胴のとき

係蝶け唖類は連用雛縣と連用繊t関孫とに大  。.・P、が連体形のとき

別されるが PP辞書で調べられる。それぞれの標準形    PP辞書で挿入すべきN∫および格助詞ロノとモの位 を次のように定義する・       置を求め,次のように変換する。

PP形馳の酬形         −P榔計・鵠ただし,αは。.。 または

  S∫ニ」P∫[・P∫の様態二3,](、4P」)       ゴ・α.

  5 =P∫(4P♪      (め     標準形は(6)で表わされる。

 ここで,5∫の右辺をPP形様態の主形式とする。     例3・5逃げる・ほか ない

 PP形接続の標準形       →逃げる こと・より・ほか ない

  S渦く5、と5,の櫛撫S・山     15・=ことよりない{ こどの離=∫喘=

  sゴ=p (メpコ       ⇒1  [比較]より[ より の様相={副助詞r 以

  5、−P、(ノ4P∫)     (5)   1外に ]]ほか1】

(5)の第一徽続式蹴第三行の右辺を鞠 胴i當鷲たずね.た

接続の主形式とする。       、       一・見える ∫・か・を たずね・た

例顎慧耀三蹴ご【:_ 已三【㌶:麟《㌶瀦

   件川]      司 rたずねる・の様相二1助助緬過去,完

PN形係り受けの主形式という。      イ.αが格肋詞のとき

 例2・1 敦え・てもらう 英語      PP辞書で形式的名詞1ψCこと・, もの・,・さま・,

     英語[ 英語 の規定=5,]       とき など)を求め次のように変換する。

   ]

     品=莱語を教える[ 数える に対する「英語     →P 通体形」昭P,

     の格=[対象]を]F致える の様相=[補助用    ただし,jv∫はPrを受ける。標準形はPIV形, NP      言[依頼・依頓の可能]]てもらう1       形の標準形に準じて次のように定義する。

 PIV形からNP形への変換の際・jVP形に転置不可の    5」=N∫ロP 口Wの規定=5,1ん(/∫pJ 場合(例2・2)あるいは形式的名詞W♂の挿入が指示     5、=Pr(再ρ       (6)

さ㌶合㌫こと   ㌫鷲形三:する・

   |

    こと[ こと の規定=5

      →行く こと・が よい

   /         /ぷ・一ことがよい[こと の規定一∫描一[対

  5・=縮醗る の樺相=1鋤言司[過去・完  。コP,唖用脚とき

  了1閨         P、が形鏑.形容鯛なら1まPP形鯉の騨形に

iii・BP ロP の場合       分解する。 P,が動詞ならばPぷ培に変換してロ、1の 脚注1)接茜芒情報は柿助f削提子1の一種とみなす。     処理を行なう。

  昂=逃げるエ 逃げる の様相=1助動詞[過去,完      }

          了]]た]

⇒/  了1圃         1、5、一見える

(6)

 二.ロが並立助詞のとき       ⇒   様相=[係助詞[強意]]は]]『限る の様相        PP形接続の標準形に分解する。      !  =1助動詞1打消]1ない]

例a・・見る.とll日く、で.は(大違し・)    冶=言う

   5、,5」[S、と8,の接続=[並立助詞]と]      イ・ユコ P∫が速用形のとき

   ∫,=見る      P が動詞ならば迎体形に変換し・イ・1ユの処理を 例3.8 泣き・は し・ない       イ.1 αに接続助詞が含まれないとき

   一・泣く こと・を・ぱ し・ない         イ.1.1 Pfが辿体形のとき

  r萌=ことをする[ こと の規定=5∫][格=[対    格助詞ロがαに含まれるときはPα辞書から挿入す

⇒{畠一㌧=麟雷べき欝  °

ハ.αが接続詞のとき       以下はiii. B.イの場合と同様に処理する。格助詞 PP形接続の標準形に分解する。       が含まれないときは

例3、9言っ・ても 無駄だ      α辞書より復活すべきσとモの位置を求め,上述の処    島,5∫131と5∫の接続ゴ1接続助詞[逆態[仮定   理を行なう。

     条件】]]ても]       例3・13言う・だけ・と・は 限ら・ない

   5 =言う      r5ゴ=∫と限る[[5の規定=5 ][Sの様相=[副

   5・=鰍だ      」綱醐1醐1[格=㈱と「どの

   ∫

    ∫」=聞く[・聞く・の様相=[格助詞で[・で・の   行なう。P が形容詞・形容動詞ならばPP形様態の標    、  様相=[係助詞]は]工      準形に分解する。

  ホ.ロが終助詞または間投助詞のとき      例3ユ4走り さえ も し゜ない

 終助詞のときは,後に格助詞・と・を伴なうのが普通       →走る こと・さえ・を・も し・ない であるが,省略される場合もあり,PP辞笹で調べて復   例3・ユ5 うるさく・ばかり・は 言わ・ない 活させ,亘L Dの処理を行なう。復活不可能のときは      /呪=言う[r言う の様態=5日1 言う の様相 PP形接続の標準形に分解する。間投助詞のときは,そ      1  =[助動詞[打消】]ない]]

れを除去し蹄に麹して処理する。    ⇒{5,づるさい[・うるさい,の様‡目一[副綱[限

 i辻C P,占P」の場合      、  定】〕ばかり[1ばかり の様相=[係助詞[強  係り受けは辿用様態関係と連用接続関係に大別される         意Hは]]

が,一般に宙P兇からモの判別が可能であり,PP辞書    イ.2αに接続助詞σが含まれるとき

で悶べる。それぞれPP形様態, PP形接続の標準形    P」ロP∫の場合と同様にPP形接続の標準形に分解ず に分解する。      る。

 例3.11飲み・たく 思う       例3・16見る・だけ・ならば構:b・ない

例a ?F註齢連用中止[順態[確定 i禺一:]澗う・の様恥助動詞{打消]]な

   1    条{牛]H]      い]

   i∫,=なぐるrなぐる の様相=[助動詞【受身H    ロ.βニα1砺α2占2…α用□。)のとき

  司 られる」      係吸け唖類は・占.P,・または輪α.P£から求

(7)

められる。前者はiii. c,後者はiii. D.イの場合と同    C,の場合,α=αノ・αとしたときαは格助詞 の 様にして標準形分解する。       たは並立助詞に限られる。それぞれ(7),(8)の標準形  例3.17 美しい・だけ・な・ので あきた       に分解する。

    畠,3」[∫,と5∫の接続=1接続助詞[順態[確    例4・4 明日・まで・の 締切り

   15,一:{1㌶謬1元潔鵬][聞   ⇒is醐・剛日に糊過去,       〔  詞1時間の限界]欝:慧纏副:↑

   [  完了Hた]       例4.5 出発・まで・の 時間  輌v)jvパ形係り受けの標準形分解        1・      →出発する 時間

漂1ま罐ると欄   」二;:㌫㌫{時間一

 Njv形の場合,並立助詞を合む連体並立関係の場合を      /  発 の様相=田1」助詞【時間の限界ほま 除くと,係り受けの有無あるいはその意味の決定は一般      L  で]

に困難であるめで,1Vjv形をそのまま保存して標準形と   v)メ■P形係り受けの標準形分解

する。ただし,1∨」または司が用言を体言化した語で    副詞が用言を副詞修飾するもので・標準形分解の際は あるとき,対応するPに変換してから,モれそれPN   様態関係の一種としてあつかう。

形または押P形の処理を行なうことによって係り受け    ▲11P形の標準形

の有無の判別が可能となる場合もある。いずれにしろ・     5、=P日P、の様態=[λ玩、、1壇、,,(山4、.)](Ap,)

モの結合関係の意味は本格的鱒味処理を待って決定さ            ⑨

れるものとする。      例5.とても 美しい

並立関係以外の標準形(1WJ形規定の標準形)を次の     ⇒ 5、=美しい[・美しい・の様態=[副詞1程脚1と ように定義する回       ても]

N、[N、の規定=N,(の)N、(㌔)](孤1,) (7.D   ・i)A、調形の係り受けの標準形分解  ただし,1V,または」V」をPに変換して処理できると    メむA「形の標準形を次のように定義する。

きはその変担形を用いて次のように定義する。       ・1Vl1Vの様態いf,1㎡,レ1ゴ。(ぷAdr)](≠4、、1)   (10)

  N」[助の規定=∫∧・,]C4N,)      例6.すぐ 上

  ∫町二く1VP形標準形式〉(・4占・,)     (7・2)     ⇒ 上[ の様態=[副詞[程度]]すぐ]

 (7.1)または(7.2)の第一行をその主.形式とする。    vii)・4d1,μ4証・1 形係り受けの漂準形分解 NIV形並立の標準形を次のように定義する。       ん坤由形の標曄形を次のように定義する。

  凡,凡(4,)〈1Vrと1V,の接続情報〉(両r) (8)    迂訓レ∫制の様態=[λ玩口A耐(与訓)江A耐)

A.の場合魂体並立縣およびNが3囎上蹴         (1ユ)

するときを除けばIV」は1V、の直後に限られる。       例7・たいへん ゆっくり

B.の場合。は醐詞・の・または並立助詞に限られ  ⇒ゆっくりrゆっくり の撒一嘔1馴灘】]た

 る。それぞれ,(7)または(8)の標準形に分解する。      いへん]

 例4・1 全員 集合      4.文の標準形分解     一戸全員・が 集合する

   撰合[・始・の規定一5、船l    P・についての麟形文を次のよう吐義する・

  ⇒{∫。,,詮員が飴する[格ヨ主格】が1  5 一幅、…NL・・.P・(A拙・1ハ)ん1…偽・.)A・一㈲

例4.2私.の本      (12)

  ⇒ 本C本・の規定=私の本]      ただし,」Vr角(ノ=1・2・…・η1)はP に係る文節の  例4.3 松・や 杉       体言」V と格助詞α」」である(rη≧0)。

  ⇒ 松,杉[ 松 と の接続=1並立助詞[列挙]1   日本語文を.モの文に含まれる各Pについての標準     や]      形文の集合と,それらの標準形文間の接続式の集合とに

(8)

分解することをその文の標準形分解と定義する。文の  5=犬がN獣え細・ これは解釈規則を用いて

標準形分解は,原理的には与えられた文を係り受け関係   隠されていた箭報をもとの標準形に補足したものである

にある二嫌どうしi工分解して、モれそれの係暖け関 が,こ縫完全酬形と呼ぶ・この胸ように・酬形

係の標準形分解を行ない,求められた形式の集合から逆   分解の結果に対して,さらに種々の解釈規則を適用して

に標準形文の形式を舗すればよい。    完全騨形畷換す訪法を勅ることは・解釈酬の

      整理・形式化とともに次の重要課題である。

 5. む  す  び

 日本語文の文節間の係り受け関係を用いて,文を単文    謝辞 本研究は昭和49年度文部省科学研究費特定研究 的な構造の文と各語の補助情報,および接続冊報とに分   ぷ広域大丑情報の高次処理叩・A品瑳 大型計算機結合

解す訪法について述ぺた。      に関する齪研究一大型計轍結合にお ナるデー剛

 本言盒文の内容は,標準的な日本語文を対象としてお   造∴ およびC−5班 言語構造論の学術惜報処理への応 り,文の標準形分解はこの範困内で可能であるといえ   用 の研究の一端であり,関係各位に感謝する。

る・もちろん自然講は膨大で全髄把握するこ Gは困    文 献

難であり,またつねに例外が存在することも避けりれな

い。いわゆる慣用句的な表現や例外的な表現については    1) 吉田: 二文節間の係り受けを韮礎とした日本語

㌶㌶鞭享㌶ζ鷲次繁二芸  ・)竃議簿擢璽壷驚…霧

ほど→食べるほど)       347(昭47−06).

 また,標準形分解された結果の応用あるいはその解渦    3)・栗原: 自然言語の機械処理(解説) ・情報処理・

:駕鑓㌶麟灘:巖遇議§翼繍:;1㌍

る解釈規則,付属語の意味情報に対する個々の解釈規則    5) 栗原.吉田.曲丸.藤田: 自然言語の機械処理 などが必.要になる。たとえば, 犬・に吠え・られる章に    にっいて一意味的基本構文お上びその形式一 ,・ゴL 対する標準形式 犬が吠える』がメぽるが与えられたと     大工学集報・44・3(昭46−03)・   .  .

…編{蕊1讃鴎:㌶禦ま㍊:蕾貨 6)蕊籔{{曇li濃ぽ蒜當:蒜

る[格=[対劇に] である1Vが存在する。 また.この ことから次の文が生成できる。

参照

関連したドキュメント

この 文書 はコンピューターによって 英語 から 自動的 に 翻訳 されているため、 言語 が 不明瞭 になる 可能性 があります。.. このドキュメントは、 元 のドキュメントに 比 べて

その詳細については各報文に譲るとして、何と言っても最大の成果は、植物質の自然・人工遺

語基の種類、標準語語幹 a語幹 o語幹 u語幹 si語幹 独立語基(基本形,推量形1) ex ・1 ▼▲ ・1 ▽△

目標を、子どもと教師のオリエンテーションでいくつかの文節に分け」、学習課題としている。例

しかし,物質報酬群と言語報酬群に分けてみると,言語報酬群については,言語報酬を与

7.自助グループ

lessをつけて書きかえられるが( をつけると不自然になる( 〃ss certain... 英譲の劣勢比較構文について

行列の標準形に関する研究は、既に多数発表されているが、行列の標準形と標準形への変 換行列の構成的算法に関しては、 Jordan