1Vti λ拗
nδ11噌■ ︻ 一
.066
一 3. ooe
.555 .423
一. 199
一2. 155
異なる
一王11一一
付録組
三二:共に適当なものがない。 ∴ 0
以上の結果に立ってgを計算し,嗣じ語と認めるか否かを決める。それは前のべ・一一ジの表に まとめて示した。
2・3この判溺函数の効率
この判別函数式(**)の係数を定めるには,後述の手順で選んだ単位語の鰐のうち,書きこ とば研究室の所員蓋名が同じ語か異なる語かを事前に判定して,一致した結果を得た約四百五 十対からランダムに抜いた二百対をデータにしている。そこでこの二百対につき,gの億によ
る決定と所員旧名の一致した事前判定との合う率をもって,式(**)の効率すなわち戒功率と 見なせば,同じ語の群に対して92パセソト.異なる語の群に対して96パセソト,全体では94パ・
セントであった。このデータでの判別結果を下の図で承そう。zの纏は0から左右0.5刻み.
にまとめた。中心線の反対側に飛び出しているのが,事前判定と合わなかった対である。
この決定法は,専門家の 学術的な勘を一往客観化し たものと言える。同じ語か 否かの判定に.影響する因干 はもちろんここで使った四 規準における六つの因子だ けではない。しかしこの方 法でも,成功率は94パセソ トにのぼった。かつその作 り方からしてラ初めから全:
く直観なり勘なりによるよ
孚耀別函峯文(**)1:よる決定.
毒鹸判定■ va tr 9弩の対鯉 異なる認の対[ユ
1 梱 i︐ 1墨i ﹁一 ●1 肝
亀姑の数
一6−5一鼻一一一3−2一董O123窪き56
!
りも客観的であって,妥当 異なる語と判定される頒域唖i噸痢じ語と判定kれる顯壕 性の点でも劣らない。ただしこの判別函数式(**)の三三に当っては,なお注意すべき事があ.
るQすなわち
i 単位語a,b, cから作った三つの対(a, b),(b. c),(a, c)において 1) g(a,b)〉/O, z(b,の;>0でありながらg(a,c)<O,
2) z(a,b)く0, z(b,c)<0でありながらz(a,の♪0
にならないとは限らない。この場合1こはa、b, cにどういう兇出し語を与えるかQ ただし2(α,b)は対(a. b)について計算したgの値を意味する。他も同様。こういう場合の 実例をあげると,a 「判をオス」, b「念をオス」, o「舟のろをオス」のくオシ.ス〉について g(a,b)瓢十2.381, g(b,c)=÷2.182 に反し g(a,c)=一1. 818
が得られた。ここで後述liiの事情も考えに入れなくてはならないけれども,そういう事がな かったにしろ,上掲のような結果が出ることはあり得る。これはこの方式1こ圃有のまずい点で ある。それを除くには,差し当り別の判別方式が実用化に耐える状態にないから,それを更に 一ユ12一
付釧H
処鷺する方法を定めるべきである。今剛は次の馨り扱った。見出し語形を等しくする〔つまり 同音異義の疑いのある〕もう一つの単位語dを追加して,g(a,d), g(b,d)g(o,4)が1)の 場舎,共に負でなければ,a〜dを岡じ見鐵し語に属せしめる,すなわち同じ語と見なす。そ
うでなければこれらのzの織を勘案して,なるべく無理がないように二つ以上の見出し語にそ れぞれを分類する一ここで再び主観的判定が加わるが,現状ではやむを得ない。また2)に 対しても同様な方針で臨む。
圭i データとした二百対が必ずしも現代刷本語彙からのランダム標本とは言い切れない から,式(**)のみの値には三斜りがあるかも知れない。
iii各規準での判定は語の異同の総合的判定よりも客観的かつ容易に行えるはずである が,なお判定者による測定誤差一与える点数の不一致があり得る。
iv 各規準での点数を:金くアプリオリに決めたが,このように属性的なもので,しかも 正負二方向を取る場合には,0の位置の定め方にも問題があろう。
ivについてはoptimumな点数化の方法を考えてみたが,今のところ良い案が得られていな
い。そうした,方式の根本までli慨す浮と,V この課題解決のための判別緻数式として、:果して線型式でよいか。
これらの問題点があっても,実際に成功率94パセソトをあげたのだから,この見分け方が語 彙調査の実施上訴融こなると需ってさしつかえない。
3 判別函数を作るまでの経過
見出し語の識別が陶題になりそうなものを辞鶉:から呪い,色々なケースが出そろう事に注意 して,::二十の形をまず選んだ。その意味を分類して,轡形ごとに分類された三目を表にして記 述した。その項機の,形を同じくするものうち,どれとどれとが岡じ語または異う語と認めら れるかを,所員脚下が独立に判定した。五聖が一致して岡じまたは異なると判定した「意味の 対」のうち,隅じ語の群,異なる語の群それぞれからランダムに百対ずつを抜いた。なお,五 名が共にでたらめな判定を下したとして,しかも判定結果が一致する危険率はO.03強でtき わめて小さい。従って五名が一一致した対についての結論はかなり確かなものと見られる。
一方,半捌に使う半語的性質を考えてみた。初めには次の十一規準をあげ,各規準ごと;こ積 極的に「しかり」と認められる場合1点,そうでない場合0点を与える方法で点数化した。
規準!(語源) 違う出自か。または時代をさかのぼれば形に違いが出るか。〔ただし省 略形の復元によって形が区別されるものを除外する。〕
規準2(省略形) 省略しない形くずれない形が違うか。
規準3(変遷) 意味の変遷の経路がたどれるかQ ・ 規準4(触れ会い) 指されるものに内容上のつながりがあるか。
規準5(同系弾語) 同じカテゴリーに属し一つの意味系列ななす語が排反するか。
規準6(伴う謡) 等しい格で相伴い得る語の概念のカテtfリーに違いがあるか。
一 11,g 一一
付録思
規準7(承接形式) 他の語を受けまたは他の語に続く時の型に違いがあるか。、〔活用の 型の違いも含む。〕
規準8(文法職能) 隅じ文法職能をもつか。
規準9(派生形) 作り得る派生形で,対のそれぞれの意味と対応するものに違いがある か。
規準10(アクセント) アクセントの型に違いがあるか。
規準11(漢字) その意味を表わす漢字が〔少くとも一つは〕同じかQ
これらのうち規準3.4,8,1!は,その対を合わせる方1こ,他は分ける方に積極酌に働くも のと雪える。さて試験的に,所員の一名の事前半掟の結果作った岡じ語の群と異なる語の群と を,この規準で点数化し,規準ごとに各鮮の平均億を求め,群の平均値に有意差があるか否か を検定した◎規準6乏8とは有意差が認められず,従って半捌力の弱い規準と考えられた。そ
こ℃これらを除く九規準を使って判別函数を試作したところ,その効率は87パセント程度で,
まだ思わしい結果ではなかった。事前判定と一致しなかった対また規準そのものに更に検討を 撫えたところ,規準に十分明確でないもののある事,ごく限られた対にしか適用出来ない規準 もある事、λ蛋の値が◎に近くて余り役立ちそうもないとか,分けるカをもつはずなのにみが 正になるとかした規準もある事,更に,合わぜる規準と分ける規準との数がつり合っていない 事など,不鮪な点に気づいた。
こうした検討を繰り返して規準を次第に改めた結果,最後に立てられたものが,先に述べた 四規準である。これに照らして,所員五名の判定が一致した対から選んで置いた二百対を,点 数化した。何点を与えるかに凝問のある場合は,合議によって決めた。これをデータにして 式(**)を定めた訳である。
4 付 記
既に述べて来た通り,判別函数式(a at)はわれわれの屠的に対して相当に効率がよい。従っ て調査の遂行のためには,この式についてこれ以上述べる所はないが,それとは別に言語酌性 質の面からいささかの分析を試みて置こう。
われわれはいわゆる同音異義か否かの決定に,先の2・It 1 こあげた四規準一言語上の牲質 の四つの面を使った。さてこれらの闘の桐関関係はどうであろうか。それぞれに与えられた点 数によって,まず〔単〕相関係数を鐵すと,
右の表の通りとなった。規準iと規準ブと
の間の網関係数物の絶対値が大きければ,この二つの醤語的性質は縁が深いと書える。
たとえば,規準1(触れ合い)と規準灘(漢 字)との相関係数は0.543で,他より絶対値 が大きい。この結果はわれわれの直観と含致
規準1 藝 雌 鐸
規準1
1
.543
.316
.355 1
旺
.543
. 156
.232 1
澱
.316
. 156
.136 1
rv
.355
.232
.136
一114一
付録避
する。しかしよく考えると,i煽が大きいだけでは,規準i,ブの問に直接深い関係があると は謡い切れない。もし別に規準海があって,(i, fe),(i,勧には直接の関係があり, iとゴと はfeを介してだけ関係する時,1γ副,レ掴が大きければ晒メも大きくなることがある。こ の場合にはんの影響を取り除いて砿ブ)の相関を考えなければならず,そういう目安になるも のに偏相閣係数がある。そこで今の場合もこれを算出してみよう。〔ただし各規準で取り得る 範臨は相当限られており,また回帰は必ずしも線型ではなかろうから,偏橿関係数の値の解釈 は,ある程度大まかにならざるを得ないが。〕ここに説号rii. telは,規準々と1との影響を 取り除いた(t 」)の桐関の係数である◎計算の結果次の値が得られた。
ri2. 34 == O. 495
ri3. 24 = .262 ・r23.i4 =T一 一〇. 046
ri4. 23=: .257 r2 3= .045 r34.i2 =e・ 028
これで見ると,規準1だけは他の三規準のどれとも,かなり閣係が深い。この事は規準1の内 容からして当然であろう。次に1以外の三規準相互の聞の関係は余り深くないと考えられる。
規準H(漢字)と鑑(アクセント)との間では偏相関係数が負の値となったが,絶対値が小さ くて,これらに逆相関を認めるほどの事はない。ともかくこの三規準は言語露勺性質の,かなり 違った繭を扱っていると言える。
このように見て来ると,語彙調査とは離れるが,以上述べた方法を利用し,もっと多くの言 語的性質な使って更に徹底した調査を行えば,どんな言語的性質の聞には深い関係があり,ど の性質とどの性質とは縁が薄いかというような事,また同謡意識の形成に窃与する言語的性質:
として,どれは強くどれは弱いかというような事が,次第に明らかになって行くであろう。,
立ち返ってわれわれの用途に予てるための判別規準として,この四つで一一往よいか,また不 適当なものがなかったかを,最後に一欝しよう。試みに更に語の承接形式。派生語形の異同と いう規準,語史的観点に立つ規準を追加して,新たな判別函数を作ってみたが,成功率は式
(綜)よりもかえって低かった。この事だけから断定は出来ないが,よほどうまい規準を加え ないと効率はさして高まるまい。また四規準中では,規準1の内容が他の規準よりも主観的色 彩の強いものである。かつ他の三規準との相関も劉合に高いので,これを省いたらどうなるか,
つまり規準1は他の三規準である程度代絹出来るのではないか。それを見るため規準1と池の 三規準との間の重根関係数を求めたところ,0.581であった。従って規準H,癒、Wが規準1 の代役をする割合は,約三分の同程度と見積られ,規準1をむだだとして捨てることは轟来な
い。
意味の研究は今臼までのところ,客観酌には行い難いとされて来た。しかしたとえぽここに 扱ったような方法を発展させれば,幾分かずつでも客観化出来るのではあるまいか。また客観 的操作が出来なけれぽ,すなわち同じ語か否かを主観だけによって決めるのでは,語彙調査の 基礎はくずれてしまうのである。
rm@iC15, 一