例 5

1Vti λ拗

nδ11噌■ ︻一

．066

一 3． ooe

．555 ．423

一． 199

一2． 155

異なる

一王11一一

付録組

三二：共に適当なものがない。 ∴ 0

以上の結果に立ってgを計算し，嗣じ語と認めるか否かを決める。それは前のべ・一一ジの表にまとめて示した。

2・3この判溺函数の効率

この判別函数式（＊＊）の係数を定めるには，後述の手順で選んだ単位語の鰐のうち，書きことば研究室の所員蓋名が同じ語か異なる語かを事前に判定して，一致した結果を得た約四百五十対からランダムに抜いた二百対をデータにしている。そこでこの二百対につき，gの億によ

る決定と所員旧名の一致した事前判定との合う率をもって，式（＊＊）の効率すなわち戒功率と見なせば，同じ語の群に対して92パセソト．異なる語の群に対して96パセソト，全体では94パ・

セントであった。このデータでの判別結果を下の図で承そう。zの纏は0から左右0．5刻み．

にまとめた。中心線の反対側に飛び出しているのが，事前判定と合わなかった対である。

この決定法は，専門家の学術的な勘を一往客観化したものと言える。同じ語か否かの判定に．影響する因干はもちろんここで使った四規準における六つの因子だけではない。しかしこの方法でも，成功率は94パセソトにのぼった。かつその作り方からしてラ初めから全：

く直観なり勘なりによるよ

孚耀別函峯文（＊＊）1：よる決定．

毒鹸判定■ va tr 9弩の対鯉異なる認の対［ユ

1 梱 i︐ 1墨i ﹁一 ●1 肝

亀姑の数

一6−5一鼻一一一3−2一董O123窪き56

！

りも客観的であって，妥当異なる語と判定される頒域唖i噸痢じ語と判定kれる顯壕性の点でも劣らない。ただしこの判別函数式（＊＊）の三三に当っては，なお注意すべき事があ．

るQすなわち

i 単位語a，b， cから作った三つの対（a， b），（b． c），（a， c）において 1） g（a，b）〉／O， z（b，の；＞0でありながらg（a，c）＜O，

2） z（a，b）く0， z（b，c）＜0でありながらz（a，の♪0

にならないとは限らない。この場合1こはa、b， cにどういう兇出し語を与えるかQ ただし2（α，b）は対（a． b）について計算したgの値を意味する。他も同様。こういう場合の実例をあげると，a 「判をオス」， b「念をオス」， o「舟のろをオス」のくオシ．ス〉について g（a，b）瓢十2．381， g（b，c）＝÷2．182 に反し g（a，c）＝一1． 818

が得られた。ここで後述liiの事情も考えに入れなくてはならないけれども，そういう事がなかったにしろ，上掲のような結果が出ることはあり得る。これはこの方式1こ圃有のまずい点である。それを除くには，差し当り別の判別方式が実用化に耐える状態にないから，それを更に一ユ12一

付釧H

処鷺する方法を定めるべきである。今剛は次の馨り扱った。見出し語形を等しくする〔つまり同音異義の疑いのある〕もう一つの単位語dを追加して，g（a，d）， g（b，d）g（o，4）が1）の場舎，共に負でなければ，a〜dを岡じ見鐵し語に属せしめる，すなわち同じ語と見なす。そ

うでなければこれらのzの織を勘案して，なるべく無理がないように二つ以上の見出し語にそれぞれを分類する一ここで再び主観的判定が加わるが，現状ではやむを得ない。また2）に対しても同様な方針で臨む。

圭i データとした二百対が必ずしも現代刷本語彙からのランダム標本とは言い切れないから，式（＊＊）のみの値には三斜りがあるかも知れない。

iii各規準での判定は語の異同の総合的判定よりも客観的かつ容易に行えるはずであるが，なお判定者による測定誤差一与える点数の不一致があり得る。

iv 各規準での点数を：金くアプリオリに決めたが，このように属性的なもので，しかも正負二方向を取る場合には，0の位置の定め方にも問題があろう。

ivについてはoptimumな点数化の方法を考えてみたが，今のところ良い案が得られていな

い。そうした，方式の根本までli慨す浮と，

V この課題解決のための判別緻数式として、：果して線型式でよいか。

これらの問題点があっても，実際に成功率94パセソトをあげたのだから，この見分け方が語彙調査の実施上訴融こなると需ってさしつかえない。

3 判別函数を作るまでの経過

見出し語の識別が陶題になりそうなものを辞鶉：から呪い，色々なケースが出そろう事に注意して，：：二十の形をまず選んだ。その意味を分類して，轡形ごとに分類された三目を表にして記述した。その項機の，形を同じくするものうち，どれとどれとが岡じ語または異う語と認められるかを，所員脚下が独立に判定した。五聖が一致して岡じまたは異なると判定した「意味の対」のうち，隅じ語の群，異なる語の群それぞれからランダムに百対ずつを抜いた。なお，五名が共にでたらめな判定を下したとして，しかも判定結果が一致する危険率はO．03強でtきわめて小さい。従って五名が一一致した対についての結論はかなり確かなものと見られる。

一方，半捌に使う半語的性質を考えてみた。初めには次の十一規準をあげ，各規準ごと；こ積極的に「しかり」と認められる場合1点，そうでない場合0点を与える方法で点数化した。

規準！（語源）違う出自か。または時代をさかのぼれば形に違いが出るか。〔ただし省略形の復元によって形が区別されるものを除外する。〕

規準2（省略形）省略しない形くずれない形が違うか。

規準3（変遷）意味の変遷の経路がたどれるかQ ・規準4（触れ会い）指されるものに内容上のつながりがあるか。

規準5（同系弾語）同じカテゴリーに属し一つの意味系列ななす語が排反するか。

規準6（伴う謡）等しい格で相伴い得る語の概念のカテtfリーに違いがあるか。

一 11，g 一一

付録思

規準7（承接形式）他の語を受けまたは他の語に続く時の型に違いがあるか。、〔活用の型の違いも含む。〕

規準8（文法職能）隅じ文法職能をもつか。

規準9（派生形）作り得る派生形で，対のそれぞれの意味と対応するものに違いがあるか。

規準10（アクセント）アクセントの型に違いがあるか。

規準11（漢字）その意味を表わす漢字が〔少くとも一つは〕同じかQ

これらのうち規準3．4，8，1！は，その対を合わせる方1こ，他は分ける方に積極酌に働くものと雪える。さて試験的に，所員の一名の事前半掟の結果作った岡じ語の群と異なる語の群とを，この規準で点数化し，規準ごとに各鮮の平均億を求め，群の平均値に有意差があるか否かを検定した◎規準6乏8とは有意差が認められず，従って半捌力の弱い規準と考えられた。そ

こ℃これらを除く九規準を使って判別函数を試作したところ，その効率は87パセント程度で，

まだ思わしい結果ではなかった。事前判定と一致しなかった対また規準そのものに更に検討を撫えたところ，規準に十分明確でないもののある事，ごく限られた対にしか適用出来ない規準もある事、λ蛋の値が◎に近くて余り役立ちそうもないとか，分けるカをもつはずなのにみが正になるとかした規準もある事，更に，合わぜる規準と分ける規準との数がつり合っていない事など，不鮪な点に気づいた。

こうした検討を繰り返して規準を次第に改めた結果，最後に立てられたものが，先に述べた四規準である。これに照らして，所員五名の判定が一致した対から選んで置いた二百対を，点数化した。何点を与えるかに凝問のある場合は，合議によって決めた。これをデータにして式（＊＊）を定めた訳である。

4 付記

既に述べて来た通り，判別函数式（a at）はわれわれの屠的に対して相当に効率がよい。従って調査の遂行のためには，この式についてこれ以上述べる所はないが，それとは別に言語酌性質の面からいささかの分析を試みて置こう。

われわれはいわゆる同音異義か否かの決定に，先の2・It 1 こあげた四規準一言語上の牲質の四つの面を使った。さてこれらの闘の桐関関係はどうであろうか。それぞれに与えられた点数によって，まず〔単〕相関係数を鐵すと，

右の表の通りとなった。規準iと規準ブと

の間の網関係数物の絶対値が大きければ，

この二つの醤語的性質は縁が深いと書える。

たとえば，規準1（触れ合い）と規準灘（漢字）との相関係数は0．543で，他より絶対値が大きい。この結果はわれわれの直観と含致

規準1 藝雌鐸

規準1

．543

．316

．355 1

旺

．543

． 156

．232 1

澱

．316

． 156

．136 1

．355

．232

．136

一114一

付録避

する。しかしよく考えると，i煽が大きいだけでは，規準i，ブの問に直接深い関係があるとは謡い切れない。もし別に規準海があって，（i， fe），（i，勧には直接の関係があり， iとゴとはfeを介してだけ関係する時，1γ副，レ掴が大きければ晒メも大きくなることがある。この場合にはんの影響を取り除いて砿ブ）の相関を考えなければならず，そういう目安になるものに偏相閣係数がある。そこで今の場合もこれを算出してみよう。〔ただし各規準で取り得る範臨は相当限られており，また回帰は必ずしも線型ではなかろうから，偏橿関係数の値の解釈は，ある程度大まかにならざるを得ないが。〕ここに説号rii． telは，規準々と1との影響を取り除いた（t 」）の桐関の係数である◎計算の結果次の値が得られた。

ri2． 34 ＝＝ O． 495

ri3． 24 ＝．262 ・r23．i4 ＝T一一〇． 046

ri4． 23＝：．257 r2 3＝．045 r34．i2 ＝e・ 028

これで見ると，規準1だけは他の三規準のどれとも，かなり閣係が深い。この事は規準1の内容からして当然であろう。次に1以外の三規準相互の聞の関係は余り深くないと考えられる。

規準H（漢字）と鑑（アクセント）との間では偏相関係数が負の値となったが，絶対値が小さくて，これらに逆相関を認めるほどの事はない。ともかくこの三規準は言語露勺性質の，かなり違った繭を扱っていると言える。

このように見て来ると，語彙調査とは離れるが，以上述べた方法を利用し，もっと多くの言語的性質な使って更に徹底した調査を行えば，どんな言語的性質の聞には深い関係があり，どの性質とどの性質とは縁が薄いかというような事，また同謡意識の形成に窃与する言語的性質：

として，どれは強くどれは弱いかというような事が，次第に明らかになって行くであろう。，

立ち返ってわれわれの用途に予てるための判別規準として，この四つで一一往よいか，また不適当なものがなかったかを，最後に一欝しよう。試みに更に語の承接形式。派生語形の異同という規準，語史的観点に立つ規準を追加して，新たな判別函数を作ってみたが，成功率は式

（綜）よりもかえって低かった。この事だけから断定は出来ないが，よほどうまい規準を加えないと効率はさして高まるまい。また四規準中では，規準1の内容が他の規準よりも主観的色彩の強いものである。かつ他の三規準との相関も劉合に高いので，これを省いたらどうなるか，

つまり規準1は他の三規準である程度代絹出来るのではないか。それを見るため規準1と池の三規準との間の重根関係数を求めたところ，0．581であった。従って規準H，癒、Wが規準1 の代役をする割合は，約三分の同程度と見積られ，規準1をむだだとして捨てることは轟来な

い。

意味の研究は今臼までのところ，客観酌には行い難いとされて来た。しかしたとえぽここに扱ったような方法を発展させれば，幾分かずつでも客観化出来るのではあるまいか。また客観的操作が出来なけれぽ，すなわち同じ語か否かを主観だけによって決めるのでは，語彙調査の基礎はくずれてしまうのである。

rm^{@iC15，一}

ドキュメント内現代語の語彙調査 : 総合雑誌の用語　後編 (ページ 118-123)

nδ11噌■ ︻ 一