• 検索結果がありません。

日本語の自然対話音声におけるパラ言語的特徴に関 する研究

N/A
N/A
Protected

Academic year: 2021

シェア "日本語の自然対話音声におけるパラ言語的特徴に関 する研究"

Copied!
5
0
0

読み込み中.... (全文を見る)

全文

(1)

日本語の自然対話音声におけるパラ言語的特徴に関 する研究

著者 小林 聡

雑誌名 静岡大学大学院電子科学研究科研究報告

23

ページ 85‑88

発行年 2002‑03‑29

出版者 静岡大学大学院電子科学研究科

URL http://hdl.handle.net/10297/1451

(2)

氏名 。(本

  

     

(山梨県

)

学 位 の種 類

  

  

  (工

 

)

学 位 記 番 号

  

工博甲第

  209  

学位授与の日付

  

平成 12年 7月 31日 学位授与の要件

  

学位規則第4条第 1項 該当 研究科導攻の名称

  

電子科学研究科

 

電子応用工学

学位論文題目

   

日本語の自然対話音声におけるパラ言語的特徴に関する研

論 文 審 査 委 員   (委員長)

教 授

 

 

 

太計志

  

教 授

 

 

 

 

助教授

 

中 井 孝 芳

教 授

 

 

 

清三郎

音声言語における超分節的特徴 としては、韻律 とパラ言語情報が考えられる。韻律は音韻論におけ る概念であ り、韻律 を表現するビッチや強さなどの変化個所やその変化のしかたにより、意味的な弁 別を表現する、言語情報である。そのため、表現においても、またそれが現わす内容においても中間 状態は存在 しない。それに対 してパラ言語 情報は、話者の肉体的・精神的状態を表現するもので、表 現 においてもそれが現わす内容 において も中間状態が存在する。 このように、韻律 とパラ言語情報 は、 ともに超分節的情報ではあるが、表現方法、伝える情報 ともに異なっていると考えられる。だ が、韻律 は言語 情報であることから、その表現する内容が明確であるのに対 し、話者の肉体的・精神 的状態 を示すパラ言語情報は具体的にどのような情報がどのように表現 されるのかが明確ではない。

そのため、対象 となるパ ラ言語情報を先験的に選定 しての調査ではなく、音響的にどのような変化 によって、そこにパラ言語情報が含まれていると人間力群U断するのかという段階か ら調査 を行なう必 要が有る。今回パ ラ言語情報について、肉体的状態 よりも話者の精神的状態 を示す情報がより発話内 容 に関連する情報 として重要であると考え、実験の対象 とした。 しか し、パ ラ言語情報が存在すると いう判断が聴 き手間で安定 してなされないならば、パラ言語情報を研究の対象 とすることは困難にな る。そこで、本研究は、パラ言語情報に関する研究の初期段階として、被験者間でパラ言語情報が存 在するという判断をどの程度一致するかの調査 を主な目的 とする。

そのため、音声試料 も新たにパ ラ言語 を含むような自由対話 を収録 し、その一部を使用 した。

(3)

次いで、本研究ではパ ラ言語が存在すると判断 した箇所 をラベル付けによって示すが、予備実験 と して、パ ラ言語の存在箇所にラベル付けを行なう際の、環境や トレーニングという条件 について、適 切なものを選ぶための実験 を行なった。

その後 に、新たに収録 した自然な対話の一部を対象に、特に声の高 さ、大 きさ、発話速度の変化お よび強調 について3名の被験者がラベル付 けを行なった。そのラベルに基づ き、最初 に被験者間にお いてそれらのラベル付けの判断が一致する程度を調査 した。次に、ラベルが書かれた個所における音 響的変化の大 きさを調査 した。また、パ ラ言語情報 として特 に強調 と判断される個所での変化の大 き

さの調査 を行 なった。最後 に、パ ラ言語情報 とい う判断に対する音韻内容の影響の有無の調査 を行 なった。

被験者間におけるラベルの一致の程度は、声の高さ、大 きさ、発話速度 とも、ほぼ犯%程度のラベ ルにおいて2名以上が一致 していた。それに対 して、10%程度のラベルは被験者間において矛盾する 内容 となっていた。残 りの50%程度は、ある被験者は何 らかのラベルを書いたものの、ある被験者は 何 もラベルを書かなかった。また、強調 と判断されたことを示すラベルの場合、犯

.5%程

度の個所 に おいて複数の被験者の判断が一致 していた。いずれの場合 もほぼ半数は、ラベルを書 くか書かないか の判断に差が有ることが分かる。逆 に、判断が矛盾する割合は、少数であることが分かる。このこと か ら、被験者間でのラベルの差異は主 に、各被験者の判断の差異によるもの と考えられる。

しか し、 ここで見 られる一致率は決つして高い ものではない。そこで、このようなラベルについ て、他の被験者の判断に対する同意の程度の調査 も行なった。その結果、ラベルを書 くか書かないか の違いの場合であれば、その70%前後程度には互いに同意 していた。 このため根本的には各被験者 と も類似の判定基準でパ ラ言語の存在 を判定 していたものと考えられる。それに対 し、矛盾するラベル の場合では、10%台半ばから和%台半ばと、同意する割合が低 くなっている。これは、パラ言語情報 が含 まれていると判断する際において、注目する音響的な特徴などの理解が被験者によって異なって いる可能性 を示唆 している。

次 に、ラベルが付 けられた点での変化の大 きさを計測 した。 この際、評価 は20*log(ラベル前の値

/ラベル後の値)とい う式で評価 を行なった。特 に、声の高 さの場合では窓幅は350msec.、大 きさで 500msec.、発話速度では400msec。で、その窓内での

Fo、 rms、

モーラ/秒の平均値 により、 ラベル 前後の値 を求めた結果が、最 も良い結果 となった。この評価方法により、声が高 さ、大 きさ、発話速 度の変化 についてラベルが付けられた個所での変化の大 きさの傾向が得 られた。また、付与 されたラ ベルのおよそ80%が、実際の音響的変化 と一致 していた。変化が大 きいほど、ラベルが付けられる割 合、そのラベルが実際の変化 に則 している割合 ともに高 くなる傾向が見 られた。ただ し、分布 を見る と、ラベル付 けされない個所が多 く、ラベルが付けられた箇所 と付けられなかった箇所で明確な差異 は見 られなかった。強調 に関 しては、強調の開始点で声は高 く、大 きくな り、また終了点においては 声は低 く、小 さくなる傾向が見 られた。 しか し、発話速度については、強調の開始点 と終了点におい て明確 な差異は見 られなかった。

最後 に音韻の影響については、音声資料から、母音/a,i,u,e,0/の1つの音のみを使 って合成 した音

(4)

声を使用 し、調査 を行なった。この際、FOお よびmsは保存 しての合成 となっている。被験者は、聞 きやすい合成音 を選び、作業を行なった。 この結果、付けられたラベル数においては、原音声 と合成 音声 とでは強調 を除 き、明確な差異は見 られなかった。またラベルが付けられた個所での変化の大 き

さについては、声の大 きさでは明かに、原音声に対する場合 よりも小 さな変化でラベル付けされる傾 向が見 られた。 しか し、ラベルの正解率については、声の高さ、大 きさ発話速度 ともに明確な差異は 見 られなかった。 これらの結果か ら、音韻的内容はパ ラ言語情報が含 まれているとい う判断におい て、 ラベルを付 ける位置の選択 に影響 を与えていると考えられる。

論文題 日の欧文名はStuゥof Paralinguisdc Features in NamrJ Japenese Dialogue Speech」 である。

(5)

文 審 査 結 の 要

約半世紀にわたって進められてきた音声言語処理の研究成果 と近年のパーソナルコンピュータの性 能向上 とにより、音声言語処理は身近なもの となっている。音声によるPC操作や文章の作成、文書 の読み上げなどの処理が一般的にな りつつある。これらの処理対象は音声によって伝達 される言語情 報である。 しか し、音声は書 き言葉(文字言語)と しての情報のみを伝達するわけではない。文字言語 外の音声情報をパラ言語 と呼んでいるが、音声対話での重要な情報伝達である。コミュニケーション とは言葉や情報 を伝 えることではな く思いを伝えることであると言われるわけである。本研究はパ ラ 言語 を音声情報処理す ることを試みた ものである。

本論文では、パラ言語的特徴を韻律的特徴 とは区別 した音声伝達情報 として定義 し、パラ言語情報 の伝達の信頼性 を実験的に評価 している。まず、韻律的特徴はアクセントやイン トネーションや強調 などの言語情報 を担 うもの、パラ言語的特徴は性別や出身などの静的情報 と共に意図・状況・精神状 態などの動的情報を伝達するものと定義 した上で、パラ言語的特徴の動的側面を規定する声の高 さ、

大 きさ速 さの3属性の変化に着日し、3人の自由会話の中から抽出 した発話 について3名の被験者(ラ ラ)が聴取 によってラベルを付 ける実験 を行 った。ラベラ間の一致の程度によってパ ラ言語的特徴の 安定性 を評価 した。ラベルの %程度が複数のラベラ間で一致 した。また、対応する個所 にラベルを 付 さなかったラベラは、他 ラベラがその個所 に付 したラベルの70%程度に同意 した。 しか し、10%程 度あったラベラ間で相互に矛盾 したラベルはほとんどが合意 されなかった。これらの実験結果によっ

てパラ言語の判断基準は個人差があるが、概ね共有化 し得ることを示 した。また、パ ラ言語的特徴 を 認めた箇所のうち、韻律 との区別が困難な箇所は少ないことから、パラ言語的特徴 と韻律的特徴 とは 独立 した知覚対象であることを示 した。さらに、ラベラ間の一致の程度を声の高 さ、大 きさ、速 さそ れぞれの変化 を示す ラベルに関 して比較すると、ラベルの信頼性は声の大 きさで最 も良 く、声の高 さ で最 も悪いことを示 した。最後に、ラベル付けの結果 と音響パラメータ(変化量)間に相関が見 られる ことを述べた。

以上のように、本研究はパ ラ言語の特徴抽出に関 して、聴覚印象の安定性の評価 と音響的特徴 との 相関を実測 した先駆的研究であ り、関連する基礎的検討 は将来のパラ言語を含む音声認識・合成の開 発 に大いに参考 になる点が含 まれている。 よって博士の学位の取得 に十分なものであると認める。

参照

関連したドキュメント

VoIP を用いる電話システムの原理的な構成は、端末とネットワークから構成される。図 3.1 に 示す様に、電話の音声信号をゲートウェイにより

 日本語教育現場における音声教育が困難な原因は、いつ、何を、どのように指

 さて,日本語として定着しつつある「ポスト真実」の原語は,英語の 'post- truth' である。この語が英語で市民権を得ることになったのは,2016年

 福沢が一つの価値物を絶対化させないのは、イギリス経験論的な思考によって いるからだ (7) 。たとえばイギリス人たちの自由観を見ると、そこにあるのは liber-

フランツ・カフカ(FranzKafka)の作品の会話には「お見通し」発言

このように,先行研究において日・中両母語話

この 文書 はコンピューターによって 英語 から 自動的 に 翻訳 されているため、 言語 が 不明瞭 になる 可能性 があります。.. このドキュメントは、 元 のドキュメントに 比 べて

 TV会議やハンズフリー電話においては、音声のスピーカからマイク