• 検索結果がありません。

中国語音声教材作成のための音声データベースの構築と検索システム: 沖縄地域学リポジトリ

N/A
N/A
Protected

Academic year: 2021

シェア "中国語音声教材作成のための音声データベースの構築と検索システム: 沖縄地域学リポジトリ"

Copied!
9
0
0

読み込み中.... (全文を見る)

全文

(1)

Title

中国語音声教材作成のための音声データベースの構築と

検索システム

Author(s)

渡邉, ゆきこ

Citation

沖縄大学人文学部紀要 = Journal of the Faculty of

Humanities and Social Sciences(17): 105-112

Issue Date

2015-03-03

URL

http://hdl.handle.net/20.500.12001/19067

(2)

〈実践報告〉

中国語音声教材作成のための音声データベースの構築と検索システム

渡邉 ゆきこ

キーワード:中国語  音声  教材  データベース  検索 1 はじめに  初学者に対する中国語の発音教育は通常1カ月間前後という長い時間を使って音韻構造の説 明や「声調」、「韻母」、「声母」などの解説を行った上で、会話や構文に関する学習へと進む。 確かに1音節の声調の聞き取りに限って言えば、ほとんどの学生が正確に聞き分けることがで きるようになる。これは日本語が中国語と同じトーン言語であり、文節と音節という単位は異 なるものの、語音の高さの違いで意味の弁別を行っていることがある程度関係しているのでは ないかと思われるⅰ。しかし文章となるとほとんど読めないというのが現状である。特に正確に 声調を発音することが難しく、授業で教師が読み上げる音を追いかけるのが精々であり、結局 学習者は確信のない曖昧な状態に置かれたまま、学習を進めているといのが現状ではないだろ うか。  要するに問題は2音節以上の語音の発音である。ここには3つの問題が存在すると考える。  1つは2音節の単語の音韻的な説明の不足である。音声学的な先行研究によれば、2音節に なると四声は後に続く音節の声調によって変化しⅱ、あるいは発話者の音程によって弁別が難し くなりⅲ、時には文音調によっても変化することなど、その音韻的に多種多様な変化を起こし ている。このような研究成果が一般教養課程向けの教科書に反映されていることはまずない。 2つ目は2音節以上の単語やフレーズの聞き取りあるいは発音練習の決定的な不足である。一 般に第二外国語と位置づけられ、教育機関によっては週わずか1コマ(90 分)という授業時間 の中で、十分な練習時間を取ることは不可能に等しいと言えるだろう。3つ目には、田邉 2004ⅴ が指摘するように、「導入」教育と「基礎」教育を混同し、「導入」を終えたことで「基礎」教 育は終わったとする考え方である。実のところ最初の 1 カ月は「導入教育」であり、その後も 折に触れて発音の学習を継続的に繰り返す「基礎教育」を行うことで初めてコミュニケーショ ンに支障がないレベルの発音の習得が可能になるのではないだろうか。そもそも、中国語の単 語の絶対多数が2音節であることを考えると、単音の学習を終えた段階で「発音の学習を終了 した」と認識すること自体が問題ではないかと筆者は考える。  では、いかにして不足した学習時間を補い、学習者が自ら継続的に発音学習を進めていくこ とができるようにするにはどうすればいいのか。ここで考えられるのが、ITC(Information and Communication Technology)を活用である。実際近年発売されている中国語教科書の中 には内容に準拠した Web サイトを持ち、クリックするだけでテキストや単語の音声が聞ける上、 簡単な練習問題も備えた教材も出版されているⅵ。また、学習用ソフトも単に出版物をデジタル

(3)

沖縄大学人文学部紀要 第 17 号 2015 に変えたというだけのものばかりでなく、例えば声調学習に特化して学習者が発音した音声の 音程を視覚化し独習を助けるスマートフォンやタブレット端末に対応するアプリⅶなど、インタ ラクティブなものも出てきている。しかし、実際のところ、大学等の教育機関の多くは独自に 編集した教科書を使用しており、内容に準拠したサイトや Web 教材を併せ持つものは少なく、 音声教材として学習者に提供されているのも付録の CD というのが大方の現状である。  このような状況の中で、教員が ITC を駆使して使用教科書に準拠した発音学習のために Web 対応の補助教材を作成するには、まず学習用のサイトを立ち上げて教材を準備し、教員自身が ネイティブでなければネイティブスピーカーに依頼して録音を行い、音声ファイルを編集して 学習サイトにアップし、練習問題用のテンプレート等に貼り付けるという相当量の作業が必要 となる。更に成績の自動集計などにより学習者一人ひとりの学習進捗度を随時把握することが できる機能を備え、必要に応じて学生にアドバイスをするこができれば、学習効果を上げると ともに学習者のモチベーションの維持にも積極的な意味を持つとも思われるが、語学教員であ る文系の教員にこのような技術を求めることはまず不可能だと言わざるをえない。  そこで、中国語の教員でも手軽に音声を使った教材を作成できるようにするべく、筆者は 中国語の音声データベースを備え、音韻的特徴により自在に検索ができ、音声をテストなど の 教 材 に 貼 り 付 け る シ ス テ ム を LMS 「WebOCMnext」(図 1 参照)上に構築した。 本稿はこの「音声データベース」とその 検索システムの構築について報告するも のである。  尚、本研究は日本学術振興会の平成 26 年度科学研究費助成事業基盤研究(C)「中 国語発音教育のための音声データベース の構築」によるものである。 2,音声データベースと検索システム 2.1「マルチメディア中国語学習辞典」の構築  本稿で述べる「音声データベース」については、まず筆者が 2011 年に大阪大学サイバー メ デ ィ ア セ ン タ ー・ マ ル チ メ デ ィ ア 言 語 教 育 研 究 部 門 が 開 発 し た 学 習 支 援 シ ス テ ム(LMS:Learning Management System) 「Web4u」上に構築した「マルチメディア中 国語学習辞典(以下「学習辞典」と称す)に 遡らなければならない。「Web4u」とは、現 在稼働している「WebOCMnext」の前の世 代のシステムで、「WebOCMnext」はその機 能とコンテンツを継承し、更に機能を増強し たものである。現在、日本国内の教育機関や それに準ずる機関に対しては無償で公開され ている。 図1 WebCOMnext のログイン画面

(4)

 この「学習辞典」の見出し語総数は 4,823 項目で、中国語検定準4級から3級レベルの頻出 単語をカバーする内容である。語彙を初級学習者が学習の際に頻用する単語に限定しているた め「学習辞典」と称する所以である。4,823 項目の中には、他にも47 都道府県名や沖縄の市町 村名、沖縄よくある名字 300 と日本によくある名字 200 等が収録されており、初級の学習課程 で必ず行われる自己紹介の際、学習者が自分の名字や地名を中国語でどう発音するのか簡単に 検索できるよう配慮している。  見出し語は簡体字で記載されており、辞書の検索も簡体字のみに対応しているが、辞書画面 には繁体字も併記されており、他に見出し語の音声、ピンイン、使用頻度、関連数画像、語義、 名詞の場合は量詞、例文、例文の日本語訳、例文の音声、類義語、反対語が収録されている。(図 2を参照)。また、沖縄の人名や地名は読み方が分かり難いため、この項目に限っては日本語の「よ みがな」を付し、地名には Google Map とリンクするアイコンを設けて、クリックすれば位置 を確認できるようにもなっている。語義の記述と品詞は白水社の『中国語辞典』ⅷを参考にしてお り、使用頻度も本書の分類に則り4段階で表示している。画像は主に筆者が中国、台湾、香港 などで撮影したものとネット上の著作権フリーの画像を使用しており、クリックで拡大表示す ることができる。類義語や反対語はすべての単語に付されているわけではないが、表示のある ものは当該類義語等のページにリンクしており、クリックすると当該語彙のページが別ウィン ドウで表示されるようになっている。  見出し語と例文の音声は4人のネイティブスピーカーによるもので、華北地方出身の 30 代女 性2人、華北地方出身の 20 代女性 1 人、上海出身の 20 代男性1人に録音を依頼した。いずれ も語学教育の経験者あるいは語学を専攻する大学院生と大学生で、筆者が面談して標準的な発 音が可能だと判断した人物である。録音はより実用性を持たせるため、比較的ゆっくりしたノー マルスピードで行うよう指示した。 2.2 音声データベースの検索システム  今回作成した「音声データベース」は、上記の「学習辞典」に収録された見出し語の音声を 一種のデータベースとして捉え直し、音韻的特徴による絞り込みによって検索し、テストなど の教材に再利用するシステムである。  検索の方法はピンインの入力ではなく、検索した単語の「音節数」、「声母」、「韻母」、「声調」 をドロップダウンリストの中から選ぶという形で行う。これはピンインが特殊文字であり入力 がそれほど手軽に行えないことから、採用した検索形式である。また、それぞれの検索項目は 独立したものであり、例えば、「ja」という音は中国語に存在しないが、声母「j」を選択した場合、 韻母では「a」を選択できないというようなシステム設定にはなっていない。 2.2.1 検索項目「音節数」  検索する際は、まず検索したい語の音節数を選択する。初期設定は「1」であり、検索画面 は1行だけ表示されているが、音節数で「2」以上を選ぶとその下に同じ形式の検索画面が表 示される。(図3を参照)。  

(5)

沖縄大学人文学部紀要 第 17 号 2015  「音節数」の選択項目は「1」、「2」、「3」、「more」の4つで、検索画面の表示は2段までとした。 画面の煩雑化を避けたというデザイン的な要因もあるが、収録されている単語のほとんどが2 音節であり、収録単語数もそれほど多くないことから、最初の2音節を特定できれば目的の単 語の検索は容易にできると考えたからである。実際使用を開始しているが、特に問題は感じて はいない。 2.2.2 検索項目「声母」  声母の初期設定は「…」(なし)で、声 母を持つ全ての音節を検索する「all」、調 音点ごとにまとめて検索ができる「bpmf」、 「dtnl」、「gkh」、「jqx」、「zhchshr」、「zcs」 とそれぞれの声母をピンポイント個別に指 定して検索する3つの検索方法が可能であ る。(図4を参照)  調音点ごとの検索項目は教科書によく記 載されている声母一覧を簡素化したもの で、有気音と無気音の対比など通常調音点ごとに行う練習問題の作成をより容易にしようとい う配慮である。 2.2.3 検索項目「韻母」  韻母の存在しない音節はないことから、 検索項目の「韻母」の初期設定は「all」と した。  ドロップダウンメニューを開くと、左側 に「a」、「o」、「e」、「i」、「u」、「ü」、「er」 の7韻母が縦に表示され、それぞれの右側 にその母音で始まる韻母が列挙されてい る。  左側の単母音をクリック選択すると、その右側に列挙されているすべての韻母を持つ単語が 検索対象となる。  「y」と「w」は項目にないが、声母を「…」(なし)にして「i」を選択すれば「y」を「u」 を選択すれば「w」が検索できる。「yu」も同様に「ü」で検索可能である。 2.2.4 検索項目「声調」  検索項目「声調」の初期設定も「all」である。ドロップダウンメニューは、「第1声」、「第2声」、 「第3声」、「第4声」、「軽声」の5つで、2音節目の検索画面も同じ設定になっている。前述し たように、それぞれの項目は独立しており、選択項目を初期設定以外に設定するかどうかもす べて使用者の自由であるので、第1音節の検索項目を「第1声」とし第2音音節の検索項目を 初期設定のままの「all」とすることも可能で、結果的に第1声で始まる2音節以上の単語がす 図4検索項目「声母」のドロップダウンリスト 図5検索項目「韻母」のドロップダウンリスト

(6)

べて検索結果に表示されることになる。 3,「音声辞書」の構築とその検索機能  以上の音声検索システムは、すでに述べたように中国語検定3級レベルまでの初学者を対象 として作られた辞書の語音を転用したものであり、初学者が学習すべき語彙数としてはある程 度の需要は満たしていると思われる。しかし、ほとんどが2音節の単語であるため単音節の語 音にはほとんど対応していないとい一面がある。初学者向けの教材を作る上で単音節の習得は まず不可欠の学習項目であり、教材やテストを作る上でも欠かせない要素である。  また「導入教育」を終えた後の「基礎教育」の段階では、音声とピンインが一致しない、あ るいはピンインを正確に読めないという問題を解決する必要がある。現在ネット上には中国語 の音節表は複数あり、クリックして音声を聞くこともできるが大きな表から目的のピンインを 探し出すのには手間がかかる。そこで「学習辞典」の機能を拡張し、ピンインをテキストボッ クスに入力することで音声を検索することがシステムを新たに構築した。これを「音声辞書」 と称している。 3.1 「音声辞書」  「音声辞書」には音節表に記載されている中国語に存在するすべ ての音節 1,159 音節を収録した。  インターフェースは既存の学習辞典と同じもので、英数文字が 入力されることで自動的に「学習辞書」から「音声辞書」に切り 替わる。音節表に表記されている全声調の音声 1,159 音節を収録 している。  検索はテキストボックスにピンインを入力して行うが、前述の ようにピンインは特殊文字であるため、簡易的に「ピンインのア ルファベット+声調番号」という方式でも検索できるようにして いる。これを「簡易ピンイン」としょうしているが、「wáng」で あれば「wang2」と入力すれば検索が可能となる。  検索結果は正式なピンインと簡易ピンインで表記され、使用頻 度の高い文字が上位 10 個まで簡体字と繁体字併記の形で表示さ れる。これはより多くの同音異字に触れることによって、その語 音が持つイメージを感じてもらうためである。繁体字と併記した のは、繁体字を学ぶ際の備えとするためであり、繁体字の音声辞書としての役割もある程度は 果たすことを目指している。  音声は男声と女声の2種で収録しており、アイコンでいずれかを選ぶことができる。男子学 習者から教材の音声が女声であることが多く音程が高いため模倣が難しいという意見があった が、男声を収録したのはこの要望に応えたものである。 3.2 「音声辞書」のデータベース化  次に行ったのは、この「音声辞書」に収録されたすべての音声データをデータベースとして 活用できるよう、「WebOMCnext」の教材作成システム「ダイナミック教材作成システム」に 図6 wang2 の検索画像

(7)

沖縄大学人文学部紀要 第 17 号 2015 組み込む作業である。  音声を教材に貼り付けるための検索は、「ダイナミック教材作成システム」で作成するテスト やテキストなどの教材のテキスト入力システムである「RTEditor(リッチテキストエディター)」 画面にある辞書検索アイコンから行う。  アイコンをクリックすると初期設定では「学習辞典」の検索画面となり、簡体字を入力する ことによって目的の単語の語音を検索でき、headword に表示されている単語をクリックする ことで貼付けることができる。(図7を参照)  「音声辞書」の音声ファイルを検索するには、まず画面右手にある「Pinyin」の文字をクリッ クしてピンインによる検索に切り替える。検索はピンインもしくは前述の「簡易ピンイン」い ずれでも行うことができ、検索結果が表示された後、右端の「挿入」の項目で男声・女声いず れかのアイコンをクリックすると教材に貼り付ける。 4 音声を使った教材の作成の手順  「WebOCMnext」では「ダイナミック教材作成システム」を使い音声を使用したテストと教 材を作成することができる。音声を貼り付ける手順は以下の通りである。  ① 画面左側のツールバーから「ダイナミック教材作成システム」を起動させ、テストを作 成したい場合はメニューの中から「テスト」を、テキストを作成する場合は「ホームペー ジ」を選択する。(図9参照)  ② 「テスト」にはサブメニューとしてあらかじめ「練習問題」、「小テスト」、「テスト」、「期 末テスト」などが設定されており、作成したいテスト種別を選択し新規ファイルを作成 する。作成したいテスト種別がない場合は新たに作成する。教材を作成した場合は「ホー ムページ」を選択し、サブメニューの「Reading」、「Listening」、「Grammar」、「Others」

図7 音声検索画面

(8)

の中からテストの種類を選び新規 ファイルを作成する。尚、いずれの 種別でも音声の貼付けは可能であ る。  ③ テキスト等を入力するにはまず各 ノードに鉛筆のアイコンで示され ている「RTEditor」をクリックし て起動させる。  ④ 「RTEditor」上には Word に準ずる 機能バーが表示され、その中から辞 書の形の音声検索アイコンをクリックし、検索画面を呼び出す。  ⑤ 単語の音韻検索をする場合は    「音韻検索を有効にする」にチェックを入れて(図9を参照、矢印で示しているチェック ボックス)、前述のように必要な検索事項の選択を行い、検索結果の単語をクリックする ことによって貼付ける。  ⑥ ピンインで単音を検索する場合は前述のように「Pinyin」をクリックして、ピンインも しくは「簡易ピンイン」で検索し、右端の「挿入」の女声もしくは男声アイコンをクリッ クして貼り付ける。 5 音声を使ったテストと教材の作成例 5.1 「2音節の声調聞き取りテスト」  学習歴約半年の学習者がどの程度2音節の単語 のそれぞれの声調を聞き取ることができるかを測 るためのアチーブメントテストで、2,014 年 11 月に実施したものである。(図 10 を参照) 全 30 問で第2音節が軽声のものを除く 16 通り の組み合わせの内、第3声と第3声の組み合わ  せを除外した 15 通りの組み合わせを2回ずつラ ンダムに出題している。  すでに学習済みの単語は声調を覚えている可能 性があるため、学習者が記憶に頼らず音声の聞き分けだけで声調を判断するよう配慮し、音声 は沖縄によくある名字を使用している。  音声を聞く回数は設定できるが、今回は初期設定の3回までとした。試験時間は5分間に設 定し、時間になると強制提出され、学習者自身もすぐに採点結果を確認することができる。  受験回数も正解を何回目の受験で提示するかも設定が可能だが、今回はアチーブメントテス トを終えた後も引き続き練習することができるよう受験回数制限を設けず、正解は2回目以降 に表示されることとした。つまり、学習進捗度を測るテストという機能ばかりでなく、学習者 が自己弱点を克服するため継続して使用が可能な練習問題としての役割を持たせることを意図 している。 図9 音声データベース検索への切り替え 図 10 2音節の声調聞き取りアチーブメントテスト

(9)

沖縄大学人文学部紀要 第 17 号 2015 5.2 「声調復習教材」  この教材は1人1人発音のテストを行い、それぞれの弱点について指摘した後、その対策と して使用することを目的に作成した教材である。学生の声調に関する弱点をパターン化し、ペー ジごとにその問題点の解説を行っている。(図 11 を参照)  これは「音程を広げよう」と いう第1声と第3声の音程の幅 を広げることの重要性を説いた ページの後半部分である。左側 に は 模 範 と な る 語 音 を 列 挙 し、 学習者はこれを聞いて発音練習 を行い音程に関するイメージを 養うことができるよう意図して いる。ここで使用されている音 声も「学習辞書」から音韻検索 で「第1音節が第1声で、第2音節が第3声」と指定して検索した音声であり、検索結果に一 覧で表示されるため、学生がより発音しやすい組み合わせを選んで貼り付けることが可能であ る。また声調の音程は個人の音程によって変わる相対的なものであることを認識させるため、 女声と男声の両方を添付している。 ―――――――――――――――――――――――――――――――――――――――――――――――― i 野田雄史(2011)「入門期の中国語教育における発音習得の三つの要点-声調・韻母・声母について-」, 中国文学論集,40,pp.176-166 ii 劉松・浦野義頼・比企静雄(2010)「中国語四声弁別を自習するための CAI システム」,日本教育工学会 論 文誌,34(3),pp.223-233 ii 同上 iv 朱春躍(2010)『中国語・日本語音声の実験的研究』,くろしお出版,東京 v 田邉鉄(2004)「中国語教育におけるコンピューター教材デザインに関する考察-導入期の声調自律学習 教材の開発-」,言語文化,7,pp.49-64 vi 大石智良・凌志偉・曽士才・千野明日香・鈴木靖(2010)『ポイント学習中国語初級(改訂版)』,東方書 店,東京 vii 中国語声調トレーニングアプリ「見える四声・中国語声調マスター」,高電社,大阪 viii 伊地知善継(2008)『白水社 中国語辞典』,白水社,東京 図 11 音声を使った教材例

参照

関連したドキュメント

C =>/ 法において式 %3;( のように閾値を設定し て原音付加を行ない,雑音抑圧音声を聞いてみたところ あまり音質の改善がなかった.図 ;

6 Scene segmentation results by automatic speech recognition (Comparison of ICA and TF-IDF). 認できた. TF-IDF を用いて DP

文献資料リポジトリとの連携および横断検索の 実現である.複数の機関に分散している多様な

音節の外側に解放されることがない】)。ところがこ

心臓核医学に心機能に関する標準はすべての機能検査の基礎となる重要な観

 TV会議やハンズフリー電話においては、音声のスピーカからマイク

 日本語教育現場における音声教育が困難な原因は、いつ、何を、どのように指

チツヂヅに共通する音声条件は,いずれも狭母音の前であることである。だからと