• 検索結果がありません。

多言語版「チュウ太のweb辞書」を用いた語彙学習

N/A
N/A
Protected

Academic year: 2021

シェア "多言語版「チュウ太のweb辞書」を用いた語彙学習"

Copied!
61
0
0

読み込み中.... (全文を見る)

全文

(1)

IT時代に対応した日本語教師の役割

-自律学習に役立つ支援とは何か-

東京国際大学 川村よし子

(2)

1.はじめに 2.読解支援ツールの概要と課題 2.1 読解学習支援システムの概要と課題 2.2 学習者が利用しているツールの概要と留意点 3. IT時代の日本語教師の役割

IT時代に対応した日本語教師の役割

(3)

☆日本語学習者の学習目的が多様化したばかりでなく、 日本語の学び方も大きく変化してきている。

☆読解や語彙学習に紙の辞書は使われていない。

Webサイト: 『Jisho』『Google Translate』など50種 アプリ: 『Imiwa?』『TAKOBOTO』など90種 ☆アニメ・ドラマ・ゲーム・マンガで学ぶ学習者も多い。 ☆日本語教師にはどんな役割が期待されているのか。

はじめに

(4)

1998年 Web上にある膨大な量の日本語情報 日本語教育や自律学習の教材として活用可能 a. 読解学習支援システム『リーディング・チュウ太』 b. 辞書ツールの多言語化:『チュウ太のWeb辞書』 c. 共生社会への対応: 『チュウ太のやさしくなーれ』

共通している自然言語処理技術:

形態素解析

2.読解支援ツールの概要と課題

2.1 読解学習支援システムの概要と課題

(5)

読みたい文章を入力すれば、本文中の全ての単語の 辞書引きやレベル判定が自動で行える ◎辞書ツール 入力された文章⇒形態素解析Chasen⇒辞書と照合 結果画面:本文中の単語と辞書情報がリンク 学習履歴:「あなたの単語リスト」を自動生成 ◎レベル判定ツール 入力された文章⇒形態素解析Chasen⇒単語リストと照合 結果画面:本文中の単語や漢字の難易度レベルを表示

『リーディング・チュウ太』

(6)
(7)
(8)
(9)
(10)
(11)
(12)
(13)
(14)

「形態素解析」を活用する際の工夫と留意点

・読みが複数ある場合 ⇒Chasenの読み情報をすべて出すことで対応 ・意味が複数ある場合 ⇒辞書情報をすべて出すことで対応 (辞書ツールは翻訳ツールではない) ・形態素解析の誤解析(解析精度は98.5%) ⇒Chasenが解析に用いている形態素辞書に依存

(15)

・形態素解析の誤解析(解析精度は98.5%) Chasenが解析に用いている形態素辞書に依存 例1:語彙的複合動詞は1語扱い (押し出す・取り乱す・気が付く etc.) ⇒辞書に当該語がなければ、表示不能 ⇒レベル分けリストになければ「級外」 例2:「締約国会議」⇒「締約+国会+議」 ⇒単語ごとの重みづけを変更して対応 例3:「行った」⇒「行う+た」 ⇒プログラムで前接助詞とセットにして対応 平仮名の「べた書き」は苦手 ⇒利用の際は、できるだけ漢字かな交じり文を入力

(16)

∗ 多言語版の辞書ツール 読みたい文章を入力すれば、本文中の全ての 単語の辞書引きが自動で行える仕組み ∗ 文章⇒形態素解析MeCab⇒辞書と照合 ∗ 本文中の単語と辞書情報がリンク ∗ 「あなたの単語リスト」作成 (復習が可能) ∗ 意味ごとの例文を表示 ∗ 複数言語版の辞書を同時表示可能 ∗ ふりがな機能も搭載

『チュウ太のWeb辞書』

(17)

対訳辞書編集チーム 25言語 (編集完了語数順) ロシア語 英語 スロヴェニア語 ハンガリー語 ベトナム語 トルコ語 ブルガリア語 中国語 韓国語 タイ語 ポルトガル語 スペイン語 チェコ語 ドイツ語 キルギス語 マレー語 マラティ語 スロヴァキア語 ルーマニア語 フランス語 イタリア語 フィンランド語 インドネシア語 タガログ語 アラビア語 (2018年4月25日現在)

「チュウ太の

Web辞書」の

多言語辞書編集チーム

(18)

対訳辞書編集チーム 25言語 (編集完了語数順) ロシア語 英語 スロヴェニア語 ハンガリー語 ベトナム語 トルコ語 ブルガリア語 中国語 韓国語 タイ語 ポルトガル語 スペイン語 チェコ語 ドイツ語 キルギス語 マレー語 マラティ語 スロヴァキア語 ルーマニア語 フランス語 イタリア語 フィンランド語 インドネシア語 タガログ語 アラビア語 (2018年4月25日現在)

「チュウ太の

Web辞書」の

多言語辞書編集チーム

(19)

☆ニーズ:簡易版でもいいので早く欲しい ・1語1訳の形のミニ辞書を作成 ・旧 『日本語能力試験出題基準』の語彙:8,600語 ・ミニ辞書が完成した言語 インドネシア語・タガログ語・英語・スペイン語・タイ語 中国語(簡体字・繁体字)・韓国語・クロアチア語 ・ミニ辞書編集中の言語 ルーマニア語・フィンランド語・アルメニア語

ミニ辞書も搭載

(20)
(21)
(22)
(23)
(24)

MeCab」を活用する際の工夫と留意点

・ 意味が複数ある場合 ⇒辞書情報をすべて出すことで対応 ・ 読みが複数ある場合 ⇒辞書情報に複数の読みを併記することで対応 ・ 形態素解析の誤解析 解析精度を上げるための工夫 ⇒MeCab辞書に単語を追加できる仕組みを搭載 例: 単語: うがい・ペットボトル・人件費 複合語: 好奇心・一方的・かっこ悪い 専門用語: 清拭・解毒剤・認知症 但し、ひらがなのべた書きは極めて低い解析精度 。

(25)

MeCab」を活用する際の工夫と留意点

・ 意味が複数ある場合 ⇒辞書情報をすべて出すことで対応 ・ 読みが複数ある場合 ⇒辞書情報に複数の読みを併記することで対応 ・ 形態素解析の誤解析 解析精度を上げるための工夫 ⇒MeCab辞書に単語を追加できる仕組みを搭載 例: 単語: うがい・ペットボトル・人件費 複合語: 好奇心・一方的・かっこ悪い 専門用語: 清拭・解毒剤・認知症 但し、ひらがなのべた書きは極めて低い解析精度 にっぽんでは、さかなをなまのままたべるさしみやすしなどはにんきのあるりょうりです。

(26)

Mecabの

(27)

MeCab」を活用する際の工夫と留意点

・ 意味が複数ある場合 ⇒辞書情報をすべて出すことで対応 ・ 読みが複数ある場合 ⇒辞書情報に複数の読みを併記することで対応 ・ 形態素解析の誤解析 解析精度を上げるための工夫 ⇒MeCab辞書に単語を追加できる仕組みを搭載 例: 単語: うがい・ペットボトル・人件費 複合語: 好奇心・一方的・かっこ悪い 専門用語: 清拭・解毒剤・認知症 ひらがなのべた書きは極めて低い解析精度 通常の書き方の(漢字かな交じり)文を入力する

(28)

入力文中の難しい単語を自動でやさしく書き換える ∗ 文章⇒形態素解析MeCab⇒書き換え辞書と照合 ∗ やさしい単語への書き換え (活用の変化に対応) ∗ 元の文と書き換えた文を併記(ふりがな付き) ∗ 説明的になる語 ∗ 名詞+名詞の複合語 バルーンで表示 ∗ 多義語

『チュウ太のやさしくなーれ』

(29)

やさしくなーれの結果画面

(30)

文脈にあわせた多義語の書き換え

例:「サ変動詞+名詞」の書き換え <動詞の時制の決定> 例: 調査結果 ⇒ 調べた結果 選考方法⇒ 選ぶやり方 入居者⇒ 入っている人 <コーパスを活用した対応> 1.「書き換え候補の動詞の3種類の活用+名詞」を検索 2. コーパスに、その組み合わせがあれば書き換え 3. 2種類以上ある時には、多いほうで書き換え

<問題点> バルーン表示の語が多くなる

(31)

日本語ウェブコーパス 2010 (矢田晋 2010) 2010 年 6 月から 9 月にかけて収集した約 1 億件のウェブページ から作成したコーパス http://s-yata.jp/corpus/nwc2010/ngrams/ 例: 「技術」という単語の使われ方を検索した結果 「日本 技術 総業 の 菊池 政美 」という文字列が 9940件もヒット

コーパス利用(作成)の際の留意点

(32)

∗ たまたま技術という単語でNグラム検索したら、 ∗ 日本 技術 総業 の 菊池 政美 と ∗ という文字列が9940件もヒットしていて、 ∗ 個人への誹謗中傷が異常に繰り返されていた様子。 Web上の情報収集で起きる問題の一例 http://mizusato.at.webry.info/200801/article_22.html

(33)

・同一文の複数コピーが含まれる可能性 一部改変の場合、同一文の排除ではチェック不能 ⇒ 適切な対応が不可欠 ・誤った使い方をしている文が含まれる可能性 自動翻訳の結果等の混在への配慮 ・偏った領域の表現が含まれる可能性 収集源の吟味 (⇔ Webコーパスの危険性) ⇒ 現在、日本語教育に適したコーパスを模索中 ⇒ AIを活用した書き換えの可能性も模索中

<コーパス活用の際の問題点>

(34)

<言語教育分野でAIを活用する際の留意点> 日本語教育に活用するには… ・模範的な日本語を提示できること ・誤りを極力減らすこと 読解支援システムに活用するには… ・辞書(単語・コロケーション・文型etc.) ・コーパス(日本語として違和感のない文の集合体) ・形態素解析(誤解析を減らす改良ができる仕組み)

チュウ太のこれから

AI活用の可能性と留意点

(35)

2.2 学習者が利用しているツールの概要と留意点

学習者が日本語の文章を読む際に利用するツール ⇒多種多様 ⇒使い方も様々 代表的なツールの概要と留意点 例1: 『Jisho』 例2: 『Google Translate』

(36)

辞書情報以外にも多様な情報にアクセス可能 日英・英日の辞書情報 + 例文情報 + 漢字や部首に関する情報

『Jisho』

(37)

辞書情報以外にも多様な情報にアクセス可能 日英・英日の辞書情報 + 例文情報 + 漢字や部首に関する情報

『jisho』

(38)
(39)
(40)
(41)
(42)
(43)

Jisho』利用上の留意点

(44)

∗ 『Jisho』は便利なツールだが、ネット上の情報を集めて作られている。 ⇒ 誤りも含まれることを理解したうえで利用する必要がある。

(45)
(46)
(47)
(48)
(49)

∗ 毎日新聞には、覚せい剤取締法違反の罪で、2010年から2年半鎌松刑務所(岐阜 県笠松町)を務めていた30代の女性が応募した。 ∗ 妊娠した女性は、それを提供している間に行き先の病院で出産したが、彼は手錠 を置いた労働(饅頭)のテーブルに上った。 ∗ 「出産は手錠のために思い出に残る体験になった」と彼は語った。 ∗ 2002年12月のCircularにおいて、法務省は出生時に手錠を取り除く統一政策を開 始したが、それまでは多くの受刑者や妊娠中の女性が手錠を払わなければならな かった。 ⇒ 自動翻訳には、まだまだこうした問題があることを 学習者が理解したうえで、利用する必要がある

(50)

学びの支援

・発音 ・カタカナ ・漢字 ・文法 ・言葉の使い方

学び方の支援

・自律学習を促す方法

3.IT時代の日本語教師の役割

(51)

<教え方のヒント> 日本語のクセとして教える sa si su se so ⇒ sa su se so shi ta ti tu te to ⇒ ta te to chi tsu ☆ Web上に『OJAD』のようなサイトが公開されてはいるが、 学習者ひとりでは習得しにくいものである ⇒ 教室あるいは個別での指導が必要

発音

(52)

∗ <教え方のヒント>カタカナ語の特徴をルール化して教える 1. 日本語の音節:(子音)+母音+(N) ・必ず母音で終わる(例外は「N」) ・N以外では、子音を二つつなげられない ルール1:子音で終わる場合や子音の連続時にはuを入れる 例: dog ⇒ do gu desk ⇒ de su ku 2. 日本語では、t と dの後ろにuを入れた音は、存在しない。 ルール2: t と dの後ろには、oを入れる 例: street ⇒ s u to ri: to ☆外国語からカタカナ語を作ってみるクラス活動も有効

カタカナ

(53)

∗ <教え方のヒント 1> ∗ 音と訓が各々複数ある場合、ペアにできることが多い 例1: 省 ショウ セイ はぶく かえりみる (省略・省力) (反省・内省) 例2: 作 サク サ つくる ?(する) (作文・作品) (作業・動作) ☆読み方と意味の関係性に留意できるようになる

漢字

(54)

∗ <教え方のヒント 2> ∗ 漢字熟語がどう作られているかを教える 例: 入 入学 入院 入場 (動作の対象や場所が後ろに来る) 輸入 潜入 搬入 (動作がどう行われるかを前に来る語が示す) ☆基本ルールを知ることで漢字の意味の類推が可能になる

漢字

what / where how

(55)

∗ <教え方のヒント> ∗ 韓国語と文の構造が類似しているため、さほど難しくない ∗ 但し、助詞の使い方の微妙な違いには注意が必要である 例: 終助詞の「よ」 学生「昨日先生の研究室に行ったんですよ。」 教師「・ ・ ・ 。」 「よ」は、自らの主張を示す⇒強い自己主張に聞こえる <解決策> 「よ」+「ね」(同意を求める) ⇒「よね」 ☆終助詞の選択は、人間関係にも影響するので要注意 ☆文法は韓国語と日本語双方に堪能な方々の知見が重要

文法

(56)

∗ <教え方のヒント> ∗ ことばの使い方については、授業で触れる必要がある ∗ 特に使い方がむずかしいもの 授受動詞 ・あげる くれる もらう の3種類がある あげる もらう くれる ・しかも、3種類それぞれに尊敬語や謙譲語もある

ことばの使い方

(57)

∗ <授受動詞の使い方> 他者からの恩恵行為について補助動詞として使う 例:携帯を探していたら、友達が見つけた。 ⇒携帯を探していたら、友達が見つけてくれた。 自分から相手への恩恵行為には「あげる」は使わない 例:駅まで送ってあげます。(送って差しあげます。) ⇒駅までお送りします。 自分の行為を恩恵をうけたように表現することまである 例:司会をつとめさせていただきます。 ☆日本語環境にいても気づきにくいため、教える必要がある

ことばの使い方

あたかも表現

(58)

∗ <自律学習を促すためのヒント> ∗ 教師自らも様々なツールを実際に試して使ってみる ∗ 読解支援ツールを紹介する ∗ 活用方法に関する助言も行う 例: 辞書情報 『チュウ太のWeb辞書』や『Jisho』 + 学習アプリ 『Memrise』や『Anki』 ☆教師自らが情報収集、さらに情報交換 ☆学習者を巻き込んだ情報共有の仕組み作り ☆学習者相互に情報交換できる機会の提供

学び方の支援

(59)

学びの支援者 (=ファシリテーター)

◎効率よく学ぶためのヒント

・発音 ・カタカナ ・漢字 ・文法

◎よりよいコミュニケーションのためのヒント

・ことばの使い方

学び方の支援者 (=仲介役)

◎自律学習を促すためのヒント

・教材やツールの紹介と使い方の情報提供

・学習者同士の情報交換の場の提供

おわりに

IT時代の日本語教師の役割

(60)

∗ 『Anki』https://apps.ankiweb.net/

∗ 『Google Translate』 http://translate.google.com/

∗ 『Imiwa?』http://www.imiwaapp.com/ ∗ 『Jisho』http://jisho.org/ ∗ 『TAKOBOTO』 http://takoboto.jp/ ∗ 『Tatoeba』https://tatoeba.org/eng/ ∗ 『TOFUGU』https://www.tofugu.com/ ∗ 『Memrise』https://www.memrise.com/ ∗ 『OJAD』http://www.gavo.t.u-tokyo.ac.jp/ojad/

ご清聴ありがとうございました。

《参考

URL》

(61)

NINJAL-LWP for BCCWJ

参照

関連したドキュメント

明治33年8月,小学校令が改正され,それま で,国語科関係では,読書,作文,習字の三教

本稿では,まず第 2 節で,崔 (2019a) で設けられていた初中級レベルへの 制限を外し,延べ 154 個の述語を対象に「接辞

日本語で書かれた解説がほとんどないので , 専門用 語の訳出を独自に試みた ( たとえば variety を「多様クラス」と訳したり , subdirect

自発的な文の生成の場合には、何らかの方法で numeration formation が 行われて、Lexicon の中の語彙から numeration

とされている︒ところで︑医師法二 0

自然言語というのは、生得 な文法 があるということです。 生まれつき に、人 に わっている 力を って乳幼児が獲得できる言語だという え です。 語の それ自 も、 から