15
旧ソ連製の日本語教科書
Учебник японского языка に関する
テキストマイニングを用いた定量分析 1
佐野 晃
要 旨
本研究では、ロシアにおいて日本語教材の模範とされてきたゴロブニン著作の教科書
Учебник японского языкаに対して、テキストマイニングによる定量的な分析を行い、ロ
シア人学習者の日本語に与える影響を検証する。
ロシア人学習者は堅い表現を多用する特徴があり、指導法に関しても、書き言葉や抽 象度の高い内容を重視し、文法訳読法と徹底した暗記練習が中心を占めている。これは ゴロブニン著作の教科書で示された理念がソ連時代と現在のロシアにおける日本語教育 の原則とされたことが理由であると複数の研究で指摘されている。
そこで本研究では、リーダビリティ推定と共起ネットワーク分析を用いて、教科書に 掲載された各課のテキストを分析し、教科書の特徴を多面的に調査する。
分析結果から、ゴロブニンの教科書は、初心者の学習者を対象としているものの、テ キストの難易度は、後半へ進むに従い、日本語能力試験の N3 を超えて、N2 レベルに相 当することが明らかになった。またロシア自由化以降の改訂を経ても、テキストの内容 にソ連時代のイデオロギーが反映されていることが確認された。
キーワード
日本語教育史 テキストマイニング 教科書分析 ロシア ゴロブニン
1 先行研究
1.1 教科書の影響力
ソ連時代の教授法が色濃く残るロシアの日本語教育では、漢語や抽象度の高い内容を文法 訳読法により徹底的に暗記させる授業がとられており〔木寺 1998〕、この傾向は2000年代以 降も続いている〔マニシナ 2009〕。このような指導法の根底には、ソ連時代にゴロブニンが
作成したУчебник японского языкаにあると指摘されている。特に教科書の序文で示された
「言語を複雑な体系と捉えて、文法・語彙・文字・音声を言語教育の対象として指導する」
という理念がロシアの日本語教育の根本原則となっている〔ストロゴワ 1996〕。
ロシア自由化以降、コミュニカティヴ・アプローチを採用した日本製の教科書はロシ アに多く流入しており、書店やオンライン販売で簡単に入手できる。しかし、プーリク
16
ら(2013)によると、自分の意見を発信する各課の構成が、実際の授業で使用しにくいと
いう理由で、ロシア人講師から敬遠されており、現在でも旧ソ連時代の教科書がカリキ ュラムとしての役割を果たしている。実際、Учебник японского языкаはソ連崩壊後の現在 でも、ロシアや旧ソ連圏で使用され続けており〔ブィコワ 2014〕、ソ連時代からの指導方 法を変えるべきかという議論も行われていない実情がある〔大田ら 2014〕。
故にこの教科書が現在でもロシア人講師に支持されている点をふまえると、堅い表現を多 用するロシア人学習者の特徴を把握するには、ゴロブニン著作の教科書を詳しく内容分析す る必要があるといえるだろう。
1.2 過去の分析
既に90年代の先行研究において、ゴロブニンの教科書の内容分析が行われている。稲 垣(1995)は、ゴロブニンの教科書に掲載された語彙の特徴を「日本語能力試験出題基準」
及び『日本語教育のための基本語調査 基本語2000/基本語6000』と比較した調査を実 施している。また矢沢(1994)では、教科書に掲載されている本文の題材を紹介すると ともに、ゴロブニンの教科書で扱われている文法項目を「日本語能力試験出題基準」及 び『日本語教材概説』と比較分析している。
調査結果によると、ゴロブニンの教科書における語彙の掲載数は2469語であり、これ は、日本語能力試験3級(現在のN3)の出題基準1500語と2級(現在のN2)の出題基準6000 語の中間にあたる〔稲垣 1995〕。ただし、ゴロブニンの教科書で扱われている漢字数は、
931字であり、3級の出題基準300字を大きく上回り、2級の出題基準1000字に近い掲 載数となっている〔矢沢 1994〕。また文法事項に関しては、4級と3級の出題基準264 項目の内252項目が、2級の出題基準171項目の内58項目が、それぞれ教科書内扱われ ている。日本語能力試験3級・4級の出題基準は概ね網羅されおり、2級の文法項目とも 3割程度一致している〔矢沢 1994〕。
これらの先行研究から、ゴロブニンの教科書は、語彙と文法の両方の点で、3級相当 の知識は十分に習得でき、2級の内容も一部扱われていることが分かる。稲垣(1995)は、
ゴロブニンの教科書を日本語能力試験3級の少し上の難易度と表現しており、矢沢
(1994)は、同試験の3級と2級の間に相当すると結論付けている。
しかし、両者はともに、教科書の語彙数と文法項目を日本語能力試験の出題基準と比 較することにとどまっている。そこで本研究では、テキストマイニング2による新しい分 析手法を用いて、ゴロブニンの教科書と日本語能力試験(N3・N2)を比較検討する。
2. 分析手法
テキストマイニングは、自然言語処理技術を用いたテキストデータの計量解析手法の 一種である。テキストの特徴を数値で表すことから、文章が持つ情報を合理的に集約す ることができ、調査者の主観や思想によって異なる結論が導かれる可能性も低くなる〔大
森・菰田 2019〕。本稿で採用する手法は、共起ネットワークとリーダビリティ推定の2
種類である。
17 2.1 共起ネットワーク
共起とは、文や文書において特定の単語と別の単語が同時に出現することである。共 起する確率の高い単語は相関を有すると考えられ、これらの単語を線で結ぶことで作成 された相関図は、共起ネットワークと呼ばれている。相関図において、関係性の強い単 語同士が単語群を形成することから、文章の内容を話題別に可視化することができる〔小 西 2019〕。相関図の描画に際し、各単語を1つの円として、単語の出現頻度を円の大き さ、単語間の共起関係を線の太さまたは濃さで示めすことが一般的である。
共起率は、Jaccard係数3と呼ばれる集合間の類似度を表す尺度を用いて算出され、係 数の値は、2種類のテキストデータXとYに対して式1によって与えられる。式1は「X とYにおいて語彙Aと語彙 Bが同時に出現する頻度」と「XとYにおいて語彙A また は語彙 B のどちらかが出現する頻度」の比率を表しており、語彙Aと語彙Bの共起関 係が強く、特定の文中において同時に出現する頻度が高いとき、Jaccard 係数は大きくな る性質を持っている。一般的にJaccard 係数が0.2以上の場合、単語同士に相関関係があ るとみなされる。
本稿では、共起ネットワークの作成に、立命館大学の樋口耕一教授が開発したソフト ウェアであるKH Coder4を使用する。人文社会科学系の研究において、オープンツール として幅広く利用されている5。
式1:Jaccard係数 = 𝑛 (𝑋 ∩ 𝑌) / 𝑛 (𝑋 ∪ 𝑌)
2.2 リーダビリティ推定
リーダビリティ推定とは、文章の難易度を推定することで、文章の読みやすさ・読み にくさを定量化する手法のことである。英語を母語としない移民が多いアメリカで、英 語の識字率を高めるために1940年頃から積極的に研究されている〔Doak et al. 1996〕。 日本語の場合、文の長さや漢字の割合などから難易度を推定するが、柴崎(2014)によ ると、何を評価基準に採用するかという点において、日本語は英語に比べ課題が多いと 指摘している。「隣の芝生は青い」と「となりのしばふはあおい」を比較する場合、成人 にとっては、ひらがなだけの後者より、漢字の割合が多い前者が読みやすいと考えられ る。一方で、小学校低学年の児童や初級レベルの外国人学習者にとっては、7文字の前 者より、11文字の後者が読みやすいと考えられる。このような要因から、柴崎(2014)は、
読み手の年齢や使用目的に合わせ、複数の指標を使い分けることを推奨している。
既に、日本語のリーダビリティを算出する指標が考案されており、有名なもとしては、
「帯」6とjReadability Portal7が挙げられる。「帯」は名古屋大学の佐藤理史教授が開発し
たオープンツールで、小中高の検定教科書に掲載されたテキストを規準コーパスとした 難易度推定法が採用されている。jReadability Portalは早稲田大学の李在鎬教授と同志社 大学の長谷部陽一郎教授が開発した難易度判定システムで、外国人日本語学習者の教育 支援を目的に設計されている。そのため、検定教科書ではなく、日本語能力試験で出題 された25年分のテキストを基に、リーダビリティの算出方法が定式化されている。
本稿では、ゴロブニンの教科書と日本語能力試験を比較検討するため、jReadability
18
Portalを分析ツールとして使用する。リーダビリティスコアは、式2の線形回帰モデル
によって算出され、表1の通り、計算結果が6.4から0.5に近づくほど難易度が高くなる。
式2:11.724+(-0.056*平均文長)+(-0.126*漢語率)+(-0.042*和語率) +(-0.145*動詞率)+(-0.044*助詞率)
表1 スコアと難易度の対応関係
難易度 スコアの範囲 該当する文章
上級後半 (とてもむずかしい) 0.5 〜 1.4 高度に専門的な文章 上級前半 (むずかしい) 1.5 〜 2.4 専門的な文章 中級後半 (ややむずかしい) 2.5 〜 3.4 やや専門的な文章 中級前半 (ふつう) 3.5 〜 4.4 比較的平易な文章
初級後半 (やさしい) 4.5 〜 5.4 基本的な語彙や文法で書かれた複文 初級前半 (とてもやさしい) 5.5 〜 6.4 単文を中心とする基礎的日本語表現
李(2018)を基に作成 3 分析テキストの概観
ゴロブニンの教科書は、1巻・2巻の初級編と3巻・4巻の中級編で構成されており、
2巻の7課(初級)からは、1000字程度のテキストが掲載されている。テキストマイニン グによる計量手法では、一定の長さを持つ文章でないと分析精度が担保されないことか ら、2巻の7課(初級)から4巻の13課(中級)におけるテキストを分析対象とする。
日本語能力試験の文章に関しては、『日本語能力試験公式問題集 第二集』の読解問題 を分析し、短文からなる文法問題は対象外とする。これらの各テキストに対して、式2 を基に筆者がリーダビリティスコアを算出する。なお、N3とN2の全体としてのリーダ ビリティスコアは、大問ごとのスコアから算術平均を求めるのではなくで、N3とN2の テキストをそれぞれ一つの文章とみなすことで算出した8。
各テキストの「掲載巻」「課」「題名」「話題の種類」「話題の対象」「スコア」「難易度」
「字数」に関して、ゴロブニンの教科書は表2、N3は表3、N2は表4に記載している。
表2 教科書のテキストとスコア一覧
掲載巻 課 題名 話題の種類 話題の対象 スコア 難易度 字数
2巻 7課(初級) 私たちの教室 学校生活 ロシア 5.94 初級前半 983 2巻 8課(初級) 学生の一日 学校生活 ロシア 5.03 初級後半 859 2巻 9課(初級) 私の部屋 日常生活 ロシア 4.95 初級後半 1179 2巻 10課(初級) 私のかぞく 学校生活 ロシア 3.96 中級前半 1195 2巻 11課(初級) 学生生活(その一) 学校生活 ロシア 3.52 中級前半 1296 2巻 12課(初級) 学生生活(その二) 日常生活 ロシア 3.74 中級前半 1246 2巻 13課(初級) フランス革命
200しゅう年記念日 政治・社会 ロシア 3.55 中級前半 735
19
3巻 1課(中級) モスクワの一日 日常生活 ロシア 3.81 中級前半 1041 3巻 2課(中級) 気候ときせつ 自然・気候 ロシア・日本 3.85 中級前半 1117 3巻 3課(中級) 旅行 旅行・観光 日本 3.6 中級前半 1218 3巻 4課(中級) 市内見物 旅行・観光 ロシア 3.62 中級前半 1695 3巻 5課(中級) オリンピック大会 政治・社会 日本 3 中級後半 1102 3巻 6課(中級) 食堂車 旅行・観光 ロシア 3.11 中級後半 1327 4巻 7課(中級) 生活サービスセンター 日常生活 ロシア 3.45 中級後半 855 4巻 8課(中級) ロシアと日本の立法機関 政治・社会 ロシア・日本 2.33 上級前半 718 4巻 9課(中級) デパート 旅行・観光 ロシア 3.52 中級前半 1285 4巻 10課(中級) 労働者の手紙 政治・社会 日本 3.47 中級後半 1042 4巻 11課(中級) キャンプ生活(日記) 旅行・観光 ロシア 3.07 中級後半 1605 4巻 12課(中級) 開会式のルポルタージュ 政治・社会 ロシア 2.77 中級後半 837 4巻 13課(中級) 郵便局 旅行・観光 ロシア 2.23 上級前半 1297
表3 N3のテキストとスコア一覧
問題番号 掲載文 スコア 難易度 字数 問題3 天気の話 4.1 中級後半 469
問題4(1) 授業中止の連絡 3.05 中級前半 167
問題4(2) 携帯電話を持つこと 3.87 中級後半 211
問題4(3) 自動販売機 3.02 中級前半 229
問題4(4) 資料作成の依頼 3.44 中級後半 179
問題5(1) 買ったばかりの本 3.51 中級前半 360
問題5(2) 貸し傘 3.55 中級前半 401
問題6 タクシーの運転 3.4 中級後半 653 問題7 動物園のイベント 3.27 中級後半 623
N3全体 3.57 中級前半 3292
表4 N2のテキストとスコア一覧
問題番号 掲載文 スコア 難易度 字数
問題9 公衆トイレのマーク 3.5 中級後半 636
問題10(1) 「ルール」はなぜあるのか 4.58 初級後半 212
問題10(2) 暖房使用についてのお願い 2.33 上級前半 226
問題10(3) やりたいことをやる 1.92 上級前半 217
20
問題10(4) 割引フェアの案内 3.48 中級後半 278
問題10(5) いい一日 1.93 上級前半 191
問題11(1) 個性 3.41 中級後半 625
問題11(2) 話し言葉の特徴 2.16 上級前半 638
問題11(3) 旅行業のニーズ 3.57 中級前半 478
問題12A 公立の図書館のサービス向上 1.91 上級前半 280 問題12B 公立の図書館サービス低下 1.57 上級前半 295 問題13 アイディアのもと 3.58 中級前半 796 問題14 ランチメニュー 3.61 中級前半 690
N2全体 3.27 中級後半 5562
4 教科書の内容分析
表5 教科書の話題別分類
旅行・観光 政治・社会 日常生活 学校生活 自然・気候
掲載数 6 5 4 4 1
日本の話題 1 3 0 0 1
表5が示す通り、教科書の内容は日常生活や学校生活よりも、旅行・観光や政治・社 会に関する話題が多く、日本についての言及も少ない。この教科書は日本語学習者が大 学卒業後、ソビエトの社会主義体制や生活様式を日本人観光客にガイドとして紹介でき るように設計されており〔矢沢 1994〕、この点が要因として考えられる。
図1 共起ネットワーク図
21
しかし、政治・社会については半分が日本に関することである。そして図1が示す通 り、日本とロシアの2語が一つの単語群を形成しているため、各課のテキストにおいて、
この2単語が共に使用されている確率が高いことが分かる。これは、日本が主題のテキ ストは少ないものの、政治や社会の話題を中心に日本の事例にも言及しながら、ロシア 事情を説明しているからだと考えられる。
なお、ソ連とソビエトの2単語は、ソ連崩壊後の改定によりロシアに変更されており、
ナチスとの闘いや国際スポーツ大会の成績などソ連時代の史実は、ロシア人の歴史として 扱われている。また労働者と資本家の対立といったイデオロギー色の強い内容もそのま ま掲載されている。
5 リーダビリティ推定
リーダビリティスコアに関して、ゴロブニン著作の教科書とN3・N2の対応関係は、
図2と図3が示す通りである。折れ線グラフは、教科書各課に掲載されたテキストのス コアを値の大小で並べたもので、網掛け部分は、N3とN2のテキストについて大問別に 算出したスコアの最大・最小の範囲を示している。また図2と図3の平均線と書かれた 点線は、N3とN2の全体としてのリーダビリティスコアを示しており、3節で述べたと おり、N3とN2のテキストをそれぞれ一つの文章とみなすことで算出している。
5.1 N3と教科書の比較
図2が示す通り、N3のスコアを示す網掛けに収まっているのは、リーダビリティスコ アが3.96から3.11の教科書テキストであり、その多くがN3のテキスト全体のスコア平 均である3.57付近に分布している。よって教科書の計20課の内、半数以上の13課分の テキストがN3のテキストと同程度の難易度であることが分かる。
図2 教科書とN3のリーダビリティスコア
22 5.2 N2と教科書の比較
図3が示す通り、N2のスコアを示す網掛けに収まっているのは、リーダビリティスコ アが3.55から2.23の教科書テキストであり、N2全体のスコア平均である3.27を超えて 分布している6課分のテキストも確認できる。よって計20課の内、半数以上の12課分 のテキストがN2のテキストと同程度の難易度であることが分かる。
なお、N2の問題10(1)のスコアは4.58とN3のスコア最小値4.1より小さく、字数も
212字と2番目に少ないため、外れ値として分析対象から除外している。
図3 教科書とN2のリーダビリティスコア
6 結論
4節と5節の分析結果から、ゴロブニンの教科書では、難易度がN3相当のテキストか らN2相当のものまで幅広く掲載されており、扱われる題材もかなり特殊であることが 分かる。一方で、1節2項の先行研究では、語彙と文法ともに、N2水準の項目を部分的 にしか網羅できていないことから、3級(N3)の難易度は超えているが、2級(N2)には達し ていないという評価を受けている〔矢沢 1994, 稲垣 1995〕。
しかし、単語と文法の知識を蓄積するだけでは、読解力の向上は期待ではない。文章 の読解には、単語と文の関係や文と文章の関係、そして文章とその内容の関係など複数 の要因が相互に作用している〔岡本 2001〕からである。実際に読解力を高めるには、読 み手が習得した語学の知識を活用して、文章を読み進めるという積極的な働きかけが必 要になる〔Smith 1974〕。
つまり、ゴロブニンの教科書は、語彙と文法という言語知識の点で、N2未満であって も、リーダビリティ推定という新たな指標に基づけば、N2相当であるという先行研究と は別の評価ができる。特に、N2全体のスコアより値が大きい6課分のテキストは計6886
23
字であり、N2の試験1回分の5562字よりも分量が多い。教科書の前半では初学者を対 象にN3相当のテキストが掲載されているが、後半部分は、リーディング教材としてN2 の水準に十分対応できると判断して問題ないだろう。
仲矢・稲垣 (2005)によると、ロシア人講師は「両面通訳」と呼ばれる、学生に日本語 のテキストを暗唱させ、口頭で発表させる教授法が一般的である。ゴロブニンの教科書 で日本語を学ぶロシア人学習者は、初中級の段階でN2レベルのテキストを少なくとも 能力試験1回分は丸暗記していると考えられる。また内容面でもイデオロギー色の強い 日本語表現を暗唱することになる。
よって本稿の結論として、ロシア人学習者の堅い日本語表現は、ソ連時代に想定され た特殊な内容を扱い、N2相当の読解力が必要なテキストをロシア人講師が教え込むこと に起因するという従来の言説が裏付けられたといえるだろう。
注
1 本稿は、2022年度日本語教育学会秋季大会での研究発表を加筆修正したものである。
2 日本語教育における応用事例は、李在鎬 (2013)『文章を科学する』で詳しく紹介されている。
3 Jaccard係数は、生物学において地域間の生態系が最大でどの程度類似しているかを評価するために
多用される指標〔大垣 2008〕であるが、近年は言語処理の分野においても活用されている。
4 KH Coderの最新版は、次のURLで入手可能 https://khcoder.net/dl3.html
5 KH Coderを使用した研究は次のURLで閲覧可 https://khcoder.net/bib.html?year=recent&auth=all&key=
6 「帯」は、次のURLで利用可能 kotoba.nuee.nagoya-u.ac.jp
7 jReadability Portalは、次のURLで利用可能 https://jreadability.net/
8 日本語教育学会の発表において、jReadability Portalでは、400文字を下回る文章を正確に分析できな いため、N2・N3のテキストをそれぞれ一つにまとめて、スコアを算出するべきという指摘を受けた。
参照文献
1. 稲垣滋子 (1995)「ゴロブニン監修の日本語教科書における語彙の特徴」『ICU 日本語教 育研究センター紀要』4: 1-20.
2. 大森寛文・菰田文男 (2019)『人工知能を活かす経営戦略としてのテキストマイニング』
中央経済社.
3. 大垣俊一 (2008)「多様震と類似度、分類学的新指標」Argonauta 15: 1.
4. 岡本直子 (2001)「外国語を読む力を構成する要因」広島大学教育学研究科博士論文
5. 木谷直之 (1998)「極東ロシアの大学生の言語学習観について-海外日本語教師研修のた
めの基礎データ作成を考える-」『日本語国際センター紀要』8: 95-110.
6. 国際交流基金・日本国際教育支援協会 (2018)『日本語能力試験公式問題集 第二集』
凡人社.
7. 小西勝也 (2019)「J-REITのESG開示情報をテキストマイニング<共起ネットワークに
よる全体像の可視化>」三井住友トラスト基礎研究所.
8. 佐藤理史 (2008)「日本語テキストの難易度判定ツール『帯』」『Japio YEAR BOOK 2008』
52-57.
9. 柴崎秀子 (2014)「リーダビリティー研究と「やさしい日本語」」『日本語教育』158: 49-65.
24
10. ストロゴワ (1996)「ロシアにおける日本語教育の問題点をめぐって」『ICU 日本語教育 研究センター紀要』5: 95-101.
11. 仲矢 信介, 稲垣 滋子 (2005)「ロシア・NIS諸国への日本語教育支援再考」『日本語教育』
127: 51-60.
12. 樋口耕一 (2004)「テキスト型データの計量的分析 ―2つのアプローチの峻別と統合―」
『理論と方法』19: 101-115.
13. プーリク, ミロノワ、山口紀子(2013)「ロシア一般人向け日本語コース用初級コースブ ック『どうぞよろしくⅠ』開発報告」『国際交流基金日本語教育紀要』9: 135-150.
14. ブィコヴァ (2016) 「アジア・アフリカ諸国大学の日本語学科と日本語教育」『専修大学 人文科学研究所月報』280: 13-19.
15. マニシナ(2009)「ロシアの高等教育機関における日本語教育-極東国立人文大学 1 にお
ける日本語教育の実情と問題点-」『外国語教育フォーラム』3: 64-74.
16. 矢沢理子 (1994)「ロシア語圏の日本語教育」『第七回日本語教育連絡会議発表論文集』
182-186.
17. 李在鎬 (2018)「線形回帰モデルを使った⽂章難易度の研究」『早稲田日本語教育学』21:
1-16.
18. Doak, C.C., Doak, L.G., and Root, J.H. (1996) Teaching patients with low literacy skills. J.B.
Lippincott Company. Philadelphia.
19. Smith, F. (1971) Understanding Reading. Holt, Rinehart and Winston. New York 20. Головнин, И. Б. (2005) Учебник японского языка. Живой язык. Москва.
(佐野晃 筑波大学大学院 国際公共政策学位プログラム 博士後期課程1年)