• 検索結果がありません。

日本語話し言葉コーパス (国立国語研究所)

日本語話し言葉コーパス における節単位認定 (Version 1.2) 高梨克也内元清貴 ( 情報通信研究機構 ) 丸山岳彦 ( 国立国語研究所 / ATR 音声言語コミュニケーション研究所 * ) 目次 1. 背景と目的. 2 図 1: 節単位認定の位置づけ. 2 図 2: 節単位認定作業の流れ.

日本語話し言葉コーパス における節単位認定 (Version 1.2) 高梨克也内元清貴 ( 情報通信研究機構 ) 丸山岳彦 ( 国立国語研究所 / ATR 音声言語コミュニケーション研究所 * ) 目次 1. 背景と目的. 2 図 1: 節単位認定の位置づけ. 2 図 2: 節単位認定作業の流れ.

... 従来,書き言葉に対する係り受け構造,談話境界などの情報付与や重要文選択などにおいては,その単位として「文」 が用いられてきた.しかし,自発的な話し言葉を対象とする場合,文は必ずしも自明な単位ではない.書き言葉では書 き手自身が句点によって区切りを確定するのに対して,話し言葉である CSJ には句点情報がなく,また文法的に明確 ...

22

1. 本文書の内容本文書は 日本語話し言葉コーパス (Corpus of Spontaneous Japanese: 以下 CSJ) における音声ラベリングの仕様を解説したものである CSJ では コア に含まれる約 50 万語 ( 短単位 ) およそ 44 時間の音声に対して 分節音ラベルとイント

1. 本文書の内容本文書は 日本語話し言葉コーパス (Corpus of Spontaneous Japanese: 以下 CSJ) における音声ラベリングの仕様を解説したものである CSJ では コア に含まれる約 50 万語 ( 短単位 ) およそ 44 時間の音声に対して 分節音ラベルとイント

... 2.分節音ラベリングの方針 分節音ラベリングとは、音声信号を、それを構成すると考えられる子音、母音等の構成要素に分解 して、当該要素を表現するラベルと時刻を確定する作業である。構成要素は音声学のレベルでも音韻 論のレベルでも考案できるが、 CSJ のラベルセットは、日本語の音素ラベルに音声学的なラベルを一 部追加したものとなっている。これは、現代日本語に観察される分節音の音声変異のうち、音声学的 ...

12

第 6 回コーパス日本語学ワークショップ予稿集 (2014 年 9 月, 国立国語研究所 ) BCCWJ と日英パラレル新聞コーパスに基づいた格外連体修飾形の研究 田邊和子 ( 日本女子大学文学部 ) Study of the Case-Outer Relative Clauses Based on

第 6 回コーパス日本語学ワークショップ予稿集 (2014 年 9 月, 国立国語研究所 ) BCCWJ と日英パラレル新聞コーパスに基づいた格外連体修飾形の研究 田邊和子 ( 日本女子大学文学部 ) Study of the Case-Outer Relative Clauses Based on

... 中條清美、アントニ・ローレンス、西垣知佳子(2012)「日英パラレルコーパス検索サイト WebParaNews の公開-開発と実践利用-」, 外国語教育メディア学会(LET)第 52 回 全国研究大会, 甲南大学, 岡本キャンパス, 発表要項集, pp.94-95. Comrie, Bernard. (1996) The unity of noun modifying clauses in Asian languages. ...

8

韓国人学習者の日本語作文に見る「的」付き形容動詞の使用傾向と教育への提言― 学習者コーパスと母語話者コーパスの比較を通して

韓国人学習者の日本語作文に見る「的」付き形容動詞の使用傾向と教育への提言― 学習者コーパスと母語話者コーパスの比較を通して

...  KCONJ は 20 歳以上の日本語母語話者(数名の学生を含むが、大半は比較的文章を書くこと に慣れている成人)に辞書使用や時間の制限を設けずに 800 字以内のライティングを作成する ように有料で依頼し、文書で許諾を得たうえでコーパス化を行っている。母語話者データの作 文課題は、KCONJ のデータ 157 編が「わたしの町の自然」「お金と幸せについて」「自殺につい ...

16

HOKUGA: 現代日本語書き言葉均衡コーパスコアデータにおけるオノマトペ出現実態に基づくオノマトペ自動抽出手法

HOKUGA: 現代日本語書き言葉均衡コーパスコアデータにおけるオノマトペ出現実態に基づくオノマトペ自動抽出手法

... 2.1 コーパス 本研究で分析対象とするコーパスは,大学共同 利用機関法人人間文化研究機構国立国語研究所と 文部科学省科学研究費特定領域研究⽛日本語コー パス⽜プロジェクトが共同で開発した⽝現代日本 語書き言葉均衡コーパス⽞ 9) (Balanced Corpus of Contemporary Written Japanese,以降 BCCWJ) である.BCCWJ ...

7

Title 必ず 絶対 きっと の文体的特徴 現代日本語書き言葉均衡コーパス の調査から Author(s) 前坊, 香菜子 Citation 一橋大学国際教育センター紀要, 5: Issue Date Type Departmental Bulletin Pap

Title 必ず 絶対 きっと の文体的特徴 現代日本語書き言葉均衡コーパス の調査から Author(s) 前坊, 香菜子 Citation 一橋大学国際教育センター紀要, 5: Issue Date Type Departmental Bulletin Pap

... 本調査のために使用したデータは、国立国語研究所が 2011 年に構築した『現代日本語書 き言葉均衡コーパス』 ( BCCWJ)である。BCCWJ は 13 のサブコーパス(コア・非コアを 分けると 19)からなっている。本研究では、これらのサブコーパスをレジスターとみなし て分析することとする。 「出版・書籍」「図書館・書籍」「特定目的・ベストセラー」を同じ ...

13

Webを母集団とした超大規模コーパスの開発 : 収集と組織化

Webを母集団とした超大規模コーパスの開発 : 収集と組織化

... キーワード:コーパス構築,Webアーカイブ,言語情報組織化,言語解析 1. はじめに 国立国語研究所では 2006 ∼ 2010 年度の期間に 1 億語規模の書き言葉コーパス『現代日本語書 き言葉均衡コーパス』(以下“BCCWJ”) (前川 2007, 前川・山崎 2008)を構築し,2011 年より一 ...

27

コーパスに基づく言語学教育研究報告 8

コーパスに基づく言語学教育研究報告 8

... を表すものであり,(27)は以前の私が示している外的な様子はこのとき(「今」)とは違 う様子であったことを表すものである。 6. まとめ 本稿では,形容詞(形容動詞も含む)あるいは「∼たい」に接尾辞「がる」をつけた「∼ がる」という形(「悔しがる」「食べたがる」等)について,国立国語研究所「『現代日本語 書き言葉均衡コーパス』モニター公開データ(2009 年度版)」(「書籍」「白書」「国会会議 ...

12

〈プロジェクト紹介〉超大規模コーパス構築プロジェクト 日本語Webコーパスの構築 : 利活用

〈プロジェクト紹介〉超大規模コーパス構築プロジェクト 日本語Webコーパスの構築 : 利活用

... 浅原 正幸 (あさはら・まさゆき) 国立国語研究所言語資源研究系・コーパス開発センター准教授。博士(工学)(奈良先端科学技術大学院大学)。奈良先 端科学技術大学院大学助手・助教,国立国語研究所コーパス開発センター特任准教授を経て,2014 年 10 月より現職。 主な著書・論文:Archiving and analysing techniques of the ultra-large-scale ...

11

『日本語日常会話コーパス』構築におけるPraatの利用

『日本語日常会話コーパス』構築におけるPraatの利用

... Ken’ya NISHIKAWA (National Institute for Japanese Language and Linguistics) 要旨 国立国語研究所で構築を進めている『日本語日常会話コーパス』 (CEJC) のアノテーション 作業(書き起こし・短単位情報付与作業)を支援するために,無償の音声分析ソフトウェア Praat を利用したツールをいくつか開発した: (i) [ Praat ...

7

目次 第 1 章 国民之友コーパス の開発経緯と特徴... 1 第 2 章 国民之友コーパス の仕様 コーパス化の対象 コアデータの設定 文字入力 基本方針 文字集合 外字 非漢字の

目次 第 1 章 国民之友コーパス の開発経緯と特徴... 1 第 2 章 国民之友コーパス の仕様 コーパス化の対象 コアデータの設定 文字入力 基本方針 文字集合 外字 非漢字の

... 有山輝雄(1986)「言論の商業化―明治 20 年代の民友社―」『コミュニケーション紀要』 4、pp.1-23( http://www.seijo.ac.jp/graduate/gslit/orig/journal/communication/pdf/scom-04-01.pdf よりダウンロード可) 小椋秀樹・小磯花絵・冨士池優美・宮内佐夜香・小西光・原裕(2011)『『現代日本語書 ...

40

コーパスに基づく言語学教育研究報告 9

コーパスに基づく言語学教育研究報告 9

... 母語話者(非支援者) 先輩の知人 第 2 期:1 年度目 7 月~2 年度目 8 月「日本人の友人ができ,日本語の上達を感じているも のの,日本人の会話への参加に難しさを感じている段階」 3 ヶ月経ったあるとき,チューター室で数人のが話していた。その中にいた日本人チュー ター(N)が話しかけてくれた。自分も「くだらないこと」を言い,話の輪に入ることがで き,朝の 3 ...

18

学会賞 | JAECS 英語コーパス学会

学会賞 | JAECS 英語コーパス学会

... コーパス分析ツールの開発などの業績に対して授与されています。 同時に,若手研究者( 39 歳以下)を対象に,奨励賞も募集します。こちらは,若手研究 者の優れた業績に報いるために設けられた賞です。 どちらの賞の締切も,本年 6 月末日です。奮ってご応募ください。 ...

1

日本人韓国語学習者の話し言葉をいかに評価するか―「わかりやすさ」の評価項目抽出―

日本人韓国語学習者の話し言葉をいかに評価するか―「わかりやすさ」の評価項目抽出―

... 評価者や教育機関などの目的により取捨選択して評価基準を採択する必要が あると述べられている。 以上のような韓国語教育における話し言葉の評価項目を応用して、か つ、前述の日本語学習者を対象にした先行研究などを参照して、「わかりや すさ」の概念を構成する評価要素を設定することは可能かもしれない。だ が、本研究では、予め評価項目を作ることはせず、野原(2009・2014)など ...

15

HOKUGA: 英語ライティングクラスのための観光コーパス構築に関する研究

HOKUGA: 英語ライティングクラスのための観光コーパス構築に関する研究

... 大学を中心とした英語教育の研究でも,観光英語あるいは Tourism Englishを視野に入れた調 査・研究が行なわれつつある。日本のことを表現するための英語の研究として,Chujo,Utiyama & Oghigian (2006)は,885部の京都の観光案内資料から miru(sight-seeing), kau(shopping), taberu(dining), taikensuru(hands-on ...

31

[配布資料] CV  草薙邦広のページ 草薙 コーパスシンポジウム 配布資料

[配布資料] CV 草薙邦広のページ 草薙 コーパスシンポジウム 配布資料

... 発達 及び言語産出傾向 分析 援用す こ こ 異 語や頻度 基 く計量的分析 幅広い知見 齎す 期待 こ あ う。 こ う 心理言語学的特性 基 く第 言語 け 書 言葉 分析 知見 非常 限 い 言わ 得 い。 そこ 本研究 基礎的 試 心理言語学的特性 評定値 基 日本語 母語 す 英 語学習者 け 語彙 産出傾向 い 調査 た。学習者コーパス NICE Nagoya Interlanguage ...

2

PDFファイル 3I4 「自然言語処理におけるコーパス・辞書生成」

PDFファイル 3I4 「自然言語処理におけるコーパス・辞書生成」

... Neutral と判断され、評価極性の推定精度が低くなる可能性が ある。したがって、適切な閾値を決定する必要がある。 2.2 ニューラルネットワーク言語モデルの辞書の改良 半教師学習を用いた辞書作成では、上記に示した適切な閾 値を決定するという問題があった。また、評価極性が分かって いる単語との共起頻度に基づいて推定を行なうため、コーパス における単語の出現頻度の偏りにより辞書の精度が左右されて ...

2

計量国語学 アーカイブ ID KK 種別 特集 招待論文 A タイトル Webコーパスの概念と種類, 利用価値 語史研究の情報源としてのWebコーパス Title The Concept, Types and Utility of Web Corpora: Web Corpora as

計量国語学 アーカイブ ID KK 種別 特集 招待論文 A タイトル Webコーパスの概念と種類, 利用価値 語史研究の情報源としてのWebコーパス Title The Concept, Types and Utility of Web Corpora: Web Corpora as

... Google ブックスを Web コーパスの一種と見るとすれば,それに連続するいろいろなも のも視野に入って来る.日本語に関して言えば,「国立国会図書館デジタルコレクショ ン」のサイト(http://dl.ndl.go.jp/)では明治・大正期を中心とする多数の書籍,雑誌が 画像化されて公開され,全文検索の機能は残念ながら実現していないが,書名や章,節の ...

19

自由英作文における学習者コーパスの文章の種類別品詞分析から得られる教育的示唆

自由英作文における学習者コーパスの文章の種類別品詞分析から得られる教育的示唆

... は除外し,日本人英語学習者の持つ共通の語使用傾 向と文章の種類による語使用の異なりの原因を追究 することが可能になろう。 また今回は作成時の辞書使用に関しては調査して いないが,初稿を日本語と英語の混合での作成を許 可した場合,論述文では専門的な名詞句を和英辞典 に依存する度合いが上昇している可能性があり,リ ーダビリティーや使用語彙頻度に影響を与えている ものと思われる。本研究で名詞に焦点を当てていな ...

15

談話辞"Speaking of X"の用法を探る : 辞書の記述とコーパスが示唆するもの

談話辞"Speaking of X"の用法を探る : 辞書の記述とコーパスが示唆するもの

... (Comprehensive Dictionary of Colloquial English) 10. えられる 式 上述した辞書等の例文、映画の台詞および各種コーパスの共起例を基に次の 5つの 式が えられる。これらの 式はあくまでデータから 式化している ものであり、英語学習者にとって活用可能な談話上の絶対的な知識とは言えな い。量的に収集されたデータを 析し、質的に high frequencyとして認知さ ...

18

Show all 2197 documents...

関連した話題