• 検索結果がありません。

日本のコーパス

日本語教育における学習者コーパスの構築とICLEAJ 外国語学部(紀要)|外国語学部の刊行物|関西大学 外国語学部

日本語教育における学習者コーパスの構築とICLEAJ 外国語学部(紀要)|外国語学部の刊行物|関西大学 外国語学部

... JLE コーパス」(NICT Japanese Learner of English Corpus, NICT 日本人英語学習者コーパス) が公開されたが、アルク SST(Standard Speaking Test)受験者 1,281 人から集めた 200 万語 英語会話データである。次いで、2007年に「JEFLL コーパス」 (Japanese EFL ...

9

資 料 日本大学生産工学部研究報告 B 2015 年 6 月第 48 巻 レキシカル プロファイリング型オンラインコーパス検索ツール LWP for ParaNews の英語授業における利用 中條清美 *, 西垣知佳子 **, 赤瀬川史朗 *** ****, 内山将夫 Using the LWP f

資 料 日本大学生産工学部研究報告 B 2015 年 6 月第 48 巻 レキシカル プロファイリング型オンラインコーパス検索ツール LWP for ParaNews の英語授業における利用 中條清美 *, 西垣知佳子 **, 赤瀬川史朗 *** ****, 内山将夫 Using the LWP f

... 2)LWP で使用している日英新聞パラレルコーパスは, 1989 年9月から 2001 年 12 月まで 12 年分日英 新 聞 記 事 対 応 付 け デ ー タ(JENAAD: Japanese- English News Article Alignment Data)である。 情報通信研究機構と知的財産利用契約に基づき一 般公開用に有償で公開されたものを使用している。 ...

13

『現代日本語書き言葉均衡コーパス』マニュアル(DVDデータv1.0対応)

『現代日本語書き言葉均衡コーパス』マニュアル(DVDデータv1.0対応)

...  短単位データ 短単位コアデータは日本語研究で利用だけでなく、 BCCWJ 全体を形態素解析するた めシステム学習用データとして利用を目的として作成したデータである。そのため, 非コアデータよりも高精度短単位情報が付与されている。短単位データ作成は形態素 解析エンジンに MeCab、解析用辞書に UniDic ...

157

HOKUGA: 現代日本語書き言葉均衡コーパスコアデータにおけるオノマトペ出現実態に基づくオノマトペ自動抽出手法

HOKUGA: 現代日本語書き言葉均衡コーパスコアデータにおけるオノマトペ出現実態に基づくオノマトペ自動抽出手法

... 2) ⽛ごろご ろ⽜項目には⚖つ語義が掲載されている(⽛雷 響く音⽜ ⽛猫がのどを鳴らす音⽜等擬音語義 と⽛無造作に転がっているさま⽜ ⽛仕事をせずに無 駄に暮らしているさま⽜等擬態語義).高丸 らによる地方議会会議録コーパスにおける⽛ごろ ...

7

日本語学習者コーパスのための誤用タグの構築について

日本語学習者コーパスのための誤用タグの構築について

... はじめに 第二言語学習者の産出物を集めた学習者コーパスは、コンピュータのデータ蓄積技術の 発展、検索技術の発展などにより、その種類や量を増している。学習者コーパスの利点 は、学習者が何を困難に感じるかを見直すことにより教師の学生へのフィードバック、さ らに教材研究、教授法の見直しなどにも役に立つことである。また、作文支援システム を開発する際にも学習者の誤りやすい点が予[r] ...

13

『日本語歴史コーパス』短単位アノテーション作業効率化に向けた形態素解析用辞書『UniDic』の段階的特殊化の検討 : 近松コーパスを例として

『日本語歴史コーパス』短単位アノテーション作業効率化に向けた形態素解析用辞書『UniDic』の段階的特殊化の検討 : 近松コーパスを例として

... MeCab 追加学習機能を使い,既存『洒落本』用短単位解析用辞書か ら段階的に,近松専用短単位解析用辞書を作成する方法について述べる.具体的には,まず比 較的時代近い洒落本解析用辞書を,上方洒落本コーパスのみで上方洒落本解析用辞書に ...

13

韓国人学習者の日本語作文に見る「的」付き形容動詞の使用傾向と教育への提言― 学習者コーパスと母語話者コーパスの比較を通して

韓国人学習者の日本語作文に見る「的」付き形容動詞の使用傾向と教育への提言― 学習者コーパスと母語話者コーパスの比較を通して

... 23(16%)となっている。一方、NS 延べ語数は連体用法 が 132(51%)、連用用法が 110(43%)、終止用法が 15(6%)で、異なり表記形数は連体用法 が 81(52%)、連用用法が 60(38%)、終止用法が 15(10%)となっている。対象コーパスと 参照コーパスを比較すると、NNS_K は NS と同様に、延べ語数も異なり表記形数も連体用法が ...

16

〈プロジェクト紹介〉超大規模コーパス構築プロジェクト 日本語Webコーパスの構築 : 利活用

〈プロジェクト紹介〉超大規模コーパス構築プロジェクト 日本語Webコーパスの構築 : 利活用

... 浅原 正幸 (あさはら・まさゆき) 国立国語研究所言語資源研究系・コーパス開発センター准教授。博士(工学)(奈良先端科学技術大学院大学)。奈良先 端科学技術大学院大学助手・助教,国立国語研究所コーパス開発センター特任准教授を経て,2014 年 10 月より現職。 主な著書・論文:Archiving and analysing techniques of the ultra-large-scale ...

11

人はなぜことわざを使うのか ―コーパス日本語会話における位置とはたらきの分析から―

人はなぜことわざを使うのか ―コーパス日本語会話における位置とはたらきの分析から―

... 4.1 では, ことわざが元来持つ特徴を利⽤して, ⼀⾔でその話題やエピソードエッセンスをまとめ, 同時に 使⽤者側評価を⽰すことによって話題を終わらせるはたらきを考察し, 4.2 では, 張(2014)で「焦点ずらし」 と呼ばれる, 褒めや個⼈的なトピックから話題主を遠ざけるはたらきについて考察した. 分析結果, 我々 はことわざを使うことで, ...

4

日本語専門分野テキストコーパスからの複合語用語の抽出

日本語専門分野テキストコーパスからの複合語用語の抽出

...  しかしながら、一方で、統計的指標を利用した用語性判定では、用語候補出現頻度が判定結果 に大きく影響することから、相対的に頻度低い候補については用語性判定が困難であり、抽出可 能な用語は、単一形態素かせいぜい比較的要素数少ない形態素列に限定される傾向があった。結 果として、抽出された用語間関係を、入れ子関係等に基づいて解析し、用語を体系的に整理する ...

6

『現代日本語書き言葉均衡コーパス』利用の手引(DVDデータv1.1対応)

『現代日本語書き言葉均衡コーパス』利用の手引(DVDデータv1.1対応)

... このような立場に対しては、当然ことながら「語というは何なか、調査ため便 宜的に設けられた単位にすぎないかという問題が残る。」(前田 1985:740)という批判 がある。確かに、語というものを定義しようとする以上、語とは何かという本質的な議論 を積み重ねていくことは重要なことである。しかし、国立国語研究所(1987:12)に、「原 ...

182

第 6 回コーパス日本語学ワークショップ予稿集 (2014 年 9 月, 国立国語研究所 ) BCCWJ と日英パラレル新聞コーパスに基づいた格外連体修飾形の研究 田邊和子 ( 日本女子大学文学部 ) Study of the Case-Outer Relative Clauses Based on

第 6 回コーパス日本語学ワークショップ予稿集 (2014 年 9 月, 国立国語研究所 ) BCCWJ と日英パラレル新聞コーパスに基づいた格外連体修飾形の研究 田邊和子 ( 日本女子大学文学部 ) Study of the Case-Outer Relative Clauses Based on

... 中條清美、アントニ・ローレンス、西垣知佳子(2012)「日英パラレルコーパス検索サイト WebParaNews 公開-開発と実践利用-」, 外国語教育メディア学会(LET)第 52 回 全国研究大会, 甲南大学, 岡本キャンパス, 発表要項集, pp.94-95. Comrie, Bernard. (1996) The unity of noun modifying clauses in Asian ...

8

『日本語日常会話コーパス』構築におけるPraatの利用

『日本語日常会話コーパス』構築におけるPraatの利用

... CEJC ように,複数話者が参加している会話音声をアノテーションしている際,別 話者(同じ個所)音声を聴取したくなる場合がある。例えば, Praat で IC01 音声を聞 いている最中に, IC02 音声を聞きたい,といった具合である。そこで,当該会話に参加して ...

7

計量国語学 アーカイブ ID KK 種別 特集 招待論文 A タイトル Webコーパスの概念と種類, 利用価値 語史研究の情報源としてのWebコーパス Title The Concept, Types and Utility of Web Corpora: Web Corpora as

計量国語学 アーカイブ ID KK 種別 特集 招待論文 A タイトル Webコーパスの概念と種類, 利用価値 語史研究の情報源としてのWebコーパス Title The Concept, Types and Utility of Web Corpora: Web Corpora as

... 用例を観察して気付くことは,今「テレビジョン」 「テレビ」と異なり,しばしば行為 ――すなわち, 映像を遠隔地に伝送し,再現する こと――を表していることである. 例えば,「電視せんとする物体」 「第二図如き装置で電視した」 「暗闇にある物体を電視し 得る」 「放送局で電視をやるとしたら」,また,「電視法」 「電視方式」 「電視試験」など表 ...

19

「日中Skype会話コーパス」を用いた話題別語彙の抽出 ―「食」の場合―

「日中Skype会話コーパス」を用いた話題別語彙の抽出 ―「食」の場合―

... 3.1 使用したコーパスについて  2012年5月~7月に、東京・実践女子大学と 長沙・湖南大学学生間で行ったSkypeを利用し た遠隔日本語会話活動(中俣ほか2013)を録音、 文字化したもの。接触場面会話コーパス。 ...

44

関西大学バイリンガルエッセイコーパスプロジェクト─その概要と教育研究への応用に関する展望─

関西大学バイリンガルエッセイコーパスプロジェクト─その概要と教育研究への応用に関する展望─

... 13 トピックについて、英語と日本エッ セイをそれぞれ授業時間内にパソコン上で作成し、所定プロジェク・ウェブページからイン ターネット経由で提出する。エッセイ作成標準時間は、英文が 1 時間(このうち最初 5 分 をアウトライン作成に当てる)、和文が 30 分、語数は英文= 300 語以上、和文= 800 文字以 ...

23

談話辞"Speaking of X"の用法を探る : 辞書の記述とコーパスが示唆するもの

談話辞"Speaking of X"の用法を探る : 辞書の記述とコーパスが示唆するもの

... かしながら、特に初級から中級まで英語学習者にとっては、英和辞典でのそ 和訳が ∼に関して言えば;∼について言えば と記述している場合が多く、 このことが他類似表現和訳と全くと言っていいほど同じであるため、表面 上意味は知っていても正しく えない(活用できない)というが実態であ ...

18

Webを母集団とした超大規模コーパスの開発 : 収集と組織化

Webを母集団とした超大規模コーパスの開発 : 収集と組織化

... 年より本格事業化している。NDL Web アーカイブでは保存が 主目的であり,同一 URL を複数回収集し,経年変化を確認できるようなユーザインターフェイ スが提供されている。様々な技術集積により,検索エンジンを運営している企業やコンテン ツを保持している企業だけでなく,個人でも Web スケール言語資源を構築することが可能に なっている。矢田(2010)は形態素解析用辞書 IPADIC ...

27

初に乗り越えなければならない2つの壁は, 学習者にとって 適切な難易度のコーパス と 使いやすい検索ツール を備えることである (Flowerdew, 2012; Chujo, Oghigian & Akasegawa, 2015) 11),12) 現状ではコーパスと検索ツールのいずれも研究者用のも

初に乗り越えなければならない2つの壁は, 学習者にとって 適切な難易度のコーパス と 使いやすい検索ツール を備えることである (Flowerdew, 2012; Chujo, Oghigian & Akasegawa, 2015) 11),12) 現状ではコーパスと検索ツールのいずれも研究者用のも

... 画面上半分 Target Corpus に 10 文(最大 500 文まで) 表示される。また,それら英文に対応する日本語訳 10 文が,画面下半分 Reference Corpus に表示される。 WebSCoRE では,検索語を含む英文とそれに対応す る日本語訳が一画面に表示されるので,英語と日本 ...

12

HOKUGA: 対訳コーパスを用いた多言語間格フレーム対の自動獲得のための名詞句対の自動抽出手法

HOKUGA: 対訳コーパスを用いた多言語間格フレーム対の自動獲得のための名詞句対の自動抽出手法

... tour”先頭と末尾単語と一致し,かつ,名詞句対日本語部分“ツアー”が対訳文3 日本文中に存在するため,対訳文3が対訳コーパスより選択される.次いで,対訳文3英文 名詞句“a night tour”に対応する部分を日本文中より決定する.日本文においては“ツア ...

10

Show all 10000 documents...

関連した話題