• 検索結果がありません。

〈プロジェクト紹介〉超大規模コーパス構築プロジェクト 日本語Webコーパスの構築 : 利活用

N/A
N/A
Protected

Academic year: 2021

シェア "〈プロジェクト紹介〉超大規模コーパス構築プロジェクト 日本語Webコーパスの構築 : 利活用"

Copied!
11
0
0

読み込み中.... (全文を見る)

全文

Loading

表 1 日本語 Web コーパスの収集 収集時期 2012-4Q 2013-1Q 2013-2Q 2013-3Q 収集 WARC ファイル数 814 870 910 905 URL 数 61,668,805 58,844,092 61,479,268 57,892,917 語数(IPADIC)  (日本語文抽出なし) 64,714,650,129 647 億語 62,077,520,745620億語 63,414,252,638634億語 65,736,027,334657 億語  語数(IPADIC)  
図 1 N-gram 検索系(左:Fixed 3-gram,右:Fixed 7-gram)

参照

関連したドキュメント

 さて,日本語として定着しつつある「ポスト真実」の原語は,英語の 'post- truth' である。この語が英語で市民権を得ることになったのは,2016年

1、研究の目的 本研究の目的は、開発教育の主体形成の理論的構造を明らかにし、今日の日本における

 本校は,2019年度から文部科学省WWL(ワール

M…剛曰劉Ⅱ 、=3 2)TBAF 1)Bu3SnH ,鍼:苧 ace トトト 123 mm、 一一一一一一 111 ?99 bdf ●●●●。● nnn コ聿罰

FSIS が実施する HACCP の検証には、基本的検証と HACCP 運用に関する検証から構 成されている。基本的検証では、危害分析などの

平成 28 年度は発行回数を年3回(9 月、12 月、3

つまり、p 型の語が p 型の語を修飾するという関係になっている。しかし、p 型の語同士の Merge

利用者 の旅行 計画では、高齢 ・ 重度化 が進 む 中で、長 距離移動や体調 に考慮した調査を 実施 し20名 の利 用者から日帰