• 検索結果がありません。

検索インターフェース

N/A
N/A
Protected

Academic year: 2021

シェア "検索インターフェース"

Copied!
2
0
0

読み込み中.... (全文を見る)

全文

(1)

国立国語研究所学術情報リポジトリ

現代日本語統語・意味解析コーパス(NPCMJ)の概 要と検索

著者 パルデシ プラシャント, 長崎 郁, 鈴木 彩香

URL http://doi.org/10.15084/00003186

(2)

現代日本語統語・意味解析コーパス( NPCMJ)の概要と検索

プラシャント・パルデシ(国立国語研究所) 長崎郁(名古屋大学) 鈴木彩香(国立国語研究所)

►NINJAL Parsed Corpus of Modern Japanese (NPCMJ)

文の構造や意味に関する詳細な情報が付与された言語資料

日本語の様々なタイプの文を検索し、言語研究に役立て ることができる

国立国語研究所で2016年4月から開発開始

http://npcmj.ninjal.ac.jp/

上記ウェブサイトから全文データのダウンロード・各検索イン ターフェースが利用できる

2020年3月現在、4万文を無償公開中

毎年1万文追加、プロジェクト終了(2022年3月)までに 6万文公開予定

参考文献:益岡隆志・田窪行則(1992)『基礎日本語文法』(くろしお出版)† 本研究は国立国語研究所「統語・意味解析コーパスと言語研究」プロジェクトの支援を受けています

出典 文数

青空文庫 9,561

聖書 1,664

その他の小説の抜粋 923 ノンフィクション 223 書籍の一部 553 ウィキペディア 2,556

新聞記事 4,777

法律文 337

国会議事録 1,698 テッドトーク 1,453

教科書 6,953

辞書 5,362

その他 2,389

合計 40,831

NPCMJ とは データの出典(2020年3月時点)

統語分析 意味解析

名詞が持つ指示がどのように 受けつがれるかがわかる

省略された主語や

目的語もわかるよう になっている

品詞、句、それらの修飾関係 や、主語・目的語といった句 のはたらきがわかる

どの述語がどの要素(項・副詞)と 関係を持つかがわかる

►NPCMJ Explorer Pattern Browse ►NPCMJ Search ツリー検索

日本語のいくつかの主要な文法項目に対して、それ を調べるための検索式が用意されている

項目名をクリックするだけでコーパス中の用例を見 ることができる(http://npcmj.ninjal.ac.jp/explorer/)

自分で検索式を書いて、コーパス中の用例を調べる ことができる

たとえば…

「の」でマークされた主語

検索インターフェース

初中級者向け 中上級者向け

►文字列検索や、検索式の作成を補助するインターフェース などもある(http://npcmj.ninjal.ac.jp/interfaces/)

益岡・田窪

(1992)の節項目

用意されている

検索式を確認し、

ツリー検索に ジャンプする こともできる

『主語となる助 詞句(PP-SBJ)

が、「の」を

支配する格助詞

(P-ROLE)を 支配している』

参照

関連したドキュメント

以上の説明において,検索者はコンビュータか らの質問,“z は貴方の考えている内容に含まれる かヘに Yes

検索の使われ方がまったく異なる 項目 従来の情報検索 検索エンジン ユーザー サーチャー 初心者 検索語 吟味した検索式 思い付いた1,2語

テーマ地図検索の機能 テーマ地図検索は,約 84,000 項目,SGML タグをあわ せて 160 MB という世界大百科事典の 書 誌情報だけでなく テキスト全文から,地名 と検索語とが近接して出現する文を検索 し,それを地域によってソートして表形式で 出力する 図1. 検索質問はつぎの 3 つのくみあわせ and で指定される: 1 検索語 and/or

キー ワー ド検索モデルは,テキス ト内容 を代表す るキー ワー ドをキー として検索を行 うモデルで,情 報検索 システムで従来か ら多 く用 い

(例:1階ブラウジングコー ナー)を指定しての検索、出 版年とキーワードを組み合わ

9 4.論文検索 国内論文を対象に検索する機能です。

検索を行うごとに、検索内容の履歴が表示 されていきます。その履歴をもとに再検索した

本稿で提案するリランキングインタフェース Ensemble Search が効果を発揮し、有効的に機 能する場面について説明する。 Ensemble