• 検索結果がありません。

高性能な自然言語処理・AIシステム

自然言語処理20_657

自然言語処理20_657

... 事象表現間の時間的順序関係アノテーション 保田 祥 † ・小西 光 † ・浅原 正幸 † ・今田 水穂 † ・前川喜久雄 † 時間情報抽出は大きく分けて時間情報表現抽出,時間情報正規化,時間的順序関係 解析の三つのタスクに分類される.一つ目の時間情報表現抽出は,固有表現・数値 表現抽出の部分問題として解かれてきた.二つ目の時間情報正規化は書き換え系に より解かれることが多い.三つ目のタスクである時間的順序関係解析は,事象の時 ...

25

自然言語処理16_2_45

自然言語処理16_2_45

... 5 おわりに データベースという概念には様々意味があり,本来は区別して扱うべき機能や仕組みなど が混同されて用いられることがある.例えば,様々教材そのものを蓄積し,必要ものを必 要時に自由に取り出せるよう仕組みを「教材データベース」と呼ぶことがある.また表計 算ソフト上で様々学習項目などを整理したものを「データベース」と呼ぶこともある.本稿 ...

14

自然言語処理16_5_79

自然言語処理16_5_79

... 4.1 の語句のリストに事態「付く」が含まれているため,事態「付く」を含む事態対「付く::肉 を焼く」と「付く::焼く」を無効事態対とみなすことができ,事態対「焦げ目が付く::肉を焼 く」と「焦げ目が付く::焼く」を事態対候補とすることができる.仮に「付く」が 4.1 の語句の リストに含まれていかったとしても, 「焦げ目が付く::肉を焼く」と「焦げ目が付く::焼く」には 高い信頼度が与えられ, ...

22

PDFファイル 3I4 「自然言語処理におけるコーパス・辞書生成」

PDFファイル 3I4 「自然言語処理におけるコーパス・辞書生成」

... は統計的機械翻訳手法である.両手法に共通する問題点として は,機械翻訳が扱う対象の自然言語には曖昧性や例外が多分に 含まれているということがある.前者の手法は,言語間の翻訳 規則を恣意的に定める.しかし,全ての翻訳規則を網羅的に記 述することが難しいという欠点がある.これに対して,後者の 手法は,翻訳規則を統計的・確率的に定める.これによって, ...

4

自然言語処理におけるDeep Learning

自然言語処理におけるDeep Learning

... CNN/Daily Mailデータの解析 (Chen+ 16) • Attentive Reader (Hermann+ 15) のアテンションの取り方を変 えるだけで性能が大きく向上 • ノイジーデータのため, これ以上の性能向上の見込みは低い ...

53

PDFファイル 3I3 「自然言語処理による文書要約」

PDFファイル 3I3 「自然言語処理による文書要約」

... しかし,式 (2) の値が最小となる文の並び順を見つけること は巡回セールスマン問題に等しく, NP 困難と呼ばれる問題の クラスに属するため,実用的時間で見つけることが困難であ る.そこで本研究では,文の並び順には,文 s i の元の文書で の出現位置を用いる.要約候補の複数の文のうち,元の文書で の出現位置が最も早いものを 1 番目の文として, 1 番目の文と 類似度の高いものを 2 ...

3

木オートマトン•トランスデューサによる 自然言語処理

木オートマトン•トランスデューサによる 自然言語処理

... • 合成について好意的結論は無い • 前向き適用は線形のみの場合でも正規性を保存する • wxFTT ↓に対して合成を使わない適用演算の開発 [May et. al. 10] • 線形wxFTT ↓を経由した前向き適用が可能 ...

113

学位論文  首都大学東京 自然言語処理研究室(小町研)

学位論文 首都大学東京 自然言語処理研究室(小町研)

... 本研究における実験では,英語学習者作文の文法誤り検出タスクにおいて, E&GWE で学習した単語分散表現で初期化した Bi-LSTM を用いた結果,世界最 高精度を達成した.さらに,我々は大規模英語学習者コーパスである Lang-8 を 使った実験も行った.その結果,文法誤り検出においてノイズを含むコーパスから は誤りパターンを抽出して学習することが有効であることが示された.さらに,従 来手法の C&W ...

39

自然言語処理19_3

自然言語処理19_3

... して広範囲下位概念をカバーするものや,意味的に曖昧ものが存在するという問題が見ら れる.例えば「作品 → 七人の侍」における上位概念は「作品」だが,世の中には「作品」と呼 べる物が数多く存在する.さらに極端例として,上位概念が「物」や「事」になっている上位 下位関係も,自動で獲得されてしまう可能性がある.このよう上位概念を質問応答などの自 ...

21

自然言語処理21_125

自然言語処理21_125

... により会議録サイト 4 が整備されており,第 1 回国会(昭和 22 年)以降のすべての会議録がテキ ストデータとして公開され,検索システムによって検索を行うことができる.一方で,地方議 会会議録の場合,全ての自治体の会議録をまとめているサイトは存在せず,自治体ごとに参照す る必要がある.加えて,自治体により Web 上で公開されている形式が異なることが多いため, ...

31

自然言語処理24_705

自然言語処理24_705

... 3 評価実験 一般に分散表現の評価法には単語間類似度の観点からのものと,分散表現を用いたタスクの 精度の観点からのものが存在する.単語間類似度から nwjc2vec を評価したものとして,分類 語彙表との対応をみた評価が報告されている (浅原,岡 2017).そこでは主観的評価ではある が,nwjc2vec が高品質であることが示されている.ここでは更に定量的評価を行うために, ...

16

学位論文  首都大学東京 自然言語処理研究室(小町研)

学位論文 首都大学東京 自然言語処理研究室(小町研)

... を要約する手法を提案している. Forbes ら [4] は,レシピの推薦における Matrix Factorization の有効性を検証している. Wang ら [29] は,中国語のレシピに対し て,類似するレシピを検索する手法を提案している. 一般的に,レシピを構成する文の多くは構文的に簡易に記述されているものの, 解析が困難場合がある.例えば,あるレシピを構成する手順を対象とした場合, ...

46

PDFファイル 2A1 「自然言語処理」

PDFファイル 2A1 「自然言語処理」

... 2.1 視覚探索速度のよる可読性の測定 人間の利用者にとっての色遣いの適切さを客観的に測定で きる尺度は筆者らの検討した範囲では,未だに見出されてい いといえる.本研究では,テキス中での色遣いを評価する指標 として,視覚探索(visual search)問題[Theeuwes 1992]として取り 扱うこととした.すなわち,色付けされているテキストに対して,そ の中から短い文字列を探索する検索時間によって色遣いの有 ...

2

PDFファイル 2A1 「自然言語処理」

PDFファイル 2A1 「自然言語処理」

... PASCAL RTE は、テキスト間含意関係認識の評価タスク で提供されているデータであり、新聞などのテキストから「根 拠テキスト - 仮説文」ペアを作成したものである。このよう 実世界のテキストを使った評価データでは、言い換えパタンの バリエーションが非常に大きいため、辞書などから抽出した言 語知識だけを使って厳密証明を試みようとするとほとんどの 例は証明できない。そのため、我々は動的知識生成のコンポー ...

4

PDFファイル 2A1 「自然言語処理」

PDFファイル 2A1 「自然言語処理」

... 本稿では,文書に含まれるトピックに着目した自動タグ付与 システムの検討を行う.システムでは,事前にタグ付き文書を 用意することなく,各文書の内容に適したタグの付与を行うこ とを目指す.そこで,各文書から最も出現するトピックと,そ のトピックに特徴的単語の情報を用いて文書中の単語を抽出 ...

4

PDFファイル 3I4 「自然言語処理におけるコーパス・辞書生成」

PDFファイル 3I4 「自然言語処理におけるコーパス・辞書生成」

... 。このよう 評価極性がないと思われる単語を削除するため、本手法では ニューラルネットワーク言語モデルを用いる。 ニューラルネットワーク言語モデルでは、テキストコーパス を用いて単語をベクトルの形で表現することができる。そし て、線形演算により単語間の関係を把握できることが知られて いる [Mikolov 13] ...

2

学位論文  首都大学東京 自然言語処理研究室(小町研)

学位論文 首都大学東京 自然言語処理研究室(小町研)

... 類タスクにおいて分類精度の向上に取り組んだ。 1 はじめに 近年、インターネットや SNS の普及によって、ユーザが商品やサービスなどの情報を 自由に発信する機会が増大した。中でも、ユーザのレビュー文やツイッターのテキストは ユーザの生の声を含むため、企業などにとっては貴重ものである。そのため大量にある これらのデータを解析し自動で評価極性を決定することは、より良い商品やサービスを提 ...

13

PDFファイル 3D4 「教育支援におけるテキスト・自然言語処理」

PDFファイル 3D4 「教育支援におけるテキスト・自然言語処理」

... また、柴崎らの方法と同様に、外れ値を除くなどの処理を行え ば、更に高い精度が得られる可能性もある。 なお、全コーパスを学習に用いて導出した重回帰式は、式 (2) の通りである ∗4 。ただし、式 (2) において、 Y = 難易度ク ラス、 X  = テキスト全体のひらがの割合、 X  = 1 文の平 均述語数 である。 ...

4

自然言語処理23_175

自然言語処理23_175

... 西野 正彬 † ・鈴木 潤 † ・梅谷 俊治 †† ・平尾 努 † ・永田 昌明 † 2 つの系列が与えられたときに,系列の要素間での対応関係を求めることを系列ア ラインメントとよぶ.系列アラインメントは,自然言語処理分野においても文書対 から対訳関係にある文のペアを獲得する対訳文アラインメント等に広く利用される. 既存の系列アラインメント法は,アラインメントの単調性を仮定する方法か,もし ...

20

自然言語処理23_59

自然言語処理23_59

... に基づく,現時点で最も複雑雑談 システムの 1 つであり,少なくとも網羅性については他のシステムを利用した場合と同等かそ れ以上,確保できていると考えている.今後,他の雑談システムを使い,本論文で示した方法 でデータの収集とアノテーション・分析を行っていくことで,破綻の分布の普遍性を高め,現 ...

28

Show all 10000 documents...

関連した話題