Top PDF 高性能な自然言語処理・AIシステム

自然言語処理20_657

... 事象表現間の時間的順序関係アノテーション保田祥 † ・小西光 † ・浅原正幸 † ・今田水穂 † ・前川喜久雄 † 時間情報抽出は大きく分けて時間情報表現抽出，時間情報正規化，時間的順序関係解析の三つのタスクに分類される．一つ目の時間情報表現抽出は，固有表現・数値表現抽出の部分問題として解かれてきた．二つ目の時間情報正規化は書き換え系により解かれることが多い．三つ目のタスクである時間的順序関係解析は，事象の時 ...

25

自然言語処理16_2_45

... 5 おわりにデータベースという概念には様々な意味があり，本来は区別して扱うべき機能や仕組みなどが混同されて用いられることがある．例えば，様々な教材そのものを蓄積し，必要なものを必要な時に自由に取り出せるような仕組みを「教材データベース」と呼ぶことがある．また表計算ソフト上で様々な学習項目などを整理したものを「データベース」と呼ぶこともある．本稿 ...

14

自然言語処理16_5_79

... 4.1 の語句のリストに事態「付く」が含まれているため，事態「付く」を含む事態対「付く::肉を焼く」と「付く::焼く」を無効な事態対とみなすことができ，事態対「焦げ目が付く::肉を焼く」と「焦げ目が付く::焼く」を事態対候補とすることができる．仮に「付く」が 4.1 の語句のリストに含まれていかったとしても，「焦げ目が付く::肉を焼く」と「焦げ目が付く::焼く」には高い信頼度が与えられ， ...

22

PDFファイル 3I4 「自然言語処理におけるコーパス・辞書生成」

... は統計的機械翻訳手法である．両手法に共通する問題点としては，機械翻訳が扱う対象の自然言語には曖昧性や例外が多分に含まれているということがある．前者の手法は，言語間の翻訳規則を恣意的に定める．しかし，全ての翻訳規則を網羅的に記述することが難しいという欠点がある．これに対して，後者の手法は，翻訳規則を統計的・確率的に定める．これによって， ...

4

自然言語処理におけるDeep Learning

... CNN/Daily Mailデータの解析 (Chen+ 16) • Attentive Reader (Hermann+ 15) のアテンションの取り方を変えるだけで性能が大きく向上 • ノイジーなデータのため，これ以上の性能向上の見込みは低い ...

53

PDFファイル 3I3 「自然言語処理による文書要約」

... しかし，式 (2) の値が最小となる文の並び順を見つけることは巡回セールスマン問題に等しく， NP 困難と呼ばれる問題のクラスに属するため，実用的な時間で見つけることが困難である．そこで本研究では，文の並び順には，文 s i の元の文書での出現位置を用いる．要約候補の複数の文のうち，元の文書での出現位置が最も早いものを 1 番目の文として， 1 番目の文と類似度の高いものを 2 ...

3

木オートマトン•トランスデューサによる自然言語処理

... • 合成について好意的な結論は無い • 前向き適用は線形のみの場合でも正規性を保存する • wxFTT ↓に対して合成を使わない適用演算の開発 [May et. al. 10] • 線形wxFTT ↓を経由した前向き適用が可能 ...

113

学位論文首都大学東京自然言語処理研究室（小町研）

... 本研究における実験では，英語学習者作文の文法誤り検出タスクにおいて， E&GWE で学習した単語分散表現で初期化した Bi-LSTM を用いた結果，世界最高精度を達成した．さらに，我々は大規模な英語学習者コーパスである Lang-8 を使った実験も行った．その結果，文法誤り検出においてノイズを含むコーパスからは誤りパターンを抽出して学習することが有効であることが示された．さらに，従来手法の C&W ...

39

自然言語処理19_3

... して広範囲な下位概念をカバーするものや，意味的に曖昧なものが存在するという問題が見られる．例えば「作品 → 七人の侍」における上位概念は「作品」だが，世の中には「作品」と呼べる物が数多く存在する．さらに極端な例として，上位概念が「物」や「事」になっている上位下位関係も，自動で獲得されてしまう可能性がある．このような上位概念を質問応答などの自 ...

21

自然言語処理21_125

... により会議録サイト 4 が整備されており，第 1 回国会（昭和 22 年）以降のすべての会議録がテキストデータとして公開され，検索システムによって検索を行うことができる．一方で，地方議会会議録の場合，全ての自治体の会議録をまとめているサイトは存在せず，自治体ごとに参照する必要がある．加えて，自治体により Web 上で公開されている形式が異なることが多いため， ...

31

自然言語処理24_705

... 3 評価実験一般に分散表現の評価法には単語間類似度の観点からのものと，分散表現を用いたタスクの精度の観点からのものが存在する．単語間類似度から nwjc2vec を評価したものとして，分類語彙表との対応をみた評価が報告されている (浅原，岡 2017)．そこでは主観的な評価ではあるが，nwjc2vec が高品質であることが示されている．ここでは更に定量的な評価を行うために， ...

16

学位論文首都大学東京自然言語処理研究室（小町研）

... を要約する手法を提案している． Forbes ら [4] は，レシピの推薦における Matrix Factorization の有効性を検証している． Wang ら [29] は，中国語のレシピに対して，類似するレシピを検索する手法を提案している．一般的に，レシピを構成する文の多くは構文的に簡易に記述されているものの，解析が困難な場合がある．例えば，あるレシピを構成する手順を対象とした場合， ...

46

PDFファイル 2A1 「自然言語処理」

... 2.1 視覚探索速度のよる可読性の測定人間の利用者にとっての色遣いの適切さを客観的に測定できる尺度は筆者らの検討した範囲では，未だに見出されていないといえる．本研究では，テキス中での色遣いを評価する指標として，視覚探索(visual search)問題[Theeuwes 1992]として取り扱うこととした．すなわち，色付けされているテキストに対して，その中から短い文字列を探索する検索時間によって色遣いの有 ...

2

PDFファイル 2A1 「自然言語処理」

... PASCAL RTE は、テキスト間含意関係認識の評価タスクで提供されているデータであり、新聞などのテキストから「根拠テキスト - 仮説文」ペアを作成したものである。このような実世界のテキストを使った評価データでは、言い換えパタンのバリエーションが非常に大きいため、辞書などから抽出した言語知識だけを使って厳密な証明を試みようとするとほとんどの例は証明できない。そのため、我々は動的知識生成のコンポー ...

4

PDFファイル 2A1 「自然言語処理」

... 本稿では，文書に含まれるトピックに着目した自動タグ付与 システムの検討を行う．システムでは，事前にタグ付き文書を用意することなく，各文書の内容に適したタグの付与を行うことを目指す．そこで，各文書から最も出現するトピックと，そのトピックに特徴的な単語の情報を用いて文書中の単語を抽出 ...

4

PDFファイル 3I4 「自然言語処理におけるコーパス・辞書生成」

... 。このような評価極性がないと思われる単語を削除するため、本手法ではニューラルネットワーク言語モデルを用いる。ニューラルネットワーク言語モデルでは、テキストコーパスを用いて単語をベクトルの形で表現することができる。そして、線形演算により単語間の関係を把握できることが知られている [Mikolov 13] ...

2

学位論文首都大学東京自然言語処理研究室（小町研）

... 類タスクにおいて分類精度の向上に取り組んだ。 1 はじめに近年、インターネットや SNS の普及によって、ユーザが商品やサービスなどの情報を自由に発信する機会が増大した。中でも、ユーザのレビュー文やツイッターのテキストはユーザの生の声を含むため、企業などにとっては貴重なものである。そのため大量にあるこれらのデータを解析し自動で評価極性を決定することは、より良い商品やサービスを提 ...

13

PDFファイル 3D4 「教育支援におけるテキスト・自然言語処理」

... また、柴崎らの方法と同様に、外れ値を除くなどの処理を行えば、更に高い精度が得られる可能性もある。なお、全コーパスを学習に用いて導出した重回帰式は、式 (2) の通りである ∗4 。ただし、式 (2) において、 Y = 難易度クラス、 X  = テキスト全体のひらがなの割合、 X  = 1 文の平均述語数である。 ...

4

自然言語処理23_175

... 西野正彬 † ・鈴木潤 † ・梅谷俊治 †† ・平尾努 † ・永田昌明 † 2 つの系列が与えられたときに，系列の要素間での対応関係を求めることを系列アラインメントとよぶ．系列アラインメントは，自然言語処理分野においても文書対から対訳関係にある文のペアを獲得する対訳文アラインメント等に広く利用される．既存の系列アラインメント法は，アラインメントの単調性を仮定する方法か，もし ...

20

自然言語処理23_59

... に基づく，現時点で最も複雑な雑談 システムの 1 つであり，少なくとも網羅性については他のシステムを利用した場合と同等かそれ以上，確保できていると考えている．今後，他の雑談システムを使い，本論文で示した方法でデータの収集とアノテーション・分析を行っていくことで，破綻の分布の普遍性を高め，現 ...

28

高性能な自然言語処理・AIシステム

関連した話題