• 検索結果がありません。

自然言語はなぜコンピュータにとって

学位論文  首都大学東京 自然言語処理研究室(小町研)

学位論文 首都大学東京 自然言語処理研究室(小町研)

... 行に含まれる文数が日本語側と英語側で一致すると 限らない.このような対訳文学習を妨げうる.例えば,日本語側 2 文,英語 3 文といった対訳文を学習時に用いると,やはり多くの文文対応が取れているため に,影響を受けてしまい最終的に得られるモデルの翻訳精度が下がってしまう.そ こで行うのが,こうした対訳文を排除する前処理である.日本語側の各手順文を句 ...

46

自然言語処理16_2_45

自然言語処理16_2_45

... Perl 言語を用いたテキスト処理などでさえも,その実行環境をインストー ルするといった時点で一般の英語教員のコンピュータ利用スキルからすれば十分にハードルが 高いこと間違いない.また「UNIX 環境」といった文言でさえ,一般の英語教員を遠ざける に十分な材料となる.これらのアプリケーションが CGI などを介して Web 上で提供される ...

14

自然言語処理16_5_79

自然言語処理16_5_79

... わかる.この結果,事態対「焦げ目が付く::肉を焼く」を機械的に獲得することができる.この 事態対,人間であれば「肉を焼いたら焦げ目が付く」という行為―効果関係であると解釈す ることができるため,事態間関係になりうる正しい事態対である.また,「焼く」の格「肉を」 を事態に含めない場合に獲得できる事態対「焦げ目が付く::焼く」であり,この事態対も行為 ...

22

自然言語処理19_3

自然言語処理19_3

... 下位概念(映画のタイトルなどのインスタンスを含む)を既存のシソーラスの「映画」の位置 に追加することができる. そこで予備実験として,本提案手法で獲得した G-上位概念のうち最頻出の 20 概念に対して 簡潔な言い換え表現を手作業で作成し,それらによって上位概念が言い換えられた G-上位下位 関係の適合率を評価した.表 6 に,G-上位概念とその言い換え表現の例を挙げる.言い換え対 象の 20 の G-上位概念を含む ...

21

自然言語処理21_125

自然言語処理21_125

... 「議会名」 議会ごとの検索のため, 「議会種別コード」市町村によって名称の違う議会名を分類するため にそれぞれ必要となる.「年度」 , 「回」 , 「月」 , 「号」 , 「日付」について時間情報として重要な ため必要である.「表題」ページのタイトルとして, 「段落番号」段落ごとの抽出を容易にす ...ID」 ...

31

PDFファイル 2A1 「自然言語処理」

PDFファイル 2A1 「自然言語処理」

... 1. はじめに 近年,インターネットの普及により,様々な人々が自由に 情報の収集や発信を行うことが可能となっている.特に,価 格 .com ∗1 , Amazon.co.jp ∗2 などの通販サイトで,様々な商 品に対する消費者の感想や評価が大量に投稿・公開されてい る.企業や消費者,それら投稿された文書を読むことで,有 益な情報を得ることができる.例えば,企業にとって,消費 ...

4

PDFファイル 2A1 「自然言語処理」

PDFファイル 2A1 「自然言語処理」

... 2. 色と文書可視性について 適切に色遣いがなされた文書可視性が高いことあきらか である.色の使い方に関する研究配色理論や色彩論など[ヨ ハネスイッテン 1971]として,非常に古くからの研究がある.しか し,これらの研究成果絵や図を主体とするヴィジュアル性の高 い文書に適用可能であっても,テキスト情報が主体となる教 ...

2

自然言語処理24_705

自然言語処理24_705

... 用して人間の主観評価とのスピアマン順位相関係数を算出する.第二の評価実験で ,タスクに基づく評価として,nwjc2vec を用いて語義曖昧性解消及び回帰型ニュー ラルネットワークによる言語モデルの構築を行う.どちらの評価実験においても, 新聞記事 7 年分の記事データから構築した分散表現を用いた場合の結果と比較する ことで,nwjc2vec ...

16

PDFファイル 2A1 「自然言語処理」

PDFファイル 2A1 「自然言語処理」

... 一方、全ての論理式を FOL 式に変換し、 FOL 自動証明器 Prover9 ∗1 を使った証明を試みた。その結果を表 3 に示す。 3 秒 以内の時間制限を設けると、証明できたのわずか 8% である (「 3 秒以内」の列)。時間制限を 5 分間に伸ばしても、 16% し か証明することができなかった(「 5 分以内」の列)。これ、 通常の FOL ...

4

PDFファイル 1A2 「自然言語処理」

PDFファイル 1A2 「自然言語処理」

... 北朝時代 ( 日本 ) へとリンキングできていれば,そのエントリ から言語間リンクによってリンクされている英語 Wikipedia のエントリ http://en.wikipedia.org/wiki/Nanboku-ch% C5%8D period ∗3 を求めることにより,上記の表現のリンキン グ先として設定できる可能性がある. ...

4

PDFファイル 3I3 「自然言語処理による文書要約」

PDFファイル 3I3 「自然言語処理による文書要約」

... step iv. r = r + 1 とし, step i へ戻る.全ての個体に混 雑度が与えられるまで step i. ∼ step iv. を繰り返す. step 5. 新たな子母集団 Q t を生成 親母集団 P t を基に,混雑度トーナメント選択,交叉率 1.0 で交叉,突然変異率 0.1 で突然変異を行い,個体数 50 の 新たな子母集団 Q t を生成する.交叉で,一点交叉を行 ...

3

PDFファイル 1A2 「自然言語処理」

PDFファイル 1A2 「自然言語処理」

... なお、解析対象となる文章の長さが短いため、係り受け関係 の文法上の種類の区別を行っていない。 3. 本文の現状分析 READYFOR に、文章を書き資金を調達しプロジェクト を実施したいと思っている「実行者」が実施する「プロジェク ト」を公開するまでのプロセスとして、実行者が「プロポーザ ル」と呼ばれる簡単な企画書を提出の上、 READYFOR のス タッフによりサービスに対して適切で無いような企画でない ...

3

PDFファイル 3I3 「自然言語処理による文書要約」

PDFファイル 3I3 「自然言語処理による文書要約」

... 近年,大量の文書データと接する機会の増加にともない,文 書要約技術の必要性が高まっている.文書要約の一手法として は,要約生成問題を文の組合せ最適化問題として帰着させる方 法がある.最適化手法としては,動的計画法や分岐限定法など の厳密解法を用いた研究が多い.しかし,厳密解法には,要約 対象とする文書集合の大きさに従って,計算時間が膨大に膨れ 上がってしまうという問題が[r] ...

4

PDFファイル 3I3 「自然言語処理による文書要約」

PDFファイル 3I3 「自然言語処理による文書要約」

... The 28th Annual Conference of the Japanese Society for Artificial Intelligence, 2014 に高くなり, Precision 低くなったが結果的に要約精度が向 上したものと思われる.また,整数線形計画法 ( 要約率固定 ) の精度が低いの,投稿番号コスト制約がないためであると思 ...

4

学位論文  首都大学東京 自然言語処理研究室(小町研)

学位論文 首都大学東京 自然言語処理研究室(小町研)

... 類タスクにおいて分類精度の向上に取り組んだ。 1 はじめに 近年、インターネットや SNS の普及によって、ユーザが商品やサービスなどの情報を 自由に発信する機会が増大した。中でも、ユーザのレビュー文やツイッターのテキスト ユーザの生の声を含むため、企業などにとって貴重なものである。そのため大量にある ...

13

自然言語処理23_195

自然言語処理23_195

... 誤用タグ付与を目指し,誤用タイプの自動分類に向けた実験を試みる.学習者の作文における誤用 についてフィードバックを行ったり,調査分析したりすること,学習者に同じ誤りを犯させない ようにするために必要であり,学習者に自律的な学習を促すことができる (Holec 1981; 梅田 2005). そのため,学習者の例文を誤用タイプ別に分類し,それぞれの誤用タイプにタグを付与した例文検 ...

31

自然言語処理22_289

自然言語処理22_289

... 目的 言語 e」又は「e → f」)を持ち,各方向のモデル独立に学習,使用される.ここで,学習され る特徴方向毎に異なり,それら相補的であるとの考えに基づき,各方向の合意を取るよう にモデルを学習することによりアラインメント精度が向上することが示されている (Matusov, Zens, and Ney 2004; Liang, Taskar, and Klein 2006; ...

24

自然言語処理23_175

自然言語処理23_175

... 本論文で系列の連続性を考慮しつつ,かつ非単調な系列アラインメントを求めるための手 法を提案する.このような系列アラインメント法,単調性を仮定できない文書対の対訳文ア ラインメントを求める際に特に有効であると考える.仮に文書 F の文が E の任意の文と対応し てもよいとすれば,ある文のペアの良さを評価するスコアを適切に設定することによって,問 題を二部グラフにおける最大重みマッチング問題 (Korte ...

20

自然言語処理23_59

自然言語処理23_59

... これまで人・機械の雑談対話を体系的に収集し,整備したコーパス存在せず,今回の収集 初の試みである.今回構築したコーパス中の雑談対話,1 つの雑談システムだけを用いて 収集したものであるので,破綻の種類の網羅性やその分布の普遍性について言えることに限 りがあるが,システム構築に使用した雑談 API (Higashinaka, Imamura, Meguro, ...

28

自然言語処理20_657

自然言語処理20_657

... BCCWJ にコアデータと呼ばれる約 110 万語からなる部分集合が設定されている.コアデー タに人手により国語研規程の短単位・長単位単語境界,UniDic 品詞体系に基づく形態論情報, 文節境界などが付与されている.コアデータ生産サブコーパスから書籍 (PB)・雑誌 (PM)・ 新聞 (PN) が,特定目的サブコーパスから白書 (OW)・Yahoo!知恵袋 (OC)・Yahoo!ブログ ...

25

Show all 10000 documents...

関連した話題