• 検索結果がありません。

自然言語処理の考え方

自然言語処理20_657

自然言語処理20_657

... 本語書き言葉均衡コーパス』(BCCWJ) 新聞記事部分集合に対して,動詞・形 容詞事象表現に TimeML <EVENT> 相当タグを付与し,その事象性質に基づき 分類を行った.また,この事象表現と先行研究 (小西,浅原,前川 2013) により付 与されている時間情報表現と関係として,TimeML ...

25

自然言語処理16_5_79

自然言語処理16_5_79

... 4.1 語句リストに事態「付く」が含まれているため,事態「付く」を含む事態対「付く::肉 を焼く」と「付く::焼く」を無効な事態対とみなすことができ,事態対「焦げ目が付く::肉を焼 く」と「焦げ目が付く::焼く」を事態対候補とすることができる.仮に「付く」が ...4.1 語句 リストに含まれていかったとしても, 「焦げ目が付く::肉を焼く」と「焦げ目が付く::焼く」には ...

22

PDFファイル 1A2 「自然言語処理」

PDFファイル 1A2 「自然言語処理」

... 18 ように、平 均値に大きな隔たりがありながら成立した最終稿本文 分散値が不成立それに比べて著しく小さい場合には、その抽 象クラス読み手に対する効果について適切量があるでは ないかと考えられる。そのため、新しいプロジェクト文章を 推敲する場合には、その抽象クラス番号値を可能な範囲で成 ...

3

統計的自然言語処理におけるMCMC法

統計的自然言語処理におけるMCMC法

... • 観測された単語裏には何もないか? – ソシュール「範列」(paradigme)考え方! “Most of the confidences were unsought—frequently I have feigned sleep, preoccupation, or a hostile levity when I realized by some ...

49

木オートマトン•トランスデューサによる 自然言語処理

木オートマトン•トランスデューサによる 自然言語処理

... FTT ↓合成方法 [Baker 79] • 2つFTT ↓ M 1 = {Q,Σ,Γ,I 1 , R 1 }とM 2 = {P,Γ,∆,I 2 , R 2 } • M 1 出力記号集合 ΓとM 2 入力記号集合 Γは同一 • FTT ↓合成 M 1 ◦ M 2 = {P × Q,Σ,∆,I 2 × I 1 , R }: ...

113

PDFファイル 3I4 「自然言語処理におけるコーパス・辞書生成」

PDFファイル 3I4 「自然言語処理におけるコーパス・辞書生成」

... 1 SSL(699) で表す。 この結果より、センチメント辞書に登録される単語数が同 じ場合に、半教師学習閾値を修正する手法より、ニューラル ネットワーク言語モデルを組み合わせた方が正しく推定された 評価極性単語を残しつつ、評価極性がない単語を効率的に削 除できていることが分かる。閾値調整手法では共起頻度のみ ...

2

自然言語処理におけるDeep Learning

自然言語処理におけるDeep Learning

... 平均による句ベクトル近似理論解析 (Tian+ 2017) • 単語ベクトル一般形として次式を考える 𝑚𝑚 𝑤𝑤,𝑐𝑐 = 𝛾𝛾 ⋅ 𝐹𝐹 𝑃𝑃 𝑐𝑐 𝑤𝑤 − 𝛼𝛼 𝑐𝑐 − 𝛽𝛽(𝑤𝑤) • PPMI, Skip-gram, GloVeはこの形で表される ...

53

PDFファイル 3I3 「自然言語処理による文書要約」

PDFファイル 3I3 「自然言語処理による文書要約」

... これら実験により,整数線形計画法は文書要約だけでなく, BBS 要約においても有効であることがわかった.また, BBS 要約全般において投稿番号コスト制約が有効であるとは一般に は考えにくいが,本研究において「まとめサイト」を正解デー タとした場合には非常に有効であることがわかった. ...

4

自然言語処理16_2_45

自然言語処理16_2_45

... Scientists say they have made more progress 1. ( hinput okWord=”in”i) developing malaria- resistant mosquitoes. The idea is to 2.( hinput okWord=”release”i) genetically engineered insects like these into mosquito 3. ( ...

14

PDFファイル 3I4 「自然言語処理におけるコーパス・辞書生成」

PDFファイル 3I4 「自然言語処理におけるコーパス・辞書生成」

... や,英語とフランス語コーパスに関して,彼らは,高い精度 パラレルコーパス生成に成功した.しかし,英語と中国語 コーパスなど全く異質な言語同士では高い精度は得られな かった.その理由としては,綴り字情報が単語素性ベクトル として適当ではなかったからだと考えられている.これに対し て,林ら [ 林 10] ...

4

日本語自然言語処理のData Augmentation  のんびりしているエンジニアの日記

日本語自然言語処理のData Augmentation のんびりしているエンジニアの日記

... 7 おわりに 本研究では,感情分析における文カテゴリー推定タ スクに対して,有効なニューラルネットワークとデー タ拡張手法組み合わせを比較検討した. 同じデー タ拡張手法を用いた場合, 他ネットワークに比べて LSTM モデル有効性が確認された. また同じネット ワークを用いた場合, シソーラスを用いたデータ拡張 有効性が確認された. ...

4

PDFファイル 3I3 「自然言語処理による文書要約」

PDFファイル 3I3 「自然言語処理による文書要約」

... 5.3 考察 世代数が少ない時ほど高い精度が得られていることから,世 代数を増やした場合に,出力される解が局所解である場合があ ることが考えられる.原因として考えられるは,設定された 文字数を満たす要約を生成するために,初期個体群生成にお いて強い制限を与えていることが挙げられる.この操作ため に,初期個体において選択される文数が少ない,つまり “1” ...

3

PDFファイル 2A1 「自然言語処理」

PDFファイル 2A1 「自然言語処理」

... 2. 色と文書可視性について 適切に色遣いがなされた文書は可視性が高いことはあきらか である.色使い方に関する研究は配色理論や色彩論など[ヨ ハネスイッテン 1971]として,非常に古くから研究がある.しか し,これら研究成果は絵や図を主体とするヴィジュアル性高 い文書には適用可能であっても,テキスト情報が主体となる教 ...

2

PDFファイル 2A1 「自然言語処理」

PDFファイル 2A1 「自然言語処理」

... を目標としており、その中で世界史・日本史といった歴史科目 センター試験では、自然言語で書かれている文が史実である かどうかを判断する問題が大部分を占める。入試問題性質 上、「史実である文」と「史実ではない文」と間に明確な線 引きがあると考えられている。この判定基準を明確にし、計算 機によってそれをどれほど実現できるかは、人工知能および自 ...

4

PDFファイル 3D4 「教育支援におけるテキスト・自然言語処理」

PDFファイル 3D4 「教育支援におけるテキスト・自然言語処理」

... 例えば、 「とけいあおくん」 ∗10 場合、正解難易度ク ラスは 2 だが、帯各スムージング方法で推定された難易度ク ラスは、 3, 3, 3, 3, 4, である。一方、柴崎方式で得られる結果 は、 Y = 5.169482 であり、クラス 5 と推定された。ここで、 帯スムージング結果平均値 3.2 と、柴崎方式 ...

4

学位論文  首都大学東京 自然言語処理研究室(小町研)

学位論文 首都大学東京 自然言語処理研究室(小町研)

... 第 5 章 結果と考察 5.1 誤り分析 5.1.1 妥当性 各手法妥当性誤り数を表 5.1 に示す.()内は全体における誤り個数割合を 示す.表 3 から, NMT と比較すると, PBSMT は位置誤りが多いことがわかる. 一般的に, PBSMT は語順が離れた言語対に対し,並べ替えが困難となり,翻訳精 ...

46

PDFファイル 2A1 「自然言語処理」

PDFファイル 2A1 「自然言語処理」

... 一方,文書内容を捉える手法として,トピックモデルが注 目されている.トピックとは,話題や意味まとまりことで あり,トピックモデルとは,単語出現背景にトピックを仮 定した言語モデルである.トピックモデルでは,各文書に出現 した単語種類と,その出現回数情報を基に,辞書などを用 ...

4

学位論文  首都大学東京 自然言語処理研究室(小町研)

学位論文 首都大学東京 自然言語処理研究室(小町研)

... ネットワークモデルに対しても Attention 機構を適用する。 宮崎ら [17] は日本語評価極性分類で、 TreeLSTM [16] に Attention 機構を導入した。 TreeLSTM は LSTM を句構造木に適用したものである。この手法では、句構造木の葉には 学習済み単語分散表現が用いられており、それらを組み上げて句ベクトルを構成する。 ...

13

自然言語処理19_3

自然言語処理19_3

... 20 G-上位概念を含む G-上位概念ペアは全部で 59,890 ペア,この G-上位概念に含まれ る下位概念異なり数は 54,981 個であった.その中から 200 ペアをサンプリングし,言い換え 後上位概念と下位概念ペアが上位下位関係であるか判定する実験を行った.実験では,筆 ...

21

PDFファイル 3I3 「自然言語処理による文書要約」

PDFファイル 3I3 「自然言語処理による文書要約」

... 近年,大量の文書データと接する機会の増加にともない,文 書要約技術の必要性が高まっている.文書要約の一手法として は,要約生成問題を文の組合せ最適化問題として帰着させる方 法がある.最適化手法としては,動的計画法や分岐限定法など の厳密解法を用いた研究が多い.しかし,厳密解法には,要約 対象とする文書集合の大きさに従って,計算時間が膨大に膨れ 上がってしまうという問題が[r] ...

4

Show all 10000 documents...

関連した話題