• 検索結果がありません。

係り受けデータベース、コーパス

PDFファイル 3I4 「自然言語処理におけるコーパス・辞書生成」

PDFファイル 3I4 「自然言語処理におけるコーパス・辞書生成」

... ベクトルとして文脈情報と綴り字情報を統合したものを用いて おり,これらに対して正準相関分析によるマッチング (MCCA) 推定を行って,訳語候補の共起確率を計算した.この結果,言 語構造の関係が近しいとされる英語とスペイン語のコーパス や,英語とフランス語のコーパスに関して,彼らは,高い精度 のパラレルコーパス生成に成功した.しかし,英語と中国語 ...

4

『現代日本語書き言葉均衡コーパス』利用の手引(DVDデータv1.1対応)

『現代日本語書き言葉均衡コーパス』利用の手引(DVDデータv1.1対応)

... 4.2 文書構造タグセットの種類とサブコーパス・レジスターとの関係 BCCWJ は複数のサブコーパス・レジスターから構成される。文書構造タグのセット(タ グセット:TS)は、それぞれのサブコーパス・レジスターの特性に合わせて、表 4-1 のよ うに規定される。個々のタグセットは、XML の文書型として定義される。なお、原資料が 紙媒体のデータについては、 sentence(後述、表 4-2 ...

182

データベースⅢ

データベースⅢ

... ■ ADO と ADO.NET の使い分け 新規にアプリケーションを開発する時は、ADO.NET を利用すると、豊富なツールを利用して、効率良 くアプリケーションを開発する事が出来る。ADO.NET では、データベースと常時接続する必要が無い 為、システムの負荷を軽減する事が出来る。併し、非接続型故に、大量のレコードの即時更新や、常に 最新の情報が必要な場合には、不適格で有り、此の様な場合は、常時接続型の ADO ...

10

データベースⅢ

データベースⅢ

... ■ ADO と ADO.NET の使い分け 新規にアプリケーションを開発する時は、ADO.NET を利用すると、豊富なツールを利用して、効率良 くアプリケーションを開発する事が出来る。ADO.NET では、データベースと常時接続する必要が無い 為、システムの負荷を軽減する事が出来る。併し、非接続型故に、大量のレコードの即時更新や、常に 最新の情報が必要な場合には、不適格で有り、此の様な場合は、常時接続型の ADO ...

10

コーパスに基づく言語学教育研究報告 9

コーパスに基づく言語学教育研究報告 9

... 第 1 期:1 年度目の 4 月~6 月「国で勉強した日本語と実際に使われている日本語の違いに 気付き,自分の日本語の体系を調整している段階 5 」 ある奨学金団体の奨学生として来日し, 最初の 1 年間は日本語学校で予備教育を受けた。 主にアジア系の留学生が住む寮に住んだ。毎日が日本語学校と寮の往復だった。最初はほ とんど誰とも話す機会がなかった。接する機会のある日本人は,奨学金団体の職員,日本 ...

18

コーパスに基づく言語学教育研究報告 8

コーパスに基づく言語学教育研究報告 8

... を表すものであり,(27)は以前の私が示している外的な様子はこのとき(「今」)とは違 う様子であったことを表すものである。 6. まとめ 本稿では,形容詞(形容動詞も含む)あるいは「∼たい」に接尾辞「がる」をつけた「∼ がる」という形(「悔しがる」「食べたがる」等)について,国立国語研究所「『現代日本語 書き言葉均衡コーパス』モニター公開データ(2009 年度版)」(「書籍」「白書」「国会会議 録」「Yahoo! ...

12

MySQL マニュアルデータベース基礎 for Windows, Linux 入門編 1. テーブルの種類 ファイルの構成 2.MySQL のディレクトリ構造 3.MyISAM 4.InnoDB 5. データベースの操作 データベースの作成 データベース削除 データベースの一覧 一覧にあるデータベー

MySQL マニュアルデータベース基礎 for Windows, Linux 入門編 1. テーブルの種類 ファイルの構成 2.MySQL のディレクトリ構造 3.MyISAM 4.InnoDB 5. データベースの操作 データベースの作成 データベース削除 データベースの一覧 一覧にあるデータベー

... 10.テーブル同士の操作 データベースでは、複数のテーブルを作成することでデータ変更時の手間を最小限にしています。しかし、複数 のテーブルに分けたことにより、目的としているデータを取得するため複数に分けたテーブル同士を結合する作 業が出てきました。テーブル同士の結合には任意のカラムをもとにテーブル同士を結合します。このとき、同じ値 ...

34

JLPTUFS作文コーパスの構築について

JLPTUFS作文コーパスの構築について

... b. 作文テキストファイル c. 作文 PDF ファイル 以下の図 1 に示すのは、そのイメージサンプルである。ただし、以下はサンプル であり、実際には、情報一覧ファイルの項目記載順などは、この通りではない。 情報一覧ファイルの作文番号から、当該作文のテキストファイルおよび PDF ファ イルへとリンク付けがなされ、コーパス使用者は当該作文のファイルを見ることが ...

12

『現代日本語書き言葉均衡コーパス』マニュアル(DVDデータv1.0対応)

『現代日本語書き言葉均衡コーパス』マニュアル(DVDデータv1.0対応)

... 「形態論情報付きデータ」は BCCWJ の全サンプルのテキストに対して短単位・長単位 の形態論情報(第 4 章参照)を付与したテキストデータである。DVD には、表形式テキス ト(TSV)と統合形式の XML(M-XML)の 2 種類のデータが格納されている。 TSV 形式のデータは Disc2 の SUW および LUW ディレクトリの下に、サブコーパスご ...

157

韓国人学習者の日本語作文に見る「的」付き形容動詞の使用傾向と教育への提言― 学習者コーパスと母語話者コーパスの比較を通して

韓国人学習者の日本語作文に見る「的」付き形容動詞の使用傾向と教育への提言― 学習者コーパスと母語話者コーパスの比較を通して

... 見られる「的」付き形容動詞の多用性傾向と NS の多様性傾向は、第 2 章で上述した朴(2000) の指摘と一致している。 しかし、すでに述べたように NNS_K と NS の作文課題を比べると、その種類において学習者 作文のほうが少なく、母語話者のほうが多いという違いがある。そのために上述したような NS に見られる「的」付き形容動詞の語彙的な多様性は、作文課題の多様性によるものではないか という疑問が生じる。下記の表 4 と表 5 ...

16

目次 1. 音と音声 2. 音声研究 : 合成 認識 3. 音声コーパスとは 4. 大規模コーパスから見えること 5. 音声コーパスの利用 6. 音声コーパス類似性の可視化 7. 音響データベース 8. まとめ 市民講座

目次 1. 音と音声 2. 音声研究 : 合成 認識 3. 音声コーパスとは 4. 大規模コーパスから見えること 5. 音声コーパスの利用 6. 音声コーパス類似性の可視化 7. 音響データベース 8. まとめ 市民講座

... 複数音声コーパス可視化法のまとめ n コーパス特徴によるコーパス間の類似性の可視化 類似度の高いコーパス・特徴的な要素を持つコーパスの判断が容易 n 属性の値への重みづけ ...

60

PDFファイル 3I4 「自然言語処理におけるコーパス・辞書生成」

PDFファイル 3I4 「自然言語処理におけるコーパス・辞書生成」

... かった単語が 189 単語も含まれている ( 表 1 参照 ) 。このよう な評価極性がないと思われる単語を削除するため、本手法では ニューラルネットワーク言語モデルを用いる。 ニューラルネットワーク言語モデルでは、テキストコーパス を用いて単語をベクトルの形で表現することができる。そし て、線形演算により単語間の関係を把握できることが知られて いる [Mikolov 13] 。株式ニュースを用いた予備実験より、評価 ...

2

データベースⅡ

データベースⅡ

... Recordset オブジェクトを開くと、カレントレコードが最初のレコードの位置に移動して、BOF と EOF プロパテ ィの設定値が False に成る。レコードが存在しない場合は、BOF と EOF プロパティの設定値が True に成る。 ConnectionString プロパティ(ADODC) 直訳すると『接続文字列』。ダイアログボックスにて視覚的に設定する事が多いが、1字1句間違わなければ、 ...

12

目次 第 1 章 国民之友コーパス の開発経緯と特徴... 1 第 2 章 国民之友コーパス の仕様 コーパス化の対象 コアデータの設定 文字入力 基本方針 文字集合 外字 非漢字の

目次 第 1 章 国民之友コーパス の開発経緯と特徴... 1 第 2 章 国民之友コーパス の仕様 コーパス化の対象 コアデータの設定 文字入力 基本方針 文字集合 外字 非漢字の

... 原資料である雑誌『国民之友』は、徳富蘇峰の設立した民友社により 1887(明治 20) 年から 1898(明治 31)年にかけて刊行された。主に、徳富蘇峰ら民友社社員および当時 の著名知識人による政治・社会・経済・文学等の評論や文学作品を掲載する。その執筆者 は幅広く、コーパス化の対象である 1887・1888 年刊の 36 号分だけ見ても、高橋五郎・ 森田思軒・朝比奈知泉・久松義典・依田学海・宇川盛三郎など 80 ...

40

〈プロジェクト紹介〉超大規模コーパス構築プロジェクト 日本語Webコーパスの構築 : 利活用

〈プロジェクト紹介〉超大規模コーパス構築プロジェクト 日本語Webコーパスの構築 : 利活用

... 返答に 10~20 秒かかることがわかった。2014 年度は NWJC 2012 年第 4 四半期収集データ (2012-4Q)を MeCab-0.98+mecab-ipadic-2.7.0-20070801 により形態素解析し,CaboCha-0.67 に より係り受け解析したもの(約 10 億語規模)での検証と高速化を進めている。 図 3 ...

11

データベース1

データベース1

... ConnectionString プロパティ(ADODC) 直訳すると『接続文字列』 。ダイアログボックスにて視覚的に設定する事が多いが、1字1句 間違わなければ、直接入力しても設定する事が出来る。要は、何のデータベースと接続するの かを指定するプロパティで有る。若し、フォルダの名称を変更したり、ファイル名を変更した り、保存場所を変更する等して、設定した時と異なる場合は、再度設定し直す必要が有る。 ...

10

データベース1

データベース1

... ConnectionString プロパティ(ADODC) 直訳すると『接続文字列』 。ダイアログボックスにて視覚的に設定する事が多いが、1字1句 間違わなければ、直接入力しても設定する事が出来る。要は、何のデータベースと接続する のかを指定するプロパティで有る。若し、フォルダの名称を変更したり、ファイル名を変更 したり、保存場所を変更する等して、設定した時と異なる場合は、再度設定し直す必要が有 る。 ...

7

2D4-4 n-gramモデルとトピックモデルと係り受け解析の統合による 自然文サンプリング法

2D4-4 n-gramモデルとトピックモデルと係り受け解析の統合による 自然文サンプリング法

... 7 択の回答尺度にはリッカート尺度を用いた.また, 4 つの返 答文のなかから,最も自然だと感じた文を 1 つ選択してもらっ た.実験参加者は日本語を母語とする日本人大学生 11 人であ る.本研究で生成する返答文は,会話内で発話される文を想定 するため,使用するコーパスは新聞のような文体ではなく日 常的な文が用いられている文書を用いる.コーパスにはエッセ ...

4

3L3-5 係り受け情報を用いたトピック粒度の細分化に関する検討

3L3-5 係り受け情報を用いたトピック粒度の細分化に関する検討

... のクラスタに対して,トピック数を 10 ∼ 100 とし, LDA によ りトピックを推定した際の cos 類似度の結果を図4に示す.図 4より,係り受けクラスタを共起範囲とすることで,文書や文 を共起範囲とするよりも全体的に各トピック間の独立性が高 くなることが確認できる.また,図4とトピックの目視評価に より,今回の使用データにおける最適トピック数は,おおよそ ...

4

データベースプログラミング

データベースプログラミング

... データセットに関して謂うと、クラスライブラリの DataSet クラスでは、データセットの基本的な仕組 みが記述されて居る。然して、其の派生クラスで有る MyDBDataSet クラスは、データセットデザイナ でのデザインに基づき DataSet クラスをカスタマイズしたクラスと成って居る。 実際、既存の DataSet クラスや DataTable クラス丈を使ってもデータベースのレコードを保持する事 ...

10

Show all 2707 documents...

関連した話題