• 検索結果がありません。

大規模対訳コーパスの構築

〈プロジェクト紹介〉超大規模コーパス構築プロジェクト 日本語Webコーパスの構築 : 利活用

〈プロジェクト紹介〉超大規模コーパス構築プロジェクト 日本語Webコーパスの構築 : 利活用

... 浅原 正幸 (あさはら・まさゆき) 国立国語研究所言語資源研究系・コーパス開発センター准教授。博士(工学)(奈良先端科学技術大学院大学)。奈良先 端科学技術大学院大学助手・助教,国立国語研究所コーパス開発センター特任准教授を経て,2014 年 10 月より現職。 主な著書・論文:Archiving and analysing techniques of the ultra-large-scale ...

11

JAIST Repository: マイクロブログからの対話コーパスの自動構築

JAIST Repository: マイクロブログからの対話コーパスの自動構築

... 図 3.7: リプライ数を取得する手順例 検討した手法 1. も手法 2. も実現が難しかったため、本研究では、除去対象 とする不特定多数へ呼びかけを含む対話を大喜利のみとする。大喜利は特定 Twitter ユーザがアカウントを開設して運営していることが多く、大喜利お題 ...

47

大規模分散フレームワーク Hadoop を用いた接尾辞配列構築 (計算機科学とアルゴリズムの数理的基礎とその応用)

大規模分散フレームワーク Hadoop を用いた接尾辞配列構築 (計算機科学とアルゴリズムの数理的基礎とその応用)

... new ロセスとどのプロセスを通信させるかを厳密に記述 できる. Hadoop では,通信は Hadoop が自動的に割 り振るので, MPI ように通信を自由に記述できな いが,逆に言えば,煩わしい通信コードを書く必要 がなく,プログラミングが非常に単純になる.また, 計算機故障に対し,Hadoop が自動的に対処してく ...

4

JAIST Repository: 単語境界が明示されていない言語を対象とした 対訳辞書の自動構築

JAIST Repository: 単語境界が明示されていない言語を対象とした 対訳辞書の自動構築

... つヒューリスティクスを適用する前ものである.法律 パラレルコーパス方が新聞パラレルコーパスと比べて文数が多いが,獲得さ れた訳語対候補は新聞パラレルコーパス方が多い.新聞方が法律よりも多様な単 ...

48

JAIST Repository: 小説からの対話コーパスの自動構築

JAIST Repository: 小説からの対話コーパスの自動構築

... 本研究では、小説から複数登場人物による連続した台詞を抽出し、それを対 話として大量に集めた対話コーパスを自動的に構築することを目的とする。小説 における台詞は人発話であり、複数人による連続した台詞は対話とみなすこと ができる。小説における対話は著者作例であるが、対話としては自然なので、こ ...

47

2H1-5 大規模リワード広告システムにおける行動履歴と広告属性を利用したコンバージョン予測モデルの構築

2H1-5 大規模リワード広告システムにおける行動履歴と広告属性を利用したコンバージョン予測モデルの構築

... 行う.この配信方式では,ユーザがランダムにどちらか手法 配信対象になるため,同一ユーザに両方手法で配信され ることはない.提案手法では,ユーザ過去クリックや CV 履歴を使用して予測を行うため,新規ユーザに対してはレコ メンドをすることができない.この場合には,ベースライン手 ...

4

大規模観測データ解析システム システムの概要と構築・設定、性能評価

大規模観測データ解析システム システムの概要と構築・設定、性能評価

... CCD 位置関係を表す 座標情報と,明るさ関係を表すフラックススケール 情報を導き出す作業を各フィルター毎に行う.4 背景光補正と天体データ足し合せでは3で作成した フラックススケールファイルと CCD 座標ファイル を用いて,天球面座標を平面座標に投影したデータを 生成し,観測された全ショット積分を行う.そして ...

11

HOKUGA: 英語ライティングクラスのための観光コーパス構築に関する研究

HOKUGA: 英語ライティングクラスのための観光コーパス構築に関する研究

... に与えられているとは言い難い。Kobayakawa(2011)は,高等学 英語 英語 および ライティング 検定教科書各5冊について, 書くこと 課題(task)量的比較 析を行った。その結果,4技能 合的な訓練を目指す 英語 および 英語 では, 埋 め(fill-in-the-blanks)問題をはじめ,制限作文や日本文を見て一文を埋める問題等が多く, ...

31

超高速・大規模ネットワーク向け分散協調型高度ネットワーク管理システムの構築

超高速・大規模ネットワーク向け分散協調型高度ネットワーク管理システムの構築

... TOUR : Tohoku University Repository コメント・シート 本報告書収録学術雑誌等発表論文は本ファイルに登録しておりません。なお、このうち東北大学 在籍研究者論文で、かつ、出版社等から著作権許諾が得られた論文は、個別に TOUR に登録 ...

12

大規模情報時代の科学的リテラシーとしての統計思考力について (教育数学の構築)

大規模情報時代の科学的リテラシーとしての統計思考力について (教育数学の構築)

... この枠組みに変化が生じたは $2O$ 世紀終盤である.この時期,複雑な非線形方 程式で表現される流体など非線形現象,人間行動や心理が関与しゲーム的要素 を含んだ経済現象,多く要素が複雑に相互関連する規模な人エシステムや生命 現象などに対しては,従来解析的方法では実用的な解を与えることができなかっ ...

7

高汎用性教室英語の発話コーパス構築の課題と蓄積の方向性

高汎用性教室英語の発話コーパス構築の課題と蓄積の方向性

... 7.結 論 本節では,高汎用性教室英語発話コーパス構 築課題と蓄積方向性についてまとめる。 教室発話コーパス構築について,発話コーパス 蓄積意義と方法(第1,2節),そして諸課題(第 3,4,5節)について論じてきた。発話コーパ スが書き起こしを必要とする性質上,音声収録 ...

12

目次 1. 音と音声 2. 音声研究 : 合成 認識 3. 音声コーパスとは 4. 大規模コーパスから見えること 5. 音声コーパスの利用 6. 音声コーパス類似性の可視化 7. 音響データベース 8. まとめ 市民講座

目次 1. 音と音声 2. 音声研究 : 合成 認識 3. 音声コーパスとは 4. 大規模コーパスから見えること 5. 音声コーパスの利用 6. 音声コーパス類似性の可視化 7. 音響データベース 8. まとめ 市民講座

... パネル討論 「多様なニーズに応える言語資源」司会: 板橋秀一 国立情報学研究所特任教授 「言語資源協会(GSK)現状と課題」 橋田浩一 産総研サービス工学センター次長 「NTCIR活動と言語資源扱い」 神門典子 国立情報学研究所教授 「NICTにおける音声・言語資源」 鳥澤健太郎 情報通信研究機構グループリーダー ...

60

Webを母集団とした超大規模コーパスの開発 : 収集と組織化

Webを母集団とした超大規模コーパスの開発 : 収集と組織化

... 年より本格事業化している。NDL Web アーカイブでは保存が 主目的であり,同一 URL を複数回収集し,経年変化を確認できるようなユーザインターフェイ スが提供されている。様々な技術集積により,検索エンジンを運営している企業やコンテン ツを保持している企業だけでなく,個人でも Web スケール言語資源を構築することが可能に なっている。矢田(2010)は形態素解析用辞書 ...

27

JAIST Repository: 琉日機械翻訳のための対訳コーパスの自動拡張について

JAIST Repository: 琉日機械翻訳のための対訳コーパスの自動拡張について

... 実験では,拡張なし(初期対訳コーパスのみを用いる手法),先行研究拡張 手法,ランダム選択,品質のみを考慮した拡張手法(2 種類スコアによる),品 質と多様性を考慮した拡張手法,品質を考慮した選択とランダム選択を組み合わ せた拡張手法を評価した.各提案手法で構築した拡張対訳コーパスを用いて統計 ...

49

大規模不法行為出現の背景

大規模不法行為出現の背景

... 1980年 The MGM-Grand Hotel Fire(MGMホ テ ル 火 災、See, Pamela ...File.)、1986年 The DuPont Plaza Hotel Fire( デ ュ ポ ン プラザホテル火災; Marcia Coyle, A $105 Million DuPont Solution, N AT L ...

25

大規模データ天文学の進展

大規模データ天文学の進展

... • データ移動を極力避ける解析システム  望遠鏡・観測装置大型化、高機能化 • 高品質なデータ、取得コスト増大  科学成果最大化 • 取得したデータを 速やかに解析 できる環境構築 ...

33

「大規模プラントの最適保全方策《

「大規模プラントの最適保全方策《

... 規模プラントはシステム、装置、機器、部品といった構成要素が階層的に結合してい る。各構成要素に対してはその健全性を維持するため保全が施され、その結果としてプ ラント機能が達成される。この意味で保全は重要であるが、保全にも複数種類がある。 また保全はコストを要し、過剰な保全は許容されない。即ち保全適正化を図り、プラン ...

9

大規模コーパスを用いた日本語の視覚形容詞メタファーの使用傾向の定量的検討

大規模コーパスを用いた日本語の視覚形容詞メタファーの使用傾向の定量的検討

... われていることが確かめられた。日本語形容詞文特徴として、主観的な外部世界 状態記述をするか、人間内面的世界描写をするかに応じて、助詞「は」 と「が」使い分けや、それとともに現れる名詞性格も変化するという (大石 2007) 。 ...

170

JLPTUFS作文コーパスの構築について

JLPTUFS作文コーパスの構築について

... 10 留日センターでは、各教育コース・プログラム運営ほかに、教育研究開発に関わる各 種プロジェクトをセンター内公募形により毎年複数実施している。 「全学日本語プログラ ム」を対象とした作文コーパス作成については、2008 年度に新規プロジェクト 1 つと して立ち上がった(担当者:鈴木智美、中村彰、伊集院郁子)。プロジェクト予算は留日セ ...

12

Learning Bayesian Network from data 本論文はデータから大規模なベイジアン ネットワークを構築する TPDA(Three Phase Dependency Analysis) のアルゴリズムを記述 2002 年の発表だが 現在も大規模用 BN モデルのベンチマークと

Learning Bayesian Network from data 本論文はデータから大規模なベイジアン ネットワークを構築する TPDA(Three Phase Dependency Analysis) のアルゴリズムを記述 2002 年の発表だが 現在も大規模用 BN モデルのベンチマークと

... L内(X,Y)について以下を繰返し連結を増やす。 XとY最小介在ノード群 C を見つける(最初はCは存在しない) I(X,Y|C) > ε ならXとYを連結する (3) 連結を 縮約 する過程 (Thinning) ...

18

Show all 10000 documents...

関連した話題