Top PDF 大規模対訳コーパスの構築

〈プロジェクト紹介〉超大規模コーパス構築プロジェクト日本語Webコーパスの構築 : 利活用

... 浅原正幸（あさはら・まさゆき）国立国語研究所言語資源研究系・コーパス開発センター准教授。博士（工学）（奈良先端科学技術大学院大学）。奈良先端科学技術大学院大学助手・助教，国立国語研究所コーパス開発センター特任准教授を経て，2014 年 10 月より現職。主な著書・論文：Archiving and analysing techniques of the ultra-large-scale ...

11

JAIST Repository: マイクロブログからの対話コーパスの自動構築

... 図 3.7: リプライ数を取得する手順の例検討した手法 1. も手法 2. も実現が難しかったため、本研究では、除去の対象とする不特定多数への呼びかけを含む対話を大喜利のみとする。大喜利は特定の Twitter ユーザがアカウントを開設して運営していることが多く、大喜利のお題の ...

47

大規模分散フレームワーク Hadoop を用いた接尾辞配列構築 (計算機科学とアルゴリズムの数理的基礎とその応用)

... new ロセスとどのプロセスを通信させるかを厳密に記述できる． Hadoop では，通信は Hadoop が自動的に割り振るので， MPI のように通信を自由に記述できないが，逆に言えば，煩わしい通信のコードを書く必要がなく，プログラミングが非常に単純になる．また，計算機の故障に対し，Hadoop が自動的に対処してく ...

4

JAIST Repository: 単語境界が明示されていない言語を対象とした対訳辞書の自動構築

... つのヒューリスティクスを適用する前のものである．法律のパラレルコーパスの方が新聞のパラレルコーパスと比べて文の組の数が多いが，獲得された訳語対の候補は新聞のパラレルコーパスの方が多い．新聞の方が法律よりも多様な単 ...

48

JAIST Repository: 小説からの対話コーパスの自動構築

... 本研究では、小説から複数の登場人物による連続した台詞を抽出し、それを対話として大量に集めた対話コーパスを自動的に構築することを目的とする。小説における台詞は人の発話であり、複数人による連続した台詞は対話とみなすことができる。小説における対話は著者の作例であるが、対話としては自然なので、こ ...

47

2H1-5 大規模リワード広告システムにおける行動履歴と広告属性を利用したコンバージョン予測モデルの構築

... 行う．この配信方式では，ユーザがランダムにどちらかの手法の配信対象になるため，同一のユーザに両方の手法で配信されることはない．提案手法では，ユーザの過去のクリックや CV の履歴を使用して予測を行うため，新規ユーザに対してはレコメンドをすることができない．この場合には，ベースライン手 ...

4

大規模観測データ解析システムシステムの概要と構築・設定、性能評価

... CCD の位置関係を表す座標情報と，明るさの関係を表すフラックススケールの情報を導き出す作業を各フィルター毎に行う．4の背景光補正と天体データの足し合せでは3で作成したフラックススケールファイルと CCD の座標ファイルを用いて，天球面座標を平面座標に投影したデータを生成し，観測された全ショットの積分を行う．そして ...

11

HOKUGA: 英語ライティングクラスのための観光コーパス構築に関する研究

... に与えられているとは言い難い。Kobayakawa（2011）は，高等学の英語英語およびライティングの検定教科書各５冊について，書くことの課題（task）の量的比較析を行った。その結果，４技能の合的な訓練を目指す英語および英語では，埋め（fill-in-the-blanks）問題をはじめ，制限作文や日本文を見て一文を埋める問題等が多く， ...

31

超高速・大規模ネットワーク向け分散協調型高度ネットワーク管理システムの構築

... TOUR ： Tohoku University Repository コメント・シート本報告書収録の学術雑誌等発表論文は本ファイルに登録しておりません。なお、このうち東北大学在籍の研究者の論文で、かつ、出版社等から著作権の許諾が得られた論文は、個別に TOUR に登録 ...

12

大規模情報時代の科学的リテラシーとしての統計思考力について (教育数学の構築)

... この枠組みに変化が生じたのは $2O$ 世紀の終盤である．この時期，複雑な非線形方程式で表現される流体などの非線形現象，人間の行動や心理が関与しゲーム的要素を含んだ経済現象，多くの要素が複雑に相互関連する大規模な人エシステムや生命現象などに対しては，従来の解析的方法では実用的な解を与えることができなかっ ...

7

高汎用性教室英語の発話コーパス構築の課題と蓄積の方向性

... ７．結　論本節では，高汎用性教室英語の発話コーパス構築の課題と蓄積の方向性についてまとめる。教室発話コーパス構築について，発話コーパス 蓄積の意義と方法（第１，２節），そして諸課題（第３，４，５節）について論じてきた。発話コーパスが書き起こしを必要とする性質上，音声収録の ...

12

目次 1. 音と音声 2. 音声研究 : 合成認識 3. 音声コーパスとは 4. 大規模コーパスから見えること 5. 音声コーパスの利用 6. 音声コーパス類似性の可視化 7. 音響データベース 8. まとめ市民講座

... パネル討論「多様なニーズに応える言語資源」司会：板橋秀一国立情報学研究所特任教授「言語資源協会(GSK)の現状と課題」橋田浩一産総研サービス工学センター次長「NTCIRの活動と言語資源の扱い」神門典子国立情報学研究所教授「NICTにおける音声・言語資源」鳥澤健太郎情報通信研究機構グループリーダー ...

60

Webを母集団とした超大規模コーパスの開発 : 収集と組織化

... 年より本格事業化している。NDL の Web アーカイブでは保存が主目的であり，同一 URL を複数回収集し，経年変化を確認できるようなユーザインターフェイスが提供されている。様々な技術の集積により，検索エンジンを運営している企業やコンテンツを保持している企業だけでなく，個人でも Web スケールの言語資源を構築することが可能になっている。矢田（2010）は形態素解析用辞書 ...

27

JAIST Repository: 琉日機械翻訳のための対訳コーパスの自動拡張について

... 実験では，拡張なし（初期の対訳コーパスのみを用いる手法），先行研究の拡張手法，ランダム選択，品質のみを考慮した拡張手法（2 種類のスコアによる），品質と多様性を考慮した拡張手法，品質を考慮した選択とランダム選択を組み合わせた拡張手法を評価した．各提案手法で構築した拡張対訳コーパスを用いて統計 ...

49

大規模不法行為出現の背景

... 1980年のThe MGM-Grand Hotel Fire（MGMホテル火災、See, Pamela ...File.）、1986年のThe DuPont Plaza Hotel Fire（デュポンプラザホテル火災; Marcia Coyle, A $105 Million DuPont Solution, N AT L ...

25

大規模データ天文学の進展

... • データ移動を極力避ける解析システム  望遠鏡・観測装置の大型化、高機能化 • 高品質なデータ、取得のコストの増大  科学成果の最大化 • 取得したデータを速やかに解析できる環境の構築 ...

33

「大規模プラントの最適保全方策《

... 大規模プラントはシステム、装置、機器、部品といった構成要素が階層的に結合している。各構成要素に対してはその健全性を維持するための保全が施され、その結果としてプラントの機能が達成される。この意味で保全は重要であるが、保全にも複数の種類がある。また保全はコストを要し、過剰な保全は許容されない。即ち保全の適正化を図り、プラン ...

9

大規模コーパスを用いた日本語の視覚形容詞メタファーの使用傾向の定量的検討

... われていることが確かめられた。日本語の形容詞文の特徴として、主観的な外部世界の状態の記述をするのか、人間の内面的世界の描写をするのかに応じて、助詞「は」と「が」の使い分けや、それとともに現れる名詞の性格も変化するという (大石 2007) 。 ...

170

JLPTUFS作文コーパスの構築について

... 10 留日センターでは、各教育コース・プログラムの運営のほかに、教育研究開発に関わる各種プロジェクトをセンター内公募の形により毎年複数実施している。「全学日本語プログラム」を対象とした作文コーパスの作成については、2008 年度に新規プロジェクトの 1 つとして立ち上がった（担当者：鈴木智美、中村彰、伊集院郁子）。プロジェクト予算は留日セ ...

12

Learning Bayesian Network from data 本論文はデータから大規模なベイジアンネットワークを構築する TPDA(Three Phase Dependency Analysis) のアルゴリズムを記述 2002 年の発表だが現在も大規模用 BN モデルのベンチマークと

... L内の(X,Y)について以下を繰返し連結を増やす。 XとYの最小の介在ノード群 C を見つける（最初はＣは存在しない） I(X,Y|C) > ε ならXとYを連結する (3) 連結を縮約する過程 (Thinning) ...

18

大規模対訳コーパスの構築

関連した話題