• 検索結果がありません。

自己紹介 : 村脇有吾 京都大学大学院情報学研究科知能情報学専攻助教工学部電気電子工学科兼担 専門 : 計算言語学と自然言語処理 表の仕事は普通のテキスト処理 単語分割 ゼロ照応解析 常識的知識の獲得ほか 今日お話も裏の仕事 言語の研究ですが テキストは直接扱いません 2

N/A
N/A
Protected

Academic year: 2021

シェア "自己紹介 : 村脇有吾 京都大学大学院情報学研究科知能情報学専攻助教工学部電気電子工学科兼担 専門 : 計算言語学と自然言語処理 表の仕事は普通のテキスト処理 単語分割 ゼロ照応解析 常識的知識の獲得ほか 今日お話も裏の仕事 言語の研究ですが テキストは直接扱いません 2"

Copied!
35
0
0

読み込み中.... (全文を見る)

全文

(1)

京都大学 村脇 有吾

潜在表現に基づく

言語構造の史的変化の分析

機構間連携・文理融合プロジェクト「言語における系統・変異・多様性とその数理」シンポジウム 2018年2月2日 TKP東京駅大手町カンファレンスセンター

(2)

• 京都大学 大学院情報学研究科 知能情報学専攻 助教 工学部電気電子工学科 兼担 • 専門: 計算言語学と自然言語処理 – 表の仕事は普通のテキスト処理 • 単語分割、ゼロ照応解析、常識的知識の獲得ほか – 今日お話も裏の仕事 • 言語の研究ですが、テキストは直接扱いません 2

自己紹介

: 村脇 有吾

(3)

言語構造の 潜在表現 史的変化の 統計的推論 シミュレーション による分析 Step 3.遷移率行列を用いて言語の時間変化をシミュレート 1 1 0 … 0 潜在パラメータ列z𝑙𝑙,∗ 時間𝑡𝑡 1 0 0 … 1 潜在パラメータ列z𝑙𝑙,∗ 1 1 … 2 表層特徴列x𝑙𝑙,∗ 生成 Q𝑘𝑘= 0.0002∗ 0.0003 1 1 0 … 0 2 1 … 3 表層特徴列x𝑙𝑙,∗ 潜在パラメータ列z𝑙𝑙,∗ Step 1.各言語を潜在表現に変換 推論 3 Step 2.系統樹群から各潜在パラメータの遷移率行列を推定 (内部ノードの状態、年代も同時推定) 1 1 0 … 0 1 0 0 … 0 0 0 1 … 1 1 0 0 … 0 0 0 1 … 1 0 1 1 … 1 1 1 1 … 0 1 1 1 … 0 0 tim e b ef ore pres en t Q𝑘𝑘 = 0.0002∗ 0.0003 各パラメータの 遷移率行列

(4)

言語構造の 潜在表現 史的変化の 統計的推論 シミュレーション による分析 Step 3.遷移率行列を用いて言語の時間変化をシミュレート 1 1 0 … 0 潜在パラメータ列z𝑙𝑙,∗ 時間𝑡𝑡 1 0 0 … 1 潜在パラメータ列z𝑙𝑙,∗ 1 1 … 2 表層特徴列x𝑙𝑙,∗ 生成 Q𝑘𝑘= 0.0002∗ 0.0003 1 1 0 … 0 2 1 … 3 表層特徴列x𝑙𝑙,∗ 潜在パラメータ列z𝑙𝑙,∗ Step 1.各言語を潜在表現に変換 推論 3 Step 2. 系統樹群から各潜在パラメータの遷移率行列を (内部ノードの状態、年代も同時推定) 1 1 0 … 0 1 0 0 … 0 0 0 1 … 1 1 0 0 … 0 0 0 1 … 1 0 1 1 … 1 1 1 1 … 0 1 1 1 … 0 0 tim e bef ore pres en t Q𝑘𝑘 = 0.0002∗ 0.0003 各パラメータの 遷移率行列

(5)

4

基本語順

: Subject, Object, Verb

[Dryer, 2005]

John ga tegami o yon-da

SOV

S O V

日本語

The dog chased the cat

SVO

S V O

英語

Léann na sagairt na leabhair

VSO

V S O

アイル ランド語

(6)

5

基本語順

: Subject, Object, Verb

[Dryer, 2005]

(7)

• なぜ世界における分布がこのよう

になっているのか

?

• どのように変化してきたのか?

• 原型言語 (それが存在したとして)

はどの語順だったのか

?

6

基本語順に関する疑問

[Maurits+, PNAS 2014]

(8)

• SOVが最も高頻度なのは… 1. 機能的に優れているから 2. かつてより高頻度だったなごりにすぎない • SVOの方が機能的に優れている • SOV⇒SVOがSVO⇒SOVよりも多い (と推測) – 原型言語もSOVだったかも • パントマイム実験でSOVが選好される – 原型言語はSOVだった傍証? – 現代人 (しかもWEIRD) を使った実験で原型言 語のことが本当にわかるのか? 7

基本語順に関する従来説の例

[Maurits+, PNAS 2014]

(9)

• 個別言語の分析

– 歴史文献の分析 • 中英語期にSVOへの固定化が進む – 内的再構 • オーストロアジア語族のムンダ語派は (S)OV語順だが、VO語順の痕跡が残る [Donegan+, 2004]

• 言語間比較

– 共時類型論の動態化 [Greenberg, 1969] – 系統学的比較法 8

史的変化の推論

(10)

• 系統樹が (主に語彙的 手がかりを用いた推 論により) 既知とする • 系統樹上のどのエッ ジで注目する値が出 現したか推測できる (場合がある) 9

系統学的比較法

? ? ? ? ? 簡単のために2値特徴で例示するが、 多値特徴への拡張は容易

(11)

• 系統樹が (主に語彙的 手がかりを用いた推 論により) 既知とする • 系統樹上のどのエッ ジで注目する値が出 現したか推測できる (場合がある) 9

系統学的比較法

簡単のために2値特徴で例示するが、 多値特徴への拡張は容易

(12)

• もちろん現在得られ る手がかりだけでは 確信を持って決めら れない場合も多い • 人間はお手上げ 10

系統学的比較法

? ? ? ? ?

(13)

• もちろん現在得られ る手がかりだけでは 確信を持って決めら れない場合も多い • 人間はお手上げ 10

系統学的比較法

?

(14)

• もちろん現在得られ る手がかりだけでは 確信を持って決めら れない場合も多い • 人間はお手上げ • 確率的手法の出番 10

系統学的比較法

?

(15)

• まずは簡単のために離散時間を考える • 時刻𝑡𝑡である値 (状態) のとき、時刻𝑡𝑡 + 1で 取る値 (状態) の確率のモデル 11

状態遷移モデル

(マルコフ連鎖)

0.95 0.05 0.90 0.10

(16)

• 現在の値が𝑎𝑎のとき時間𝑡𝑡後に値が𝑏𝑏になる 確率: exp(𝑡𝑡𝑡𝑡)𝑎𝑎,𝑏𝑏 ただし遷移率行列𝑡𝑡 = −𝛼𝛼𝛽𝛽 −𝛽𝛽𝛼𝛼 12

連続時間

マルコフ連鎖

(CTMC)

確率 時間 時間

(17)

• 観測データ – (年代つき) 系統樹 (群) – 葉ノードの状態 • 潜在データ – 遷移率行列 – 内部ノードの状態 13

(年代つき) 系統樹群を用いた

遷移率行列の推定

? ? ? ? ? 0 tim e bef ore pres en t ? ? 𝑡𝑡 = −𝛼𝛼𝛽𝛽 −𝛽𝛽𝛼𝛼 [Greenhill+, 2010] [Maurits+, PNAS 2014]

(18)

言語構造の 潜在表現 史的変化の 統計的推論 シミュレーション による分析 1 1 0 … 0 2 1 … 3 表層特徴列x𝑙𝑙,∗ 潜在パラメータ列z𝑙𝑙,∗ Step 1.各言語を潜在表現に変換 推論 14 Step 2.系統樹群から各潜在パラメータの遷移率行列を推定 (内部ノードの状態、年代も同時推定) 1 1 0 … 0 1 0 0 … 0 0 0 1 … 1 1 0 0 … 0 0 0 1 … 1 0 1 1 … 1 1 1 1 … 0 1 1 1 … 0 0 tim e b ef ore pres en t Q𝑘𝑘 = 0.0002∗ 0.0003 各パラメータの 遷移率行列 Step 3.遷移率行列を用いて言語の時間変化をシミュレート 1 1 0 … 0 潜在パラメータ列z𝑙𝑙,∗ 時間𝑡𝑡 1 0 0 … 1 潜在パラメータ列z𝑙𝑙,∗ 1 1 … 2 表層特徴列x𝑙𝑙,∗ 生成 Q𝑘𝑘= 0.0002∗ 0.0003

(19)

言語構造の 潜在表現 史的変化の 統計的推論 シミュレーション による分析 1 1 0 … 0 2 1 … 3 表層特徴列x𝑙𝑙,∗ 潜在パラメータ列z𝑙𝑙,∗ Step 1.各言語を潜在表現に変換 推論 14 Step 2.系統樹群から各潜在パラメータの遷移率行列を推定 (内部ノードの状態、年代も同時推定) 1 1 0 … 0 1 0 0 … 0 0 0 1 … 1 1 0 0 … 0 0 0 1 … 1 0 1 1 … 1 1 1 1 … 0 1 1 1 … 0 0 tim e b ef ore pres en t Q𝑘𝑘 = 0.0002∗ 0.0003 各パラメータの 遷移率行列 Step 3. 遷移率行列を用いて言語の時間変化をシミュレ 1 1 0 … 0 潜在パラメータ列z𝑙𝑙,∗ 時間𝑡𝑡 1 0 0 … 1 潜在パラメータ列z𝑙𝑙,∗ 1 1 … 2 表層特徴列x𝑙𝑙,∗ 生成 Q𝑘𝑘= 0.0002∗ 0.0003

(20)

15

基本語順の遷移確率と

将来変化の予測

(21)

言語構造の 潜在表現 史的変化の 統計的推論 シミュレーション による分析 16 Step 2.系統樹群から各潜在パラメータの遷移率行列を推定 (内部ノードの状態、年代も同時推定) 1 1 0 … 0 1 0 0 … 0 0 0 1 … 1 1 0 0 … 0 0 0 1 … 1 0 1 1 … 1 1 1 1 … 0 1 1 1 … 0 0 tim e b ef ore pres en t Q𝑘𝑘 = 0.0002∗ 0.0003 各パラメータの 遷移率行列 Step 3.遷移率行列を用いて言語の時間変化をシミュレート 1 1 0 … 0 潜在パラメータ列z𝑙𝑙,∗ 時間𝑡𝑡 1 0 0 … 1 潜在パラメータ列z𝑙𝑙,∗ 1 1 … 2 表層特徴列x𝑙𝑙,∗ 生成 Q𝑘𝑘= 0.0002∗ 0.0003 1 1 0 … 0 2 1 … 3 表層特徴列x𝑙𝑙,∗ 潜在パラメータ列z𝑙𝑙,∗ Step 1.各言語を潜在表現に変換 推論

(22)

言語構造の 潜在表現 史的変化の 統計的推論 シミュレーション による分析 16 Step 2.系統樹群から各潜在パラメータの遷移率行列を推定 (内部ノードの状態、年代も同時推定) 1 1 0 … 0 1 0 0 … 0 0 0 1 … 1 1 0 0 … 0 0 0 1 … 1 0 1 1 … 1 1 1 1 … 0 1 1 1 … 0 0 tim e b ef ore pres en t Q𝑘𝑘 = 0.0002∗ 0.0003 各パラメータの 遷移率行列 Step 3.遷移率行列を用いて言語の時間変化をシミュレート 1 1 0 … 0 潜在パラメータ列z𝑙𝑙,∗ 時間𝑡𝑡 1 0 0 … 1 潜在パラメータ列z𝑙𝑙,∗ 1 1 … 2 表層特徴列x𝑙𝑙,∗ 生成 Q𝑘𝑘= 0.0002∗ 0.0003 1 1 0 … 0 2 1 … 3 表層特徴列x𝑙𝑙,∗ 潜在パラメータ列z𝑙𝑙,∗ Step 1. 各言語を潜在表現に変換 推論

(23)

• 含意的普遍性 [Greenberg, 1963]

– 目的語・動詞と名詞・関係節の 語順の関係

• If VO, then NRel • If RelN, then OV • 基本語順の変化は一大変化であり、他の 特徴の変化と連動しているはず – 英語のSVO語順への変化は、孤立語化と連動 しているように見える 17

特徴間の依存関係を利用した

分析の精緻化

NRel RelN VO ○ × OV ○ ○

(24)

18

単純に特徴ごとに遷移率行列を

用意すると独立性を仮定したことに

11 11 11 11 21 22 ? ? ? ? ? 0 tim e bef ore pres en t 11 11 22 ? ? 𝑡𝑡1 = −𝛼𝛼𝛽𝛽 1 𝛼𝛼1 1 −𝛽𝛽1 𝑡𝑡2 = −𝛼𝛼𝛽𝛽 2 𝛼𝛼2 2 −𝛽𝛽2 • 特徴対の値の組み合わせ12が不自然だと いう知識を推論に反映させられない ○ × ○ ○ 1 2 1 特徴2 2 特徴 1

(25)

19

値の組み合わせの展開による

依存関係モデル化

1 1 1 1 3 4 ? ? ? ? ? 0 tim e bef ore pres en t 1 1 4 ? ? • 3個以上の特徴や、多値特徴 (基本語順は 6-7値) は組合せ爆発を起こして推論困難 [Dunn+, Nature 2011] 1 2 3 4 1 2 1 2 𝑞𝑞12 𝑞𝑞21 𝑞𝑞24 𝑞𝑞42 𝑞𝑞43 𝑞𝑞34 𝑞𝑞31 𝑞𝑞13 𝑡𝑡 = ∗ 𝑞𝑞12 𝑞𝑞13 − 𝑞𝑞21 ∗ − 𝑞𝑞24 𝑞𝑞31 − ∗ 𝑞𝑞34 − 𝑞𝑞42 𝑞𝑞43 ∗ 11 12 21 22 11 12 21 22 特徴2 特徴 1

(26)

104個の特徴を100個の2値パラメータに再編 – パラメータは仮定により互いに独立 • 確率的生成モデル – パラメータ列から特徴列への変換は生成 – 特徴列からパラメータ列への変換は事後推論 20

表層特徴列を互いに独立な

潜在パラメータ列に写像

1 1 0 … 0 2 1 … 3 表層特徴列x𝑙𝑙,∗ 潜在パラメータ列z𝑙𝑙,∗ 推論 [Murawaki, IJCNLP2017] 1 0 0 … 1 潜在パラメータ列z𝑙𝑙,∗ 1 1 … 2 表層特徴列x𝑙𝑙,∗ 生成 潜在空間上で 操作

(27)

21

特徴間の依存関係を捉えるのは

重み行列

𝑊𝑊

0 1 0 … 1 × … 重み行列𝑊𝑊 = 8.4 -2.3 -7.3 … 2.5 2.9 6.3 8.2 0.2 … 0.4 -4.3 -0.2 0.3 … -0.3 -5.7 -2.5 1.2 … -0.2 5.9 0.3 -2.4 … … … …… 1 1 … 3

Softmax分布から 確率的に生成 潜在パラメータ列z𝑙𝑙,∗ 表層特徴列x𝑙𝑙,∗ 特徴スコア列�𝜃𝜃𝑙𝑙,∗ [Murawaki, IJCNLP2017]

(28)

21

特徴間の依存関係を捉えるのは

重み行列

𝑊𝑊

0 1 0 … 1 × … 重み行列𝑊𝑊 = 8.4 -2.3 -7.3 … 2.5 2.9 6.3 8.2 0.2 … 0.4 -4.3 -0.2 0.3 … -0.3 -5.7 -2.5 1.2 … -0.2 5.9 0.3 -2.4 … … … …… 1 1 … 3

Softmax分布から 確率的に生成 潜在パラメータ列z𝑙𝑙,∗ 表層特徴列x𝑙𝑙,∗ 特徴スコア列�𝜃𝜃𝑙𝑙,∗ [Murawaki, IJCNLP2017] 表層特徴列の一部 (26.9%) が与えられたとき、 残りの欠損値、潜在パラメータ列、重み行列𝑊𝑊 を事後推論

(29)

22

獲得されたパラメータの

地理的分布の例

表層的特徴に見られた地理的信号を潜在的パラ

(30)

言語構造の 潜在表現 史的変化の 統計的推論 シミュレーション による分析 Step 3.遷移率行列を用いて言語の時間変化をシミュレート 1 1 0 … 0 潜在パラメータ列z𝑙𝑙,∗ 時間𝑡𝑡 1 0 0 … 1 潜在パラメータ列z𝑙𝑙,∗ 1 1 … 2 表層特徴列x𝑙𝑙,∗ 生成 Q𝑘𝑘= 0.0002∗ 0.0003 1 1 0 … 0 2 1 … 3 表層特徴列x𝑙𝑙,∗ 潜在パラメータ列z𝑙𝑙,∗ Step 1.各言語を潜在表現に変換 推論 23 Step 2.系統樹群から各潜在パラメータの遷移率行列を推定 (内部ノードの状態、年代も同時推定) 1 1 0 … 0 1 0 0 … 0 0 0 1 … 1 1 0 0 … 0 0 0 1 … 1 0 1 1 … 1 1 1 1 … 0 1 1 1 … 0 0 tim e b ef ore pres en t Q𝑘𝑘 = 0.0002∗ 0.0003 各パラメータの 遷移率行列

(31)

24

2千年後の基本語順の予測

平均遷移確率 語順維持確率の 言語ごとのばらつき

(32)

25

(33)

• SVO語順を持つ言語のうち、 どのような特徴を持つものが 安定的? – 孤立語性と語順維持確率に高 い相関 • 日本語が2千年後にSVO語順 に変化する (12.3%) 場合、何 が特徴的? – 格表示に接語 (「が」「を」) を使わない可能性が高い 26

回帰分析

このばらつきの説明

(34)

• 潜在表現への変換により言語の構造的特 徴間の依存関係を捉える史的変化の分析 手法を提案 • 今後の課題 – 基本語順以外の特徴の分析 – 祖語の推論結果の分析 – 大語族の系統推定と世界祖語(?)の語順推定 – 接触のモデル化 [Murawaki, NAACL2016] 27

まとめと今後の課題

(35)

参照

関連したドキュメント

機械物理研究室では,光などの自然現象を 活用した高速・知的情報処理の創成を目指 した研究に取り組んでいます。応用物理学 会の「光

東京大学 大学院情報理工学系研究科 数理情報学専攻. hirai@mist.i.u-tokyo.ac.jp

情報理工学研究科 情報・通信工学専攻. 2012/7/12

日本語で書かれた解説がほとんどないので , 専門用 語の訳出を独自に試みた ( たとえば variety を「多様クラス」と訳したり , subdirect

関西学院大学手話言語研究センターの研究員をしております松岡と申します。よろ

今回の調査に限って言うと、日本手話、手話言語学基礎・専門、手話言語条例、手話 通訳士 養成プ ログ ラム 、合理 的配慮 とし ての 手話通 訳、こ れら

 英語の関学の伝統を継承するのが「子どもと英 語」です。初等教育における英語教育に対応でき

本センターは、日本財団のご支援で設置され、手話言語学の研究と、手話の普及・啓