様 式
6
三百子間ふ文
目
3
表
(
中
工)
報告番号
l
乙
工
第
165
氏名
森 旧 和 宏
工
I
{
多
学位論文題目
トラ
イ
構造を用いた共起情報の効率的記憶検索法に関する研究
論文の目次 第1jき 緒 論 第2章 共起情報と辞書構成法 第3章 トライ情造 第41主 ダブル配列法 第5章 リンクトライ 第6章 評価と考察 第7車 結 論 参考論文 主論文 1.“トライ憐j査を用いた共起情報の効率的検索アルゴ'}ズムペ森田和宏,望月久稔, 111川善弘,青江順一,情報処理学会論文誌
,
VoI..J9,
No.9,
pp.2563-2571 (1998)2. "A Link Trie Structurc of Storing Multiple Attribute Rclalionshipsfor Nalural Languagc Oictionarics", J(azllhiro Morita, l¥1asafumi Koyama, Masao Fukctan.nd Jun-ichiAoe, Jnterna.tional JOllrnal of Complllcr Mathematics, 1勺1.72,No.4, pp.463-176 (1999).
3."Fast Insertion Mcthods of a Doublc-Array Structure", I{azuhiro Morita, Toru Sumitomo, Ma.sao Fukct.rI.and .Jun-ichi Aoe, Software Prλcticc & 8xpericncc.(条件付採録)
副論文
l“拡張ノ、yシユt法去における部分文字列倹索の設計と実現 誌, ¥101.38, No.2, pp.310-320 (HHJ7)
2.“特徴べクトルによる全文検完紫:の一改吉普子訂j法去 pp.826-829 (1998)
3.“.AP日tand Compact Data StructUI巴ofStoring Multi-Attribut.c Rclations among Words", 1くaZllhiroMorita, ToruSumitomo, Masao Fukela and Jun-ichi Aoe, 1998 IEGE Internalional Confcrcncc on Systcms, Man, and Cybernetics, pp.2791-2796, San Dicgo, California, USA (Ocし1998)
4."A FastR.巴tricvingAIgorithm of [[icrarchical Rclationships Using Tric Struclurcs"
,
Masafumi Koyama,
Kazuhiro I[orita, ,¥][asao Fllketa anclJun-ichiAoc, Information Proccssing & Managcment, Vo.134, No.6, pp.761-773(1998)
5.“A Mcthod of Stori口gMulti-八ttribut.eRelations inNatural Langllagc Dictionaries", Kazllhiro Morita, Makolo Okada
,
M出 aoFlllくe.taancl Jun-ichiAoe,
Proc. of the 18th Int'1 Conf.on Comput巴rProccssil1g of Oricntal Languages, pp.437-442, Tok川lima,Japan (Mar. 1999)6.“EfficientControlling of Parsing-Stack Operations for LR Parscrs", Masao Fukcta, Kazuhiro Morita, Sangkon Lc巴andJun-ichi Aoe, 1川ernatio日 1Journal of lnformation Scicnccs, Vol.118, pp.I-15-157 (1999)
7. "Similarity m巴aSllresusing ncgativcwcight and its application Lo word日imilrl.rily"
,
EL Sλycd Atlみm,Kazuhiro Morita,
l¥1'asao Fuketa and Jun-ichi Aoc,
lnformation Proccssing & lVlanagcmcnt (印刷l中).8. “複合詩の分野i連l~恕U巳.詩の 3労効1拘'}~率容的『決た定 i法去
9.“キーワードの遅延納山を考慮した文書検索構造の効率的構成法'¥阿国立,安!'I長一秋,森印刷15配,青江順一,情報処理学会 論文誌(粂件付採録)
備 考
l
論文目録は
,
用話が英語以外の外国語のときは日本記訳をつけて,外国間
,
日本誌の )
I
I
Nに列記するこ
と.
2
参考論文は
,
論文題目
,
著者名
,
公刊の )
J
法及び時期を
)
l
l
f
t
に明記すること
.
3
参考論文は
,
博上論文の場合に記載すること.
株式
7
論 文 内 容 要 旨
征二i)
報 告 番 号 │ 乙 工 第
165
号│
氏名
森 田 和 宏
工 修
学位論文題目
ト ラ イ 構 造 を 用 い た 共 起 情 報 の 効 率 的 記 憶 検 索 法 に 関 す る 研 究
本論文は,自然言語昨書に間築される基本語棄の関係を定義することで無限に作り出され
る共起情報の効率的な記憶検索校法に関する研究の成果をまとめたものであり,以下の 7章
により構成される.
第
l
章では,緒論として
,自然、
言語処理システムにおける共起情報の利
用の歴史的背
景
を述べると共に,本研究の目的ならびにその工学上の意義を述べることで
,
本研究の意義及
び位置付けを明確にする
.
第 2章では,共起情報の概要と意義について説明する.また,自然言語処理システムにお
ける辞書の意義についても述べ,辞書:を構成する基木的なア
jレゴリズムについて説明する.
第
3章では,辞書の構成法として最も適しているトライ構造について概要を述べ,その
検索,更新アルゴリズムについて説明する.
第
4
章では,
ト
ライ構造を実装するためのデータ構造について説明し,最も効率的な手
法であるダブル配列法について,検索,更新アルゴリズムとともに詳細に述べる.また,ダ
ブル配列法の問題点であるキー追加の速度を改善する手法として,ダブル配列で構築された
辞書を変更することなく高速化する手法と,ダブル配列に格納した情報を利用して高速化を
実現する手法を提案する
.
第
5
章では,共起│育報を効率的に記憶検索する手法として,関連日f
宛とともに提案手法
であるリンクトライについて述べ,リンクトライにおいて定義されるリンク情報により,冗
長性を排除した効率的な記憶が可能となることを示し,同時に提案した梢造における共起情
報の検索,更新アルゴリズムを説明する.また,ダブル配列を用いたリンクトライのデータ
構造についても説明し
リンクトライのデータ構造を提
案する上で考案された
,複数の辞
書
を lつのダブル配列で管理する手法も述べる.
第
6
章では,提案手法に対して検索速度,記憶効率の理論的評価,及び実験による評価
を与え,本手法の有効性を確かめ,考察を加える.
第
7章では,本研究で得られた諸成果の総括を行い,今後の研究課題について述べる
.
トライ構造を用いた共起情報の効率的
記憶検索法に関する研究
2000
年
3
月
森 田 和 宏
, 内
"
'
"
トライ構造を用いた共起情報の効
率
的
記憶検索法に関する研究
2
0
0
0
年
3
月
森田和宏
内容梗概
本論文は,自然
言
語 辞
書
に構築される基本語棄の関係を定義することで無限に作り出
される共起情報の効率的な記憶検索伎法に関する研究の成果をまとめたものであり,以下
の
7
章により構成される
.
第 l章では,緒論として,自然
言
語処理システムにおける共起情報の利用の歴史的背
景を述べると共に,本研究の目的ならびにその工学上の意義を述べることで,本研究の意
義及び位置付けを明確にする
.
第 2章では,共起情報の概要と意義について説明する.また,自然
言
語処理システム
における辞書の意義についても述べ,辞書を構成する基本的なアルゴリズムについて説明
する
.
第
3
章では,辞書の構成法として最も適しているトライ構造について概要を述べ,そ
の検索
,
更新アルゴリズムについて説明する
.
第 4章では,
トライ構造を実装するためのデータ構造について説明し,最も効率的な
手法であるダブル配列法について
,
検索,更新アルゴリズムとともに詳細に述べる
.
ま
た
,
ダブル配列法の問題点であるキー追加の速度を改善する手法として
,
ダブル配列で構
築された辞書を変更する
こ
となく高速化する手法と,ダブル配列に格納した情報を利用し
て高速
化
を実現する手法を提案
す
る
.
第 5章では
,
共起情報を効率的に記憶検索する手法として,関連研究とともに提案手法
である
リ
ンク
ト
ライについて述べ
,
リンク
ト
ライに
お
いて定義されるリンク情報により
,
冗長性を排除した効率的な記憶が可能となることを示し
,
同時に提案した構造における
共起情報の検索,更新アルゴ
リ
ズムを説明する
.
また
,
ダブル配列を用いたリンクトライ
の デ
ー
タ構造についても説明し,
リンクトライのデータ構造を提案する上で考案された,
複数の辞書を
l
つのダブル配列で管理する手法も述べる
.
第
6
章では
,
提案手法に対して検索速度,記憶効率の理論的評価
及び実験による評
価を与え,本手法の有効性を確かめ,考察を加える
.
第 7章では,本研究で得られた諸成果の総括を行い,今後の研究課題について述べる
.
関連発表論文
{
主論文]
1
.森田和宏.望月久稔:山川善弘
1青 江 順 一 :
“
ト
ライ構造を用いた共起情報の効ギ的検
索アルゴリズム
2
.
Ka
臼z
u
h
i
r
、刀'
0
:
t
¥
I
o
r
i
.
'
i
、凶t
a
,
:
'
d
a
絹s
a
f
白
umiK
く
O句yama.
~Ia泊saoFuk
c
t
a
a
nd J
ム
u
川n
ト-1児
c
川
h
iA
oe:
.
.
_
-
¥
.
Link
T
r
i
S
t
r
u
c
t
u
r
e
o
f
S
t
o
r
i
n
g
¥
l
I
u
l
t
i
p
l
e
At
t
r
i
b
u
t
e
R
e
l
a
t
i
o
n
s
h
i
p
s
f
o
r
~atur
a
l
Language
Di
c
t
i
o
-n
a
r
i
e
s
"
,
I
n
t
e
r
n
a
t
i
o
n
a
l
J
o
u
r
n
a
l
o
f
Compllter
:
t
¥
I
a
t
h
e
m
a
t
i
c
s
,
¥
'
0
.
1
7
2
、N
o
.
.
J
,
pp
.
-
16
3
-
i
-
!
G
(
1
9
9
9
)
3
.
Kazuhiro
1
I
o
r
i
t
a
‘Tor
u
Sumitomo
,
:
t
¥
I
a
s
a
o
Fuk
e
t
a
and
J
u
n
-
i
c
h
i
Ao
e
:
“
F
a
s
t
I
n
s
e
r
t
i
o
n
I
e
t
h
o
d
s
o
f
a
Double-Arra
y
S
t
r
u
c
t
u
r
e
"
,
S
o
f
t
w
a
r
e
P
r
a
c
t
i
c
e
&
Exp
e
r
i
e
n
c
e
,
(条件付採
録)
{
副論文
]
1.望月久稔
7森 田 和 宏
7獅々堀正幹?青江
}
I
I
真
一
:
“
拡張ハ
ッシュ法における部分文字列検
索 の 設計
と実現
1
¥
情報処理学会論文誌ぅ
Vo
1
.
3
8
,
No.2
,
pp
.
310
-
3
2
0
(
1
9
9
7
)
.
2
有田健,森田和宏
1溝
1
-
f
IJ昭二
7青 江順
一 " 特徴 ベ ク ト ル に よ る 全 文 検 索 の
一改善法、
7情報処理学会論文誌,
Vo
1
.
3
9
,
No
.
3
,
pp.826
-
829
(
1
9
9
8
)
.
3
.
Kazuhiro Morita
,
Toru Sumitomo
,
r.v
I
a
s
a
o
Fuk
e
t
a
and
J
u
n
-
i
c
h
i
Aoe
μ
A F
a
s
t
and
Compact
Data
S
t
r
u
c
t
u
r
e
o
f
S
t
o
r
i
n
g
M
u
l
t
i
-
A
t
t
r
i
b
u
t
e
Re
l
a
t
i
o
n
s
among Words
"
,
1
9
9
8
IEEE I
n
t
e
r
n
a
t
i
o
n
a
l
Co
n
f
e
r
e
nce
o
n
System
s
,
¥
I
I
an
,
and C
y
b
e
r
n
e
t
i
c
s
,
p
p
.
2
7
9
1
-
2796
,
San
Di
e
g
o
,
Ca
l
i
f
o
r
n
i
a
,
USA (
O
c
t
.
1998
)
4
.
'
l
v
l
a
s
a
f
u
m
i
Koyama
,Kazuhiro
~Iorita ,
~Iasao
Fuketa and
J
u
n
-
i
c
h
i
Ao
e
:
“A
F
a
s
t
R
e
-t
r
i
e
v
i
n
g
Algorithm
o
f
H
i
e
r
a
r
c
h
i
c
a
l
R
e
l
a
t
i
o
n
s
h
i
p
s
U
s
i
n
g
T
r
i
e
S
t
r
u
c
t
u
r
e
s
"
,
Inform
a
t
i
o
n
P
r
o
c
e
s
s
i
n
g
&
i
v
I
a
n
a
geme
n
t
】Vo
.
1
3
4
,
1
¥
0
.
6
,
p
p
.
7
6
1
-773 (
1
9
9
8
)
lV
ο
.
I~azllhiro ~Iorita. ~IakotüO
k
a
d
a
.
~IasaoFuk
c
t
a
a
l
l
d
J
l
l
n
-
i
c
h
i
.-¥00λ
¥
I
I
c
t
h
o
d
o
f
S
t
o
r
i
n
g
:
¥
h
d
t
i
-
A
t
t
r
i
b
n
t
e
.
R
e
l
a
t
i
o
n
s
i
n
:
¥
a
t
u
r
a
l
L
a
l
l
g
u
a
g
c
Di
c
t
i
o
n
a
r
i
e
s
司Pro
c
.
o
f
t
h
c
1
8
t
h
I
n
t
I
Co
n
.
f
o
n
Co
m
J)u
t
e
r
Pr
o
c
e
s
s
i
n
g
o
f
O
r
i
p
l
l
t
a
l
Lan
g
ua
g
e
s
,
p
p
.-
1
3i
-
-
l
-
l
2
T
o
ku
s
him
a
.
J
a
p
a
n
(
:
¥
I
a
r
.
1
9
9
9
)
6
.
:
¥
I
a
s
a
o
Fuk
e
t
a
;
E
a
z
u
h
i
r
o
¥
i
I
o
r
i
t
a
.
S
a
n
g
ko
IlL
e
e
and J
l
l
l
l
-
i
c
h
i
λ
o
e
:
"E
斤
i
c
i
e
n
t
C
o
n
t
r
o
l
-l
i
n
g
o
f
P
a
r
s
i
n
g
-
S
t
a
c
k
Op
c
r
a
t
i
o
l
f
l
o
r
LR
Par
s
e
r
s
'
)
,
I
l
l
t
e
r
n
a
t
i
o
n
a
l
J
o
u
f
n
a
l
o
f
I
n
f
o
r
m
a
t
i
o
n
S
c
i
e
n
c
e
s
、¥
'
0
1
.
1
1
8
、pp
.
1
-
l
5
-
15i
(
1999
)
7
.
EL Sa
y
e
d A
t
l
a
m,
¥
l
I
a
s
a
o
Fukcta
,
Kazuhiro
¥
I
I
o
r
i
t
a
and J
u
n
-
i
c
h
i
Aoe
"
Simi
l
a
r
i
t
y
i
¥
I
e
a
s
l
l
r
e
l
l
l
c
n
t
Us
i
n
g
Term Ne
g
a
t
i
v
e
¥
V
e
i
g
h
t
and
I
t
s
A
p
p
l
i
c
a
t
i
o
n
t
o
i
Nord Sim
i
l
a
r
i
t
y
"
,
I
n
f
o
r
m
a
t
i
o
n
Pro
c
e
s
s
i
n
g
&
l
¥
Ianagement
】Vo
.
1
3
6
,
N
0
.
3
(
2
0
0
0
)
(印刷中)
8
.
辻孝子?説、
田正
雄
3
森 田 和
宏?青江
1
)
1
買 ー "
複
合 語
の分野連想
詰
の効
率
的 決 定 法
3
¥
自然
言 語
処
理
1Vo
1
.
7
,
NO.2 (
2
0
0
0
)
(
印刷中)
9
.岡田
真?安
藤 一
秋
1森
田和
宏?青江 順-
•
"キーワードの遅延抽出を考慮した文書検
索
構
造
の効率
的 構 成 法ぺ
情報処理学会論文誌(条件付採録)
•
【
講演報告
}
1.森田和宏?望
月 久 稔
3獅 々 堀 正 幹
?
青 江 順一 "
トライ構造を用いた共起情報の効率的
検索アルゴリズム
目
ノ
、
ん
人
7内
容 梗概 .
関 連 発表
論 文
第
1
章 緒 論
第
2
章
共 起 情 報 と 辞 書 構 成 法
2
.
1
緒
言
- ・ ・ ・ ・ ・ .2
.
2
共 起 情 報 .
・ .2
.
3
辞 書 構 成 法
- ・ 4 ・ . . ..
.
- ・ ・2
.
4
結
言
.
..
.
第
3
章
トライ構造
3
.
1
緒
言
-ー ・ 4‘ ・3
.
2
ト ラ イ 構 造 の 概 要 .
•
3
.
3
トライの圧縮
- ・ ・ a ・ a3
.
4
結 言
- ー ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・第
4
章
ダフ
jレ配ヲIj法
4
.
1
緒 言
- ・ ・ ・ ・ ・ ・ . . . . - ー ・4
.
2
トライのデータ構造
ー ・ ・ ・ ー - ・ ・4
.
3
ダブル配列の検索アルゴリズム
4
.
4
ダブル配列の更新アルゴリズム
4
.
5
追 加 の 高 速 化
4
.
6
結 言
第
5
章
リンクトライ
5
.
1
緒
言
- ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ . - ・ 4‘ ・5
.
2
共 起 情 報 の 格 納 構造
.
. ・ 1111
3
3
3
: .:>8
9
9
9
1
3
2
1
23
23
23
32
3-
1
45
54
55
55
55
V5
.
3
リ ン ク ト ラ イ の 検 索 ア ル ゴ リ ズ ム
5
.
-
1
リ ン ク ト ラ イ の 更 新 ア ル ゴ リ ズ ム
5
.
5
リ ン ク ト ラ イ の デ ー タ 情 造 .
5
9
6
2
6
-
1
(O
7
9
7
9
7
9
8
2
87
8
9
9
1
93
95
99
101
図 目 次
5
.
6
結 言
第
6
章 評 価 と 考 察
2
.
1
表 形 式 の 辞 書
モ デ ル
G
6
.
1
緒 言
2
.
2
ハ ッ シ ュ 法
6
.
2
理 論 的 評 価
6
.
3
実 験 に よ る 評 価
6
.
4
リンクトライの応用
3
.
1
キ ー 集
合
!
¥
'
1
に 対 す る ト ラ イ
3
.
2
遷移
g
(
s
,
α
)
=
t
.
.
.
.
3
.
3
i
η
d
e
g
r
e
e
(
s
)
=
2
,
o
u
t
d
e
g
r
e
e
(
s
)
二3
の 例
3
.
4
キ
ー
集 合
!
{
2
に 対 す る ト ラ イ
3
.
5
シ ン グ ル ス ト リ ン グ を 用 い た キ ー 集 合
!
{
2
に 対 す る ト ラ イ
3
.
6
図
3
.
5
の ト ラ イ に , キ -
"
b
a
b
y
l
on#
刊
を 追 加 し た 例
3
.
7
図
3
.
5
の ト ラ イ か ら , キ -
"
badge#
日を削除した例
ハ
U
1
2
4
にU
Q
U
O
-ム 1l ム 1 ム 1l ム 1 i 1 1 4 円 /-6
.
5
結 言
第
7
章 結 論
謝辞
参 考
文
献
付 録
B
リ ン ク ト ラ イ の 実 験 に 使 用 し た キ ー 集 合
B
.
1
関 係 情 報 の 内 部 表 現 値
B
.
2
日 本 語 共 起 辞 書
•
.
1
0
1
4
.
1
配 列 を 用 い た ト ラ イ の 例
.
4
.
2
配 列 を 用 い た キ ー 集 合
!
{2
に 対 す る ト ラ イ
4
.
3
J
o
h
n
s
o
n
の 方 法
4
.
4
ダ ブ ル 配 列 構 造
- ・ ・ ・ ・ ・4
.
5
K2
に 対 す る ト ラ イ と ダ ブ ル 配 列
.
.
4
.
6
ダ ブ ル 配 列 を ノ ー ド で 分 解 し た
例
- ・ ・ ・ ・ ・ ・ ・ ・4
.
7
関 数
MO
DI
FY
の 動 作 例
2
-
1
付 録
A
ダ ブ ル 配 列 の 実 験 に 使 用 し た キ ー 集 合
2
5
4
.
8
図
4
.
5の ダ ブ ル 配 列 に キ ー “
bbq#"
を 追 加 し た 例
4
.
9
図
4
.
5
の ダ ブ ル 配 列 か ら キ ー
“
b
c
s
子学"を削除した例
4
.
1
0
S
k
i
P
_
T
α
t
e
の 値 に よ る 追 加 時 間 と 空 ノ ー ド の 割 合 .
4
.
1
1
範 囲 限 定 法 を 用 い た ト ラ イ と ダ ブ ル 配 列
4
.
1
2
関
委
文
SET
_EMPTY
_
L
INK
の重力作
4
.
1
3
空 ノ ー ド リ ン ク 法 を 用 い た ダ ブ ル 配 列
円 O Q u n U 1 i Q U 7 -A 吐 円 。 司 iつ
ω A 吐2
2
3
3
3
4
4
4
4
5
5
B
.
3
英 語 共 起 辞 書
.
1
0
3
.
1
0
6
5
.
1
!
{
3
に 対 す る ダ ブ ル ト ラ イ
5
.
2
C1
に 対 す る リ ン ク ト ラ イ の ト ラ イ 部
57
5
9
VI V115
.
3
図
5
.
) に 付 す る ダ フ ル 配 列 .
5
.
-
1
ダブル配ダiJ
D
(
f
(
1
7
)
)
の例
0.0ダブル配列
DF
[
]
r
と表
hEYID
の例
5
.
6
トライ部とリンク関数の連結
5
.
7
C1
に 対 す る リ ン ク ト ラ イ の ダ ブ ル 配 列 表 現
5
.
8
C1
に 対 す る リ ン ク ト ラ イ の ト ラ イ 表 現 .
6
5
6
6
6
9
表 目 次
7
0
7
6
5
.
1
C1
に 対 す る リ ン ク ト ラ イ の リ ン ク 関 数
.
6
0
( (6
.
1
キ ー 追 加 時 の 空 ノ ー ド の 割 合 の 結 果
6
.
2
提 案 手 法 で の 空 ノ ー ド の 割 合 の 結 果
6
.
3
ダブル配列のキー追加時間の結果
6
.
4
ダブル配列のキー削除時間の結果
6
.
5
記 憶 量 に 対 す る 結 果
6
.
1
リンクトライの実験結果
8
i
勺 J l t F h U ρ O Q u n x U 口 δ n δ n 6 n 6 Vlll IX喧喧冒喧喧喧軍国国璽哩堕聞里国軍曹璽里璽雪璽喧喧喧国軍国国璽園園園国国璽璽園璽璽聞置