類似度関数
鈴木 昇一
Some Examples of Similarity-Measure Functions Constructed by
Using Patterns Before and After a Pattern to Be Recognized and
Representative Patterns of Other Categories
Shoichi Suzuki
要 約
入力パターンと記憶されている或るカテゴリを代表しているパターン(代表パターン)との単なる マッチングによって,入力パターンの認識を行うことがしばしば,採用される.マッチングには入 力パターン,代表パターン間の類似度が用いられる.パターンのモデル(正規化パターン,標準形) を導入する.本論文では,正規直交性,規格化条件(確率条件),モデル化不変性の3性質を満たし, 入力パターンの前後のパターンからなる文脈に依存した類似度関数が構成される.また,入力パ ターン,代表パターン間の類似度の分子が自分以外の他のカテゴリの代表パターンモデルの集合か ら定まる構成手法も研究されており,他の諸研究に類をみない.この結果,他のカテゴリから眺め, 文脈を考慮した類似度関数が得られることになった.この2種類の類似度関数以外に,文脈に依存し ない幾つかの有用な類似度関数が構成されている.1つの類似度関数を含む形式で,今1つの類似度 関数を構成する再帰的手法も研究されている.得られた類似度関数のあるものはパターン間分離の 様子をうかがい知れるという意味で有用である.キーワード
(1) 代表パターン (2) 類似度関数 (3) 正規直交性 (4) 確率条件 (5) モデル化不変性 (6) 文脈 (7) 再帰的手法Abstract
It is well known that an input pattern ϕ can be often recognized by quite simply matching ϕ to a representative pattern ωj of the jth cate-gory C j. This matching necessitates a
similarity-measure (0≤)SM(ϕ,ωj)(≤1) between ϕ and ωj. We represents a corresponding model ( a
canonical form) of ϕ as T . In this paper we construct a function SM which must satisfy three ϕ properties of an orthonormality, a probability-condition and an invariance under a model-construction operator T so that it depends upon patterns (i.e., a context of ϕ) directly before and after ϕ which influence the meaning of ϕ.Besides we construct SM so that a numerator of SM(ϕ,ωj) may be expressed by using only a set of Tωi(i≠ j) except Tωj. This two kinds of SM can
characterize an originality of this search. Many examples of SM which does not depend upon the context of ϕ are gained by its application. Moreover We research on recursive methods by which a new SM can be constructed using an old MS ′ . The obtained SMs are useful because some of
them may make clear a separation of two patterns.
Key Words
(1) representive patterns (2) similarlity-measure function (3) orthonormality (4) probability condition
(5) invariance under model-construction operators (6) context (7) recursive methods
1.はじめに
情報表現には,(1)変形がない記号列,(2)変形があってもよいパターンの2種類があるけれども, 知能処理の最も素朴な処理は,任意に与えられた2つ以上の情報表現が等価(同等)であるかどうかを 決定する操作(単一化操作;unification)である. パターン認識の働きは, パターン同士の等価性を規定する(SS公理系から組み立てられた)カテゴリ帰属知識理論(パターン の意味領域論;文献[5]のG2章を参照)の下で,連想型認識方程式を解く ことだと(文献[5]の,G6,G7,G8の3章を参照),明らかにしたのが,等式論理アプローチを採用 するSS理論[3]~[6]である. 記号列を用いて推論する場面での,知能処理の最も基本的な処理は,ある等号理論の下で,記号 列で表される情報同士に等価性が存在するかどうかを決定することである.同様に,パターンを用 いて推論する場面での,知能処理の最も基本的な処理は,等式 2 1 ϕ ϕ T T = が成立する2つのパターンϕ1∈Φ,ϕ2∈Φを等価だとみなす操作(文献[6]のA16.2,A16.3両節を参 照)である.ここに,Φ は処理の対象とする問題のパターンϕの集合であり,T:Φ→Φ はモデル 構成作用素と呼ばれる写像であるような対[ TΦ, ]を,axiom 1を満たす順序対として導入している. 認知心理学には, 「概念のカテゴリはプロトタイプ(代表パターン)からの類似性によって構成される」 という考えがある。 Axiom 2を満たす類似度関数 } 1 0 | { }) | { ( :Φ×Ω= j∈J → s ≤s≤ SM ωjには, ) , ( j SM ϕω はパターンϕが第 j∈ 番目のカテゴリCJ jの代表パターンωjと似ている確率である と,解釈を与えることができ,この類似度関数SM は,T 不変性− ) , ( ) , ( , , j J SM Tϕωj SM ϕωj ϕ∈Φ∀ ∈ = ∀ を満たしているので,T−SMの保存性 2 1 ϕ ϕ T T =
⇒
∀j∈J,SM(ϕ1,ωj)=SM(ϕ2,ωj) が 成 立 す る . よ っ て , 等 式Tϕ1=Tϕ2を 満 た し , 互 い に 等 価 性 を 備 え て い る2 つ の パ タ ー ン Φ ∈ Φ ∈ 2 1 ,ϕ ϕ は,類似性の観点からも,類似性に関する等式 ) , ( ) , ( ,SM 1 j SM 2 j J j∈ ϕ ω = ϕ ω ∀ が成立している.このように,類似性の観点からも,類似度関数SM を用いれば,2つのパターン Φ ∈ Φ ∈ 2 1 ,ϕ ϕ を等価だとみなすことが可能となる. 入力パターンϕが記憶しているパターンωj(第j∈ 番目のカテゴリCJ jの典型的な諸性質を代表 しているパターン)と似ている度合いをどう計量するかはパターン認識技術[3],[5],[6],パター ン照合技術,画像データベースの検索技術[2]などの基本である.本論文では,ϕの左にあるパ ターンηとϕの右にあるパターンψとから成る文脈“η•ψ”を考慮し,3性質 (ⅰ) 代表パターン間の正規直交性 (ⅱ) すべてのカテゴリにわたる総和が1 になるという規格化性 (ⅲ) パターンモデル構成作用素 T の下での不変性 を満たすように,ϕがωjと似ている度合いとしての類似度関数SM(ηϕψ,ηωψj )を構成する手法が, (ⅰ)の正規直交性,(ⅱ)の規格化性,(ⅲ)のT の下での不変性 を満たす“文脈を考慮しない類似度関数SM(ϕ,ωj)”を介し,研究される. (a) 他のカテゴリ,自らのカテゴリから各々眺めた類似度関数SM(ϕ,ωj),並びに (b) 類似度関数SM′(ϕ,ωj)から今1つの類似度関数SM(ϕ,ωj) を構成する再帰的手法も研究されるが,これらも他のこれまでの研究に類を見ないけれども,文脈 を考慮した類似度関数の構成論的研究は,著者の知る限り,本論文で初めてなされるものであり, 他に類を見ない.尚,文脈を考慮しない類似度関数SM(ϕ,ωj))ですら,3性質「正規直交性・規格化 性・T の下での不変性」を満たすものは,2文献[5],[6]によるものを除いては,これまで,如何な る研究者により提案されていない[1],[2],[25].パターンは通常,文脈の中に置かれることを考 えると,この種の研究はパターン認識技術,パターン照合技術,画像データベースの検索技術の確 保にとって有用である. 上述の正規直交性質(ⅰ)は相異なるカテゴリに属する代表パターン同士は完全に分離できること を意味し,この正規直交性質(ⅰ)を満たす類似度関数SM の構成はこれまで,困難と考えられてい ることに注意しておく.また,規格化性質(ⅱ)は,SM が確率測度と解釈することを可能にし,類 似 度 関 数SM(ηϕψ,ηωψj ) は , 文 脈 “η•ψ” の 中 で パ タ ー ンϕが カ テ ゴ リ C jに 帰 属 す る 確 率 { prob Cj /ηϕψ}である,つまり,等式 = ) , ( j SM ϕω prob C{ j /ηϕψ} (1) の成立を容認できることになる.更に,T の下での不変性質(ⅲ)は = ) , ( j SM ϕω prob C{ j /ηTϕψ} (2) であること,つまり,原パターンϕとそのモデルT が各カテゴリCϕ jに帰属する確率を同一ならし めるものである.文脈を考慮していない“ϕがωjと似ている度合いとしての類似度関数”SM(ϕ,ωj)について考える と,上述の3性質(ⅰ),(ⅱ),(ⅲ)を満たす類似度関数 SM が何故必要とされるか,或いはどのような パターン情報処理の働きをもたらすかは,文脈を考慮しない場合,3付録B,C,Dで解析されている. 可分なヒルベルト空間Hの元ϕのノルム ϕ を導入すると,例えば,文脈を考慮しない場合,柔ら かいファジィクラスタリングから暗示される実数値関数[5], ) , ( j Sϕω
∑
∈ − − = J k k j 2 2 1 1 ω ϕ ω ϕ (3) は,ϕがωjと似ている程度を表す類似度関数であり, (ⅰ´) (正規直交性) = ) , ( i j Sω ω 1 if i= j 0 if i≠ j 但し,∀j∈J,∀i∈J−{j},ωi−ωj >0(代表パターンωj同士間の分離条件) (4) (ⅱ´) (規格化性) ∀ ∈Φ,∑
( , )=1 ∈J j j Sϕω ϕ (5) を満たすが,T の下での不変性質(ⅲ)を満たさない. 知覚心理学の或る考え[24]によれば,表象間の類似性に基づいて,パターンの認識判断がなさ れるという.パターンϕのモデルT はいわば,ϕ ϕの代りとなる“ϕの表象”である.認識システ ム[5],[6]RECOGNITRONがモデルTϕ∈Φを見たり聞いたりしたならば(T を感性的に受け取っϕ たならば),原パターンϕ∈Φと同じに見えたり聞こえたりすること(原パターンϕと錯覚し原パ ターンϕ
と同じように感性的に受容すること)だと,解釈可能なパターンモデルがT である.ならϕ ば,2つのパターンモデルTϕ,Tωj間の類似度関数に,式(3)の類似度関数S(ϕ,ωj)を直す必要がある. パターンϕ∈Φの表象化 ϕ ϕ→T (6) が完結しているためには,パターンモデルT の表象ϕ T(Tϕ)はそれ自身のT でなければならないかϕ ら, L → = = → = → → ϕ ϕ ϕ ϕ −ϕ ϕ ϕ T T(T ) T Tn ( TTn1 ) T (7) が成立しているとしよう[3],[7]~[9].このようなパターンモデルT を出力するモデル構成作ϕ 用素T については,多数存在し[3]~[23],その典型的なものについては計算機シミュレーショ ンされており[9]~[13],[16],[21],[22],付録Aでも簡単にその構成5例が説明されている. ) , ( j Sϕω を表象T が表象ϕ Tωjと似ている程度を表す類似度関数 ) , ( j SM ϕω∑
∈ − − = J k k j T T T T 2 2 1 1 ω ϕ ω ϕ (8) に変換すれば,このSM(ϕ,ωj)は,分離条件式(39)の下で正規直交性(ⅰ),規格化性(ⅱ)を満たし,しかも,付録Aの, T に関する第3番目の性質③(べき等性)を考慮すれば, (ⅲ) (パターンモデル構成作用素 T の下での不変性) ) , ( ) , ( , , j J SM Tϕωj SM ϕωj ϕ∈Φ∀ ∈ = ∀ (9) も成り立つことがわかる. 現在まで,上述の3性質「(ⅰ)正規直交性・(ⅱ)規格化性・(ⅲ) T の下での不変性」を満たす類似度関 数は,2文献[5],[6]によるものを除いては,知られていない. S.Suzukiが不思議に思うのは,ϕ, の内積η (ϕ,η)を導入すると,3性質「(ⅰ)正規直交性・(ⅱ)規格 化性・(ⅲ)T の下での不変性」を満たす有用な類似度関数 SM として,代表パターンモデルTωj同士 間の分離条件式(39)の下で,次の4種類(イ)~(二)の SM 等があるのに,これまでS.Suzuki以外の研 究者により全く提案されていないことである: (イ) (ノルム距離 Tϕ−Tωj による1 exp[ ] 1 2 x − − 形類似度) ) , ( j SM ϕω
∑
∈ − − ⋅ − − ⋅ − − = J k k k j j T T a T T a ] 1 exp[ 1 1 ] 1 exp[ 1 1 2 2 ω ϕ ω ϕ ここに,ak>0(k∈J) (10) (ロ) (ノルム距離 Tϕ−Tωj による ] 1 exp[ 2 x 形類似度) ) , ( j SM ϕω∑
∈ − ⋅ − ⋅ = J k k k j j T T a T T a ] 1 1 exp[ ] 1 1 exp[ 2 2 ω ϕ ω ϕ ここに,ak>0(k∈J) (11) (ハ) (規格化内積の絶対値|( , )| j j T T T T ω ω ϕ ϕ による 2 1 1 x − 形類似度) ) , ( j SM ϕω∑
∈ − − = J k k k j j T T T T T T T T 2 2 | ) , ( | 1 1 | ) , ( | 1 1 ω ω ϕ ϕ ω ω ϕ ϕ 但し,( , )=0 j j T T T T ω ω ϕ ϕ if Tϕ ⋅Tωj =0 (12)(ニ) (規格化内積の絶対値|( , )| j j T T T T ω ω ϕ ϕ による ] 1 [ log 2 1 x2 e − ⋅ − 形類似度) = ) , ( j SM ϕω
∑
∈ − ⋅ − − ⋅ − J k k k e j j e T T T T T T T T ] | ) , ( | 1 [ log 2 1 ] | ) , ( | 1 [ log 2 1 2 2 ω ω ϕ ϕ ω ω ϕ ϕ 0 ) , ( , ≠ ∈ ∃i J TϕTωi L のとき ( p C )j L∀i∈J,(Tϕ,Tωi)=0のとき 但し,正数p C )( j は第j∈ 番目のカテゴリCJ jの出現確率 0 ) , ( = j j T T T T ω ω ϕ ϕ if Tϕ ⋅Tωj =0 (13) □ 尚,処理の対象とする問題の入力パターンϕに関する多段階パターン変換 t t Tϕ ϕ ϕ ϕ ϕ ϕ0≡ → 1→ 2→L→ −1→ (14) による認識法[5],[6],[16]では,第(s-1)段階のパターンϕs−1からϕsへの変換は,2変数 J j Tϕs−1∈Φ, ∈ の2値関数v(Tϕs−1,j)∈{0,1}を導入し,その都度,カテゴリ番号集合J の部分集合 J s T J( ϕs−1, −1)⊆ を発見し, s ϕ ) ) , ( ) , ( ( 1 ) 1 , ( 1 1 j j s s T J j s j SM T T T v T s ω ω ϕ ϕ ϕ ⋅ ⋅ = − − ∈ −∑
− (15) の形式でなされるが,正常な場合,最終認識段階t
で或る代表パターンωjのモデルTωjに変換され るように探索する故に,つまり, j t T J j t= ∃ ∈ ϕ = ω ∃( 0,1,2,L), , (16) が成立するように探索する故に,SM の(ⅰ)正規直交性・(ⅱ)規格化性がこのパターン変換に有効に 働 く こ と が 認 め ら れ て お り ,T の 下 で の ,SM の ( ⅲ ) 不 変 性 も , 認 識 途 中 で 得 ら れ た表 象 ) 0 ( s t s ≤ ≤ ϕ の不変性 ) 0 ( s t Tϕs=ϕs ≤ ≤ (17) から必要とされることも,指摘しておかねばならない. 類似度SM(ϕ,ωj)が最大となるカテゴリ番号 j∈ を持つカテゴリCJ jにパターンϕは帰属すると 決定する最大類似度法では,各SM(ϕ,ωj) (j∈J)の大小に関する序列のみが問題となるが,パター ン変換式(15)による多段階認識法ではこの序列のみならず,各SM(ϕ,ωj) (j∈J)間の差が有効に効 いてくる故に,各SM(ϕ,ωj) (j∈J)間の差を拡大したり,縮小したりすることを可能にする類似度 SM の再帰的構成は意味あるものである. 本論文では,「(ⅰ)正規直交性・(ⅱ)規格化性・(ⅲ)T の下での不変性」を備えた類似度関数SM の 構成手法として,7定理1~7が研究されるが,例えば,2定理1,2を組み合わせると,他のカテゴリ から眺め,文脈を考慮した類似度関数SM が得られることを指摘しておく.2.モデル構成作用素
Tと,類似度関数 SM が満たさなければならないaxiom
本章では,処理の対象とする問題のパターンϕ∈Φについて,任意の1つのカテゴリCjに帰属す るパターンωj∈Ωとの間の類似性の程度SM(ϕ,ωj)を与える“文脈を考慮しない類似度関数”SM が構成されるとき満たさなければならないaxiomが説明される. 2.1 モデル構成作用素T と,その5例 処理の対象とする問題のパターンϕの集まりをΦ としよう. Φ はある可分なヒルベルト空間Hの, 零元を含むある部分集合であるが,このΦ についての詳細な説明が2文献[5],[6]にある.有限の 全カテゴリ集合 C(J)≡{Cj ||J|≥2,j∈J} (18) についての全代表パターン集合 ) }( | { ∈ ⊆Φ ≡ Ω ωj j J (19) は1次独立であることを要請する.第j∈ 番目のカテゴリCJ jの持つ諸性質を典型的に代表するパ ターンがωjであり,各ωj (j∈J)を適応的に決定する手法は解決済みであり[5],計算機シミュ レーションでもその有効性が実証されている[18]. 付録Aの式(A1)の写像 T は付録Aの4性質①~④を満たしているとしよう.T はパターンϕ ϕのモ デル(パターンモデル)といわれるものであり,4性質①~④を満たす写像 T はモデル構成作用素と呼 ばれる.このようなT については意味あるものが多数存在し[ϕ 3]~[23],計算機シミュレーショ ンでも求められている[9]~[13],[16],[21],[22].モデル構成作用素 T の有用な5例は付録A で説明されている. 2.2 文脈を考慮しない類似度関数SMの満たさなければならないaxiom 付録Aの4性質①~④を満たす式(A1)のモデル構成作用素 T を導入したとき,類似度関数 } 1 0 | { :Φ×Ω→ s ≤s≤ SM (20) は次のaxiomを満たさなければならない. クロネッカーのδ記号 = j i δ 1 if i= j 0 if i≠ j (21) を導入しておく. Axiom(類似度関数 SM の満たすべき公理)[5],[6] (ⅰ)(正規直交性)∀i,∀j∈J,SM(ωi,ωj)=δij. (ⅱ)(規格化性)∑
∈ = Φ ∈ ∀ J j j SM( , ) 1. , ϕω ϕ (ⅲ)(写像T の下での不変性) ). , ( ) , ( , , j J SM Tϕωj SM ϕωj ϕ∈Φ∀ ∈ = ∀ □ 上述のaxiomについて簡単に説明しておこう. SM の解釈0 , 1 ) , ( j = SM ϕω に従って,パターンϕ∈Φは各々,ωjと確定的な類似関係,相違関係にあり,ま た,0<SM(ϕ,ωj)<1の場合は,曖昧な類似・相違関係にある (22) を採用する. 上述のaxiom 1の(ⅰ)は,相異なるカテゴリCi,Cj (i≠ j)の代表パターンωi,ωj(i≠ j)同士は確定 的な相違関係にあり,同一カテゴリの代表パターン同士は確定的な類似関係にあることを要請して いる.(ⅱ)は,任意のパターンϕ∈Φについて,すべてのカテゴリCj ,j∈Jについての類似度の総 和
∑
∈J j j SM(ϕ,ω )は1であることを要請している.ということは,処理の対象とする問題のパターン Φ ∈ ϕ はいずれかの1つのカテゴリCjに帰属する可能性があることを要請していることになる. (ⅲ)は,パターンモデルT は原パターンϕ ϕと任意のカテゴリCjについて同一類似度を持つことを 要請している.ということは,パターンモデルT を見たり,聞いたりするならば,原パターンϕ ϕと 同じように見えたり,聞こえたりすること(同一知覚原理)を要請していることになる.3.文脈を考慮した類似度関数
SMの構成
本章では,2.2のaxiomを満たす“文脈を考慮しない式(20)の類似度関数”SM(ϕ,ωj)が構成されて いるとして,文脈“η•ψ”を考慮した類似度関数SM(ηϕψ,ηωψj ))が構成される. パターンηの後にパターンϕが続き,更にこのパターンϕの後にパターンψが続く文脈 right left⋅Φ⋅Φ Φ ∈ •ψ η (23)を考えよう.式(23)におけるη∈Φleft(ϕ)⊂Φleft⊂Φ,ψ∈Φright(ϕ)⊂Φright⊂Φは各々,今注目してい
るパターンϕ∈Φの左文脈(left context),右文脈(right context)であるといわれる. 次の定理1は文脈“η•ψ”を考慮し,前章のaxiomを満たす類似度関数 ) (=SMη•ψ SM :ηΦψ×ηΩψ→{s|0≤s≤1} (24) を構成することが可能な事実を明らかにするものである. [定理1](文脈を考慮した式(24)の類似度関数 SM の構成定理) 関数 } 0 | { : s s
sm Φleft⋅Φ⋅Φright×Φleft⋅Ω⋅Φright→ ≤ (25)
が,3条件 ①(正値性)sm(ηϕψ,ηωψj )はすべてのη∈Φleft(ϕ),すべてのψ∈Φright(ϕ)について, j ω ϕ= のとき正値をとる ②(直交性)sm(ηωψi ,ηωψj )はすべてのη∈Φleft(ϕ),すべてのψ∈Φright(ϕ)について, j i≠ のとき0をとる ③(T 不変性)− ), ( ), (ϕ ϕ η∈Φleft ∀ ∈Φright ∀ ψ ) , ( ) , (T Tψ ψj sm ψ ψj sm ηϕ ηω = ηϕ ηω を満たせば, ≡ • ( , j) SMη ψϕω ≡ ) , ( ψ ψj SMηϕ ηω
∑
∈J k k j sm sm ) , ( ) , ( ψ ψ ψ ψ ηω ηϕ ηω ηϕ∑
∈ > J k k sm(ηϕψ,ηωψ) 0 L の場合 ( p C )j (カテゴリCjの出現確率)∑
∈ = J k k sm(ηϕψ,ηωψ) 0 L の場合 (26) と定義される式(24)の関数 SM は,2.2のaxiom,つまり,1.の3性質(ⅰ),(ⅱ),(ⅲ)を満たす. (証明) 先ず, (イ) ϕ=ωjのとき, ) , ( ψ ψj SM ηϕ ηω∑
∈ = J k k j sm sm ) , ( ) , ( ψ ψ ψ ψ ηω ηϕ ηω ηϕ ) , ( ) , ( ψ ψ ψ ψ j j sm sm ηω ηϕ ηω ηϕ = ∵ ①,② =1 ∵ ① (27) (ロ) ϕ=ωi(i∈J−{j})のとき, ) , ( ψ ψj SM ηϕ ηω∑
∈ = J k k j sm sm ) , ( ) , ( ψ ψ ψ ψ ηω ηϕ ηω ηϕ∑
− ∈ + = } { 0 ) , ( 0 j J k j smηϕψηωψ ∵ ② 0 = ∵ ① (28) を得,axiom,(ⅰ)(正規直交性)の成立がわかった. 次に,axiom 2,(ⅱ)(規格化条件) 1 ) , ( , = Φ ∈ ∀∑
∈ ψ ψ j J j SM ηϕ ηω ϕ (29) が成立することは,SM を定義している式(26)から明らかである. 最後に,axiom,(ⅲ)(T 不変性)− , ,∀j∈J Φ ∈ ∀ϕ ) , ( ) , (T Tψ ψj SM ψ ψj SM ηϕ ηω = ηϕ ηω (30) が成立することは,③から明らかである. □ 上述の定理1の3条件①,②,③を満たす式(25)の関数 sm の1例を構成しておこう. 2つの正の量 : ) , (TηTϕ Cleft T の左にϕ T が出現したとき,η Tη,Tϕ間のつながりを示す正数,例えば,T の左ϕ にT が出現したとき,η T が出現する確率η prob−{Tη/Tϕ}(>0)の正定数倍 (31) : ) , (TηTϕ Cright T の右にϕ T が出現したとき,η Tη,Tϕ間のつながりを示す正数,例えば,T の右ϕ にT が出現したとき,η T が出現する確率η prob+{Tη/Tϕ}(>0)の正定数倍 (32) と,axiomを満たす文脈を考慮しない類似度関数 } 1 0 | { :Φ×Ω→ ≤ ≤ ′ s s M S (33) とを導入して,) , ( ψ ψj smηϕ ηω ⋅ =Cleft(Tη,Tϕ) SM′(ϕ,ωj)⋅ Cright(Tη,Tϕ) (34) が3条件①,②,③を満たすことが知れる. 式(34)によるsm(ηϕψ,ηωψj )の構成は,文脈を考慮した式(26)の類似度関数SMη ψ• (ϕ,ωj)が文脈を 考慮しない類似度関数SM′(ϕ,ωj)を核として構成されることを明らかにしている. 実際には, ) 0 }( / { > − Tη Tϕ freq :T の左にϕ T が出現したとき,η T が出現する回数(>0) η (35) ) 0 }( / { > + Tη Tϕ freq :T の右にϕ T が出現したとき, ψη T が出現する回数(>0) (36) として, ) , (TηTϕ Cleft ) 0 }( / { > =prob− Tη Tϕ の正定数倍 ) 0 }( / { > = freq− Tη Tϕ (37) ) , (TηTϕ Cright ) 0 }( / { > =prob+ Tη Tϕ の正定数倍 ) 0 }( / { > = freq+ Tη Tϕ (38) とおけばよい.
4.文脈を考慮しない類似度関数SMの,他のカテゴリC
i(i∈J−{j}),
自らのカテゴリC
jから眺めた構成
前章の定理1によって,文脈を考慮した類似度関数 ) , ( j SMη ψ• ϕω =SM(ηϕψ,ηωjψ)の構成は,結局,文脈を考慮しない類似度関数式(34)内のSM′(ϕ,ωj) に帰着されることになった.以後,式(34)内のSM′(ϕ,ωj) をSM(ϕ,ωj) と表そう.このような ) , ( j SM ϕω の構成例については,式(19)の代表パターン Ω のモデル集合 } | {T j J T⋅Ω≡ ωj ∈ についての非一致条件 0 }, { ,∀∈ − − > ∈ ∀j J i J j Tωi Tωj (39) の下で,既に5式(8),(10),(11),(12),(13)で指摘されているけれども,以下では,類似度関数 ) , ( j SM ϕω の構成を一般的に研究しよう. 先ず,本章では,他のカテゴリCi(i∈J−{j}),自らのカテゴリCjから各々眺めた2種類の,2.2 のaxiomを満たす類似度関数SM(ϕ,ωj)が構成される. 4.1 他のカテゴリCi(i∈J−{j})から眺め構成される類似度関数SM 本節では,処理の対象とする問題のパターンϕ∈Φについて,他のカテゴリCi(i∈J−{j})に帰属 するパターンのモデルから相違していればいるほど,問題のカテゴリCjに帰属するパターンのモデ ルとの類似性の程度が大きくなるように,2.2のaxiomを満たす式(20)の類似度関数SM を得る構成 手法が説明される.4.1.1 相違度関数dsmj(ϕ)の5種類構成 | | J 個のパターン集合Ψ の系 j J j j j∈)Ψ(⊂Φ), ∈ (ω (40) を考え,包含条件 } | { ,T j T j T j J j∈ ∈ ⋅Ψ ≡ ∈Ψ ∀ ω ψψ (41) と,分離条件 0 , , }, { ,∀ ∈ − ∀ ∈Ψ ∀ ′∈Ψ − ′ > ∈ ∀i J j J i ψ i ψ j Tψ Tψ (42) とを満たしているとしよう.
2つのパターンが似ていないほど大きい値をとるような相違度関数(dissimilarity measure function)
j dsm の系 + → Φ R dsmj: (非負実数全体の集合),j∈ J (43) が,次の3性質(一),(二),(三)を満たすように選ばれているとしよう: (一) (最小0性質) 0 ) ( , ,∀ ∈Ψ = ∈ ∀j J ψ j dsmjψ . (二) (正性質) . 0 ) ( , }, { ,∀ ∈ − ∀ ∈Ψ > ∈ ∀j J i J j ψ i dsmjψ (三) (写像Tの下での不変性) ). ( ) ( , , ϕ ϕ ϕ∈Φ∀j∈J dsmj T =dsmj ∀ □ 例えば,次の典型的な5種類のdsmj(ϕ)は,次の3性質(一),(二),(三)を満たすことがわかる. 特に,(三)は付録Aの, T の第3番目の性質③(べき等性)から成り立つ: ① ψ ψ T T dsm j j(ϕ)=min∈Ψ ϕ− (44) ② ( ) minlog[1 ψ2] ψ T T dsmj e j − + = Ψ ∈ ϕ ϕ (45) ③ ( ) min[1 exp{ 1 ψ2}] ψ a T T dsm j j j − ⋅ − − = Ψ ∈ ϕ ϕ (46) ここに,定数aj(j∈J)は正数であればよいが, 2 ) ( min min 3 1 ψ ψ ψ ψ − ′ ⋅ = ≠ Ψ ∈ ′ Ψ ∈ T T a j i j j i (47) と選ぶのがよい. ④ ( ) min[1 | ( , ψ)|2] ψ nipT T dsm j j ϕ = ∈Ψ − ϕ (48)
ここに,nip(Tϕ,Tψ)は2つのパターンモデルTϕ,Tψの規格化内積(normalized inner product)であり, ≡ ) , (T Tψ nip ϕ 0 ) , ( ⋅ > ⋅ ψ ψ ψ T T T T T T ϕ ϕ ϕ L のとき 0 0LTϕ ⋅ ψT = のとき. (49) ⑤dsmj(ϕ)=
| ) , ( | 1 log min | ) , ( | log 2 1 min 2 ψ ψ ψ ψ e nipT T e nipT T j j ϕ ϕ Ψ ∈ Ψ ∈ − ⋅ = ∀ψ∈Ψj,Tϕ ⋅Tψ>0∧|nip(Tϕ,Tψ)|2>εj L のとき j eε log 2 1 ⋅ − ∃ ∈Ψj Tϕ ⋅T = ∨ nipTϕT ≤εj 2 | ) , ( | 0 , ψ ψ ψ L のとき (50) ここに,定数εjは1 より小さい正定数であればよいが, 2 ) ( | ( , )| min min 0 ψ ψ ψ ψ ′ < < ∈Ψ ′∈Ψ ≠ nipT T j i j j i ε (51) と選ぶのがよい. □ 4.1.2 非規格化類似度関数simj(ϕ)の構成 前項の3性質(一),(二),(三)を満たす式(43)の相違度関数dsm を使って,関数j sim の系j + → Φ R simj: , j∈ J (52) を, ) ( min ) ( } { ϕ ϕ iJ j i j dsm sim − ∈ ≡ (53) と定義すれば,各simj(ϕ)(j∈J)は,次の3性質(イ),(ロ),(ハ)を満たし,非規格化類似度関数と 解釈されてよい: (イ) (正性質) 0 ) ( , ,∀ ∈Ψ > ∈ ∀j J ψ j simjψ (ロ) (最小0性質) . 0 ) ( , }, { ,∀∈ − ∀ ∈Ψ = ∈ ∀j J i J j ψ i simjψ (ハ) (写像 T の下での不変性) ). ( ) ( , , ϕ ϕ ϕ∈Φ∀j∈J simj T =simj ∀ □ 4.1.3 axiomを満たす類似度関数 SM の構成 前項の3性質(イ),(ロ),(ハ)を満たす式(52)の類似度関数sim を規格化して,式(j 20)の関数 ) , ( j SM ϕω を = ) , ( j SM ϕω
∑
∈J k k j sim sim ) ( ) ( ϕ ϕ∑
∈ > J k k sim(ϕ) 0 L のとき ( p C )j∑
∈ = J k k sim(ϕ) 0 L のとき (54) と定義しよう. そうすれば,次の定理2の如く,axiomを満たす式(20)の関数 SM を構成できる. [定理2](類似度関数 SM の,式(43)の相違度関数dsm ,式(53)のj sim による他のカテゴリj Ci(i∈J−{j})から眺めた構成定理) 3条件式(40),(41),(42)の下で,式(54)のごとく定義された式(20)の関数 SM は2.2のaxiom 2を 満たす. (証明) Tωjの包含式(41)を考慮すれば,以下の(a),(b)の証明から,式(40)を勘案すれば,axiom,(ⅰ)(正規直交性)が成立することがわかる. (a) ∀j∈J,∀ψ∈Ψj, ) , ( j SMψω
∑
− ∈ + = } { ) ( ) ( ) ( j J k k j j sim sim sim ψ ψ ψ ∵ 式(54) ) ( ) ( ψ ψ j j sim sim = ∵ 4.1.2項の性質(ロ) 1 = . ∵ 4.1.2項の性質(イ) (b) ∀j∈J,∀i∈J−{j},∀ψ∈Ψi, ) , ( j SMψω∑
− ∈ + = } { ) ( ) ( ) ( i J k k i j sim sim sim ψ ψ ψ ∵ 式(54) ) ( 0 ψ i sim = ∵ 4.1.2項の性質(ロ) 1 = .∵ 4.1.2項の性質(イ) axiom,(ⅱ)(規格化性)の成立は, SM の定義式(54)から明らかである. axiom,(ⅲ)( T の下での不変性)の成立は,4.1.2項の,各sim の性質(ハ)から明らかである. j □ 4.2 自らのカテゴリCjから眺めた類似度関数SM の構成 ところで,式(54)のSM(ϕ,ωj)において,sim の定義式(53)を考慮すれば, j ) ( min , iJ dsmi ϕ J j ∈ ∈ ∀ )} ( ), ( min{dsmjϕ simj ϕ = (55) であるから, 0 ) ( >∑
∈J k k sim ϕ のとき 式(54)のSM(ϕ,ωj)∑
∈ = J k k j sim sim ) ( ) ( ϕ ϕ∑
∈ ∈ ∈ = J k iJ i k i J i j dsm sim dsm sim ) ( min ) ( ) ( min ) ( ϕ ϕ ϕ ϕQ
分母,分子をmini∈J dsmi(ϕ)で割る (56) =∑
∈J k k k j j dsm sim dsm sim ) ( ) ( ) ( ) ( ϕ ϕ ϕ ϕ ) ( ) ( 0 , dsmk ϕ simk ϕ J k∈ < < ∀ L のとき | | 1 J L∀k∈J,0<simk(ϕ)≤dsmk(ϕ)のとき(57) と変形され,他のカテゴリCi(i∈J−{j})に帰属するパターンのモデルから相違していればいるほど, 問題のカテゴリCjに帰属するパターンのモデルとの類似性の程度が大きくなるような定理2の SM は,式(43)の相違度dsmj(ϕ)の逆数 ) ( 1 ϕ j dsm によるSM の,次の定理3による構成とは異なることに 注意しておく. [定理3](類似度関数 SM の,相違度関数dsmj(ϕ)による自らのカテゴリCjから眺めた構成定理) 3条件式(40),(41),(42)の下で, ) , ( j SM ϕω ) ( 1 ) ( 1 ϕ ϕ k J k j dsm dsm
∑
∈ = (58) と定義された式(20)の関数 SM は2.2のaxiomを満たす. (証明) 容易なので,省略する. □5.文脈を考慮しない類似度関数
SMの再帰的構成
本章では,類似度関数S ′ から文脈を考慮しない類似度関数 SM が得られる再帰的構成法が4定理M 4~7で研究される.尚,この4定理の証明は紙面の都合上,割愛される. 5.1 類似度分布の伸縮変換を可能にする類似度関数SMの再帰的構成 カテゴリ番号の全集合(有限集合)J が } , , 2 , 1 { m J= L (59) である場合,パターンϕ∈Φのその類似度分布(列ベクトル) ) , ( j M S ′ϕω } ) , ( ) , ( ) , ( {SM 1 SM 2 SM m col ′ϕω ′ϕω ′ϕω ≡ L (60) を伸縮して,今1つの類似度分布SM(ϕ,ωj)を求めることを考えよう.明らかに,パターンϕ∈Φの 帰属する正しいカテゴリが第j∈ 番目のカテゴリCJ jである場合,以下の2性質(*1),(*2)は望ま れる類似度分布の変換である: (*1) (類似度差の伸長) ) , ( ) , ( }, { , i J j SM j SM i j∃ ∈ − ′ϕω − ′ϕω ∃ ≤SM(ϕ,ωj)−SM(ϕ,ωi) (61) (*2) (類似度差の縮小) ) , ( ) , ( }, , { }, { , k J j l J jk SM ϕω SM ϕωl J j∈ ∃ ∈ − ∃ ∈ − ′ k − ′ ∃ ≥SM(ϕ,ωk)−SM(ϕ,ωl) (62) □ 2性質(*1),(*2)を備えている類似度分布の変換が可能なように,パターンモデルT と各代表ϕ パターンモデルTωj,Tωi,Tωk,Tωl間の分離があからさまに改良されるように,2.2のaxiomを満たす類 似度関数S ′ を今M 1つの2.2のaxiomを満たす SM に再帰的に構成し直す手法が説明される.本章の4定理4~7は少し検討すれば,2性質(*1),(*2)を備えている類似度分布SM′(ϕ,ωj)からSM(ϕ,ωj) へのこの種の変換が可能な再帰的構成法を与えていることがわかるであろう. 5.2 類似度関数SM の再帰的構成3手法 式(19)の有限な代表パターン集合Ω 内の代表パターンωjのモデルTωj間の分離条件式(39)の下で, 包含条件式(41)と,今1つの条件 φ = Ψ ⋅ ∩ Ψ ∈ = Ψ ⋅ − ∈ ∀ ∈ ∀j J, i J {i},T i( {Tψ|ψ i}) T j (63) を満たすように,式(40)のパターン集合Ψ のモデル集合j T⋅Ψjの系T⋅Ψj,j∈J を選定しておく.こ のとき, j i T T i J i J j∈ ∀∈ − ∉ ⋅Ψ ∀ , {}, ω (64) が成立していることに注意しておく. 次の定理4が成立し,柔軟に SM を変換できることがわかる.定理4内の条件式(65)では,f の値j が+∞ になってもよいことに注意しておく. [定理4](類似度関数 SM の再帰的一般構成定理) 各Tωj間の分離条件式(39)の下で,3条件式(40),(41),(63)を満たす式(40)のパターン集合Ψj のモデル集合T⋅Ψjの系T⋅Ψj,j∈Jを選定しておく.そうすれば,2条件 0 ) , ( max ,+∞≥ > ∈ ∀ Ψ ∈ ω η η f T T J j j j j (65) 0 ) , ( max }, { ,∀∈ − > ∈ ∀ Ψ ∈ ω η η f T T j J i J j j i j (66) を満たす(Tϕ∈TΦとTψ∈T⋅Ψjとの間の類似性の程度を与える)関数 + → Ψ ⋅ × Φ ⋅ T R T fj: j (非負実数全体の集合) (67) と,2.2のaxiomを満たす類似度関数 } 1 0 | { :Φ×Ω→ ≤ ≤ ′ s s M S (68) との両者を用いて, = ) , ( j SM ϕω
∑
∈ ∈Ψ Ψ ∈ ⋅ ′ ⋅ ′ J i i i j j T T f M S T T f M S i j ) , ( max ) , ( ) , ( max ) , ( η ϕ ω ϕ η ϕ ω ϕ η η 0 ) , ( max ) , ( ⋅ > ′∑
∈J ∈Ψ i i i f T T M S i η ϕ ω ϕ η L のとき ( p C )j∑
′( , )⋅max ( , )=0 ∈J ∈Ψ i i i f T T M S i η ϕ ω ϕ η L のとき (69) と定義される式(20)の関数 SM は2.2のaxiomを満たす. □ 2条件式(65),(66)を満たす式(67)の関数f の系の構成例は,4.1.1の①~⑤に対応して,次の⑥~j ⑩がある: ⑥ η ϕ η ϕ T T T T fj = − 1 ) , ( (70) ⑦ log[1 1 ] | | 1 ) , ( e |J| j T T J T T f η ϕ η ϕ − + ⋅ − = (71)⑧ , 0 ] 1 exp[ 1 1 ) , ( 2 > − ⋅ − − = j j j a T T a T T f η ϕ η ϕ (72) ⑨ 2 | ) , ( | 1 1 ) , ( η ϕ η ϕ T T nip T T fj = − (73) ⑩fj(Tϕ,Tη)= ] | ) , ( | 1 [ log 2 1 nipTϕTη 2 e − ⋅ − [ , 0 | ( , )|2 ] j j Tϕ ⋅ T > ∧ nipTϕT >ε Ψ ∈ ∀ψ ψ ψ L のとき ] 1 [ log 2 1 j e −ε ⋅ − [ , 0 | ( , )|2 ] j j Tϕ ⋅ T = ∧ nipTϕT ≤ε Ψ ∈ ∃ψ ψ ψ L のとき (74) □ 定理4より簡単な再帰的構成手法を与えるのが次の定理5である. [定理5](類似度関数 SM の関数変換による再帰構成定理) 2条件 0 ) 1 ( 0 ) 0 ( = ∧ j > j f f (75) を満たす非負実数値関数 + R fj: (非負実数値の集合) + → R (76) の系(j∈J)を用いて,2.2のaxiomを満たす式(68)の類似度関数 MS ′ を変換して得られ, = ) , ( j SM ϕω
∑
∈ ′ ′ J i i i j j M S f M S f )) , ( ( )) , ( ( ω ϕ ω ϕ 0 )) , ( ( ′ >∑
∈J i i i SM f ϕω L のとき ( p C )j∑
( ′( , ))=0 ∈J i i i SM f ϕω L のとき (77) と定義される式(20)の関数 SM は2.2のaxiomを満たす. □ 上述の定理5において,条件式(75)を満たす関数 f の系を不連続,或いは,連続的区分的1次関数j に選定すれば,次の定理6が成り立つ. [定理6](類似度関数 SM の量子化に伴う再帰構成定理) 不等式 1 ) ( ) ( 0≤ε0 j <ε1 j ≤ (78) を満たす2つの閾値ε0(j),ε1(j)の系(j∈J)を用意して,axiomを満たす式(68)の類似度関数 MS ′ を量 子化して得られる1 より大きくない非負量s(ϕ,ωj)(≤1)を,不連続量として, = ) , ( j sϕω 1 if ε1(j)≤SM′(ϕ,ωj)≤1 ) , ( j M S ′ϕω if ε0(j)<SM′(ϕ,ωj)<ε1(j) 0 if 0≤SM′(ϕ,ωj)≤ε0(j) (79) と求めるか,或いは,連続量として,= ) , ( j sϕω 1 if ε1(j)≤SM′(ϕ,ωj)≤1 ) ( ) ( ) ( ) , ( 0 1 0 j j j M S j ε ε ε ω ϕ − − ′ if ε0(j)<SM′(ϕ,ωj)<ε1(j) 0 if 0≤SM′(ϕ,ωj)≤ε0(j) (80) と求める.このとき, = ) , ( j SM ϕω
∑
∈J i i j s s ) , ( )) , ( ω ϕ ω ϕ 0 ) , ( >∑
∈J i i sϕω L のとき ( p C )j∑
( , )=0 ∈J i i sϕω L のとき (81) と定義される式(20)の関数 SM SMは2.2のaxiomを満たす. □ 類似性(SM(ϕ,ωj)≒1)と相違性(SM(ϕ,ωj)≒0)との観点,或いは,人の知覚的類似性に一致する ように,条件式(75)を満たす関数f の系j (j∈J)を選定する手法を開発することが望まれる. 5.3 類似度関数の適応的再帰構成 本節では,ニューラルネットの形式を利用し,式(68)の類似度関数 MS ′ を適応的に改良できる手 法が研究される. 5.3.1 関数g の系を使った類似度関数の改良 i 次の定理7は2.2のaxiomを満たす式(20)の類似度関数 SM の機能を,5.1の2性質(*1),(*2)を満 たすように改良することを学習で適応的に決定することを可能にするものである. さて,式(19)の代表パターン集合Ω のモデル集合T⋅Ωに関する非正条件 0 ) ( }, { ,∀ ∈ − ≤ ∈ ∀j J i J j gj Tωi (82) を満たす関数g の系i R T gi: ⋅Φ→ (実数全体の集合),i∈ J (83) を用意した後,2.2のaxiomを満たす式(68)の類似度関数 MS ′ を更新する形式で,次のように定義す る.ここに,max{ ba, }は2つの実数 ba, の内,小さくない方を指す: = ) , ( j SM ϕω∑
∈ + + ′ J i i j j T g T g M S } 0 ), ( max{ 1 } 0 ), ( max{ ) , ( ϕ ϕ ω ϕ (84) □ このとき,次の定理7が成立する. [定理7](類似度関数 SM の,再帰的適応構成定理) 式(84)の如く定義された式(20)の関数 SM は,条件式(82)の下で2.2のaxiom 2を満たす. □5.3.2 1次ニューラルネットの形式を採用した関数gjの系 非正条件式(82)を満たす式(83)のg は式(84)のj SM(ϕ,ωj)=内に登場しているが,実数重み ) , ( lj V の組,実数閾値V( j,0)の組 J j j V L j V( ,l),l∈(0∉) , ( ,0), ∈ (85) を用いて,1次ニューラルネット[4]の形式を採用し, ) (Tϕ gj
∑
∈ + ⋅ = L j V T u j V l l l) ( , ) ( ,0) , ( ϕ (86) と,設定することが考えられる.ここに, R L u:Φ× → (実数全体の集合) (87) は特徴抽出写像であり,u( lϕ, )∈Rは, パターンϕ∈Φから抽出された第l∈L番目の実数値特徴量 (88) である. }, { , i J j J j∈ ∀∈ − ∀ = ) ( i j T g ω 0 ) 0 , ( ) , ( ) , ( ⋅ + ≤∑
∈L i V j T u j V l l l ω (89) を満たすように,式(85)の各V(j,l)(l∈L),V(j,0)を訓練パターン系列を用いて容易に決定すること ができる.このように,適応的に決定されていれば,非正条件式(82)が満たされることになる. パターン分離がよくなるためには,カテゴリCjに属するすべての訓練パターンϕ∈Φについて, 0 ) (Tϕ > gj (90) であるように,特に,ϕ=ωjについて,式(85)の各V(j,l)(l∈L),V(j,0)が適応的に決定されている ことが望ましい(j∈J). 式(86)の1次ニューラルネットgj(Tϕ)の代りに,2次以上の高次ニューラルネット,相互結合 ニューラルネット,誤差逆伝播ニューラルネットの形式[4],[5]を採用できるが,この記述は割 愛される. なお,2.2のaxiomを満たす式(20)の類似度関数 SM について,2.2のaxiomの(ⅲ)より強いT 不変− 性 ) , ( ) , ( , , j J SM TϕTωj SM Tϕωj ϕ∈Φ∀∈ = ∀ (91) が成立するように構成することは容易である.これまで構成されているSM [5],[6],[13], [16],[17],[20]~[23],[37],[40],[41]はすべて,強いT 式(− 91)を満たしているし,本 論文でこれまで構成されたSM もすべて,強いT 不変式(− 91)を満たしている.6.代表パターン集合
Ωを基準にしての,2つのパターン
ϕ, 間の
η
規格化一般化類似度
NGSM(ϕ
,η
) 式(19)の代表パターン集合Ω を基準にすれば,2.2のaxiomを満たす2式(20),(24)でいう2つの類 似度関数SM1, SM2を使い,任意のターンϕが任意のパターンηとどれくらい似ているかの度合いを 示す一般化類似度関数(generalized SM )GSM(ϕ,η)の典型的な1つは, ) , (ϕη GSM)} , ( ), , ( min{ max 1 k 2 k J k∈ SM ϕω SM ηω ≡ (92) である.GSMがSM の拡張であることは,1 2.2のaxiom,(ⅰ)を適用すれば, (0*) ∀ϕ∈Φ,∀j∈J,GSM(ϕ,ωj)=SM1(ϕ,ωj) が成立していることからわかる.よって,式(92)の一般化GSM(ϕ,η)は,正規直交性 (1*) GSM(ωi,ωj)=δij (93) を満たす.それのみならず,式(19)の代表パターン集合Ω を含むパターン部分集合Φ′(⊆Φ)を選ん で定義される規格化類似度関数(normalized GSM ) ) , (ϕη NGSM
∑
Φ′ ∈ ′ ′ ≡ η η ϕ η ϕ ) , ( ) , ( GSM GSM ( 94) について, (2*) (規格化性)∑
Φ′ ∈ ′ = ′ Φ′ ∈ ∀ η η ϕ ϕ , NGSM( , ) 1 (95) の成立も知れる.更に,2.2のaxiom,(ⅲ)を適用すれば, (3*) (T 不変性)− ) , ( ) , ( , , η ϕη ϕη ϕ∀ ∈Φ′NGSM T =NGSM ∀ (96) の成立も知れる. 式 (94)の規格化一般化類似度関数 NGSM を使えば,2つのパターンϕ∈Φ′,∀η∈Φ′の 分 離度 (separability)SEP(ϕ,η)は, ) , ( 1 ) , (ϕη NGSM ϕη SEP = − (97) であると考えることが出来よう.7.おわりに
2式(20),(24)の,文脈を考慮しない,或いは考慮した類似度関数SM が備えているべき3性質と して,正規直交性・規格化性・モデル構成作用素T の下での不変性の3性質(1.の3性質(ⅰ),(ⅱ), (ⅲ),或いは,2.2のaxiom)を指摘し,この3性質を満たす類似度関数SM を7定理で一般的に構成し, その適用諸例も説明された.文脈を考慮したSM が式(34)のsm(ηϕψ,ηωψj )に見られるように,文脈 を考慮しないSM を核に持つ構成に帰着される場合があることも,定理1を適用すればわかる.定理 1での3条件①,②,③を満たす式(25)のsm(ηϕψ,ηωψj )の構成は,式(34)の場合に限られないが,そ の一般的構成論は将来に委ねられた. この際,これまで,S.Suzuki以外の諸研究では,1.の3性質(ⅰ),(ⅱ),(ⅲ)を満たす類似度関数 SM は1つとして構成されていない事実を強調しておく.3付録B,C,Dにおいて,この3性質(ⅰ), (ⅱ),(ⅲ)がパターン情報処理において何故必要とされるかを説明しておいた.特に,文脈を考慮 した,或いは,他のカテゴリから眺めたaxiomを満たす類似度関数SM の構成定理(2定理1,2)は, 他の研究では全く見られない. 例えば,定理1において,sm(ηϕψ,ηωψj )として,定理2を適用した式(34)の設定を使えば,文脈を 考慮し,他のカテゴリから眺めた類似度関数SM(ηϕψ,ηωψj )が「正規直交性・規格化性・T の下での不変性」を満たす形で得られるのである.η•ψという文脈を考慮したaxiomを満たす類似度関数 SM の, 定理1による構成法は,より複雑な任意の文脈を考慮した SM の構成法に結びつくことは,定理1の 証明から明らかであろう. 2.2のaxiomを満たす SM の構成に関する再帰諸定理(4定理4~7)は, SM の構成が限りなく多様性 を秘めていることを指摘していると言えよう.従って,処理の対象とする実際のパターン集合Φ に 応じ,適切なSM の選択法が必要とされることになるが,5.4.2で簡単に研究された SM を学習に よって決定することを可能にする手法などにも関連し,この選択法の研究は別の機会に譲られる. 付録Aでのヒルベルト空間H=L2(M;dm)で構成された類似度SM は具体性を帯びてくる.計算機 シミュレーション[9]~[13],[16],[18],[19],[21],[22],[37],[40],[41]で採用されて いる内積(ϕ,η)はすべて,この特別なものである.7定理1~7で構成されたaxiomを満たす類似度関数 SM の構成法は,1部計算機シミュレーション済であり,現在も続行中であるが,他に類を見ない. 構成されたSM は著者が直観で発見したものであるが,その諸性質,特にある評価基準からの導出 とか極値性とかについては,理論的な解明が1部進んでいるが,紙面の都合上省略された.例えば, 式(8)の SM については,fuzzy c-means法から意味付けられることが,文献[5]の2.7.3,2.7.4項で 明らかにされている.本論文で構成されたSM はパターンモデル構成作用素 T の下での不変性を備 えている故に,そのパターン分類機能は採用されるT に依存している.採用されてよい T は多数存 在するが,その典型的な5例をこの間の事情を少しでも容易にするため,付録Aで構成しておいた. 本論文で構成された類似度関数T は単段階認識法の最大類似度法よりは,むしろ,万能性認識シ ステムRECOGNITRON[5],[6]が内蔵している多段階不動点探索認識法によるパターンϕの処理 にも適切である場合が多い.SM の構成した諸例,特に再帰構成定理を参考にしながら,処理の対 象とする問題のパターン集合Φ に応じ,RECOGNITRON内に適切に設計することが望まれる.
参考文献
[1] Jesse Spencer-Smith, Robert L.Goldstone:The Dynamics of Similarity,認知科学,vol.4,no,4, pp.38-56,1997
[2] Simone Santini, Ramesh Jain:Similarity Measures, IEEE on Trans. Pattern Analysis and Machine Intelligence, vol.21,no.9,pp.871-883,1999 [3] 鈴木昇一:認識工学,柏書房,Feb.1975 [4] 鈴木昇一:ニューラルネットの新数理,近代文芸社,Sept.1996 [5] 鈴木昇一:パターン認識問題の数理的一般解決,近代文芸社,Aug.1997 [6] 鈴木昇一:認識知能情報論の新展開,近代文芸社,Aug.1998 [7] 鈴木昇一:パターンのエントロピーモデル,電子情報通信学会論文誌(D-Ⅱ),vol.J77-D-Ⅱ, no.10,pp.2220-2238,Nov.1994 [8] 鈴木昇一:測度的不変量検出形認識系の構成理論,電子通信学会論文誌(D),vol.55-D,no.8, pp.513-538,Aug.1972 [9] 鈴木昇一:抽出された特徴による手書き漢字構造の再生,情報処理(情報処理学会誌), vol.18,no.11,pp.1115-1122,Nov.1977 [10] 鈴木昇一,斉藤静昭,奥野治雄,太田芳雄:画像の復元とその計算機シミュレ-ション,工 学院大学研究報告,no.39,pp.198-206,Jan.1976
[11] 鈴木昇一:回転群と画像の分解・強調・構造化再構成に関する計算機シミュレーション,情報 研究(文教大学・情報学部),no.4,pp.36-56,Dec.1983 [12] 鈴木昇一:連想形記憶器MEMOTRONと日本語単独母音系列の再生に関する計算機シミュ レーション,情報研究(文教大学・情報学部),no.7,pp.14-29,Dec.1986 [13] 鈴木昇一:帰属係数法に基づく類似度,帰属関係あいまい度,認識情報量の計算機シミュ レーション,情報研究(文教大学・情報学部),no.11,pp.51-68,Dec.1990 [14] 鈴木昇一,佐久間拓也,前田英明:数理形態学における諸演算とモデル構成作用素,情報研 究(文教大学・情報学部),no.17,pp.133-170,Dec.1996
[15] 鈴木昇一:Radial-Basis Function Networks, Wavelet-Based Networksを用いたモデル構成作用素 の構成法,情報研究(文教大学・情報学部),no.17,pp.71-132,Dec.1996 [16] 鈴木昇一:構造受精法と日本語単独母音の認識,情報研究(文教大学・情報学部,no.18, pp.17-51,Dec.1997 [17] 鈴木昇一:類似度関数を用いた確率的緩和法,情報研究(文教大学・情報学部),no.20,pp.23 -75,Dec.1998 [18] 鈴木昇一,前田英明:有声破裂音の代表パターンの学習的決定と,その計算機シミュレー ション,情報研究(文教大学・情報学部),no.20,pp.77-95,Dec.1998 [19] 鈴木昇一:直交系によるパターモデルの構成,情報研究(文教大学・情報学部),no.21, pp.23-49,Mar.1999 [20] 鈴木昇一:認識行為に向けての,効用最大化原理,情報研究(文教大学・情報学部),no.22, pp.151-210,Dec.1999 [21] 鈴木昇一:平均顔を用いた顔画像の2値化,並びに,目・鼻・口の抽出と,その計算機シミュ レーション,情報研究(文教大学・情報学部),no.22,pp.65-150,Dec.1999 [22] 鈴木昇一:界面エネルギーの減少に伴うモデル構成作用素の,顔画像処理に関する計算機シ ミュレーション,情報研究(文教大学・情報学部),no.23,pp.109-182,Mar.2000 [23] 鈴木昇一:風景画から知識を抽出し,解釈するシステムの,ファジィ推論ニューラルネット による構成,情報研究(文教大学・情報学部),no.23,pp.183-265,Mar.2000
[24] 須藤昇:学習・再認に関する記憶表象生成モデルの実験的検証,The Japanese Journal of Psychology, vol.65,no.3,pp.206-214,1994 [25] 石井健一郎,上田修功,前田英作,村瀬洋:わかりやすいパターン認識,オーム社(2000) [26] 鈴木昇一:高次認知機能における論理表現の要素,情報研究(文教大学・情報学部),no.19, pp.29-82,Mar.1998 [27] 吉田耕作:近代解析,共立出版,Dec.1963 [28] 鈴木昇一:多変量解析に基づく大分類関数の決定とその計算機シミュレーション,情報研究 (文教大学・情報学部),no.10,pp.35-49,Dec.1989 [29] 鈴木昇一,前田英明:変動エントロピーによる有声破裂音の順序付けと,その計算機シミュ レーション,情報研究(文教大学・情報学部),no.21,pp.51-78,Mar.1999 [30] 鈴木昇一:各個人の感性を反映した認識システムRECOGNITRON,情報研究(文教大学・情報 学部),no.24,pp.185-257,Dec.2000 [31] 鈴木昇一:プロダクション・システムとしてのファジィ・マルチメディア・コンピュータと, 空間多重パターンファジィ推論系,情報研究(文教大学・情報学部),no.24,pp.105-183,
Dec.2000
[32] 鈴木昇一:SS大分類関数BSCの適応的構成への,計算論的学習理論の適用,情報研究(文教 大学・情報学部),no.25,pp.185-236,Mar.2001
[33] 鈴木昇一:量子力学の諸原理,多段階量子認識系と,心理状態を取り入れた想起に基づく部 分空間認識法,情報研究(文教大学・情報学部),no.25,pp.237-282,Mar.2001
[34] 鈴木昇一:Support Vector Machineを利用した大分類関数の構成,情報研究(文教大学・情報学 部),no.26,pp.1-62,Dec.2001 [35] 鈴木昇一:2カテゴリ分類困難度の情報理論,情報研究(文教大学・情報学部),no.26,pp.63 -160,Dec.2001 [36] 鈴木昇一:一般化類似度関数を用いた“導出原理による第1階述語推論”,情報研究(文教大 学・情報学部),no.27,pp.27-71,Mar.2002 [37] 鈴木昇一,川俣博司,大槻善樹:風景画の理解に関するJAVA言語によるRECOGNITRONの 計算機シミュレーション,情報研究(文教大学・情報学部),no.27,pp.73-109,Mar.2002 [38] 鈴木昇一:遺伝的アルゴリズムにおける適合度比例選択戦略を利用した進化方程式の,パ ターン多段階変換に基づく認識への応用,情報研究(文教大学・情報学部),no.28,pp.37-67, Dec.2002 [39] 鈴木昇一:近傍を利用した音素認識のためのモデル構成作用素T,類似度関数SM,大分類関 数BSCの諸構成と,SS不動点探索型多段階想起認識,情報研究(文教大学・情報学部),no.28, pp.69-141,Dec.2002 [40] 鈴木昇一:JAVA言語で実装化された画像理解システムIUSの動作概要と,その稼動方法,情 報研究(文教大学・情報学部),no.28,pp.143-165,Dec.2002 [41] 鈴木昇一,川俣博司,大槻善樹:JAVA言語による計算機シミュレーションで生じた風景画 像の理解場面での多段階連想形認識過程の異常現象,情報研究(文教大学・情報学部),no.29, pp.123-166,July 2003 [42] 鈴木昇一:パターン情報処理(モデル構成作用素,誤差逆伝播学習2層ニューラルネット)と, 論理的含意とによる非単調的知識推論,情報研究(文教大学・情報学部),no.29,pp.75-121, July 2003 [43] 鈴木昇一:可分な一般抽象ヒルベルト空間でのK-L直交系の理論,情報研究(文教大学・情報 学部),no.29,pp.41-73,July 2003 [44] 鈴木昇一:パターン系列(動画像,会話音声)の,dynamical systemによる連想理論と,連想器 SPATEMTRON,情報研究(文教大学・情報学部),no.30,pp.139-186,Jan.2004 [45] 鈴木昇一:入出力例の系列を用いた“対連想問題・その擬逆問題”の一般解,情報研究(文教 大学・情報学部),no.30,pp.81-137,Jan.2004 [46] 鈴木昇一:共役勾配法の一般解における直交系の応用(画像復元,パターンモデルの構成, パターン集合の情報理論的次元),情報研究(文教大学・情報学部),no.30,pp.27-79, Jan.2004 [47] 鈴木昇一:2つのパターンモデル構成作用素の,λ言語論理による構成法,情報研究(文教大 学・情報学部),no.31,pp.43-66,July 2004 [48] 鈴木昇一:会話音声・動画像処理への,万能性類似度関数の採用によるSS多段階認識の改 良,情報研究(文教大学・情報学部),no.31,pp.67-110,July 2004
[49] 鈴木昇一:数理形態学の新しい2つのパターン変換作用素を用いた多段階想起認識,情報研 究(文教大学・情報学部),no.31,pp.111-141,July 2004 [50] 鈴木昇一:1パラメータLie座標変換群とそのパターン正規化への応用,情報研究(文教大学・ 情報学部),no.32,pp.21-74,Jan.2005 [51] 鈴木昇一:曖昧さに関する半順序∝ を単調に保つモデル構成作用素 T ,情報研究(文教大学・ 情報学部),no.32,pp.75-126,Jan.2005 [52] 鈴木昇一:パターンϕから抽出された特徴量u( lϕ, )のfuzzy単調変換,情報研究(文教大学・情 報学部),no.32,pp.127-168,Jan.2005 [53] 鈴木昇一:パターンモデル(パターンの標準形)の一般形,情報研究(文教大学・情報学部), no.32,pp.169-218,Jan.2005 [54] 鈴木昇一:類似度関数の密度を用いた,画素毎のパターン認識処理(パターン理解処理)の方 法,情報研究(文教大学・情報学部),no.32,pp.219-285,Jan.2005 [55] 鈴木昇一:パターン(画像,音声)から感性情報を計量できる一般的な方法(視野を考慮して 構成された類似度関数SM の応用),情報研究(文教大学・情報学部),no.33,pp.261-316, Jul.2005 [56] 鈴木昇一:知識工学におけるcertainty factorによる多段階認識過程の評価,情報研究(文教大 学・情報学部),no.33,pp.199-260,Jul.2005 [57] 鈴木昇一:線形方程式の制約条件下での,残差法によるパターンモデル,情報研究(文教大 学・情報学部),no.33,pp.149-197,Jul.2005 [58] 鈴木昇一:正規直交性を満たす類似度関数 SM に積分核が存在するか?,情報研究(文教大 学・情報学部),no.33,pp.111-147,Jul.2005 [59] 鈴木昇一:原パターンを近似できるという拘束条件付き最小自乗ノルムパターンモデルの, 会話音声・動画像処理への応用,情報研究(文教大学・情報学部),no.33,pp.43-110,Jul.2005