• 検索結果がありません。

音声情報と行動計測による作業内容推定の研究

N/A
N/A
Protected

Academic year: 2021

シェア "音声情報と行動計測による作業内容推定の研究"

Copied!
68
0
0

読み込み中.... (全文を見る)

全文

(1)Title. 音声情報と行動計測による作業内容推定の研究( 本文 (Fulltext) ). Author(s). 竹原, 正矩. Report No.(Doctoral Degree). 博士(工学) 工博甲第500号. Issue Date. 2016-03-25. Type. 博士論文. Version. ETD. URL. http://hdl.handle.net/20.500.12099/54559. ※この資料の著作権は、各資料の著者・学協会・出版社等に帰属します。.

(2) ‫ذ‬ෞେֶത࢜࿦จ. Ի੠৘ใͱߦಈ‫ܭ‬ଌʹΑΔ ࡞‫಺ۀ‬༰ਪఆͷ‫ڀݚ‬. ̎̌̍̒೥݄̎. ஛‫ ݪ‬ਖ਼ۣ.

(3) ໨࣍ ୈ1ষ. ং࿦. 1. 1.1. ‫ڀݚ‬എ‫ ܠ‬. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 1. 1.2. ‫ڀݚ‬໨త . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 2. 1.3. ؔ࿈‫ ڀݚ‬. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 3. 1.4. ࿦จߏ੒ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 4. ߦಈ‫ܭ‬ଌ. 6. ୈ2ষ. 2.1. ߦಈ‫ܭ‬ଌͷ࿮૊Έ. . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 6. 2.2. Ϩετϥϯʹ͓͚Δσʔλऩू . . . . . . . . . . . . . . . . . . . . . .. 6. 2.3. Ի੠σʔλͷ‫ܭ‬ଌ. 7. ୈ3ষ. . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. ൃ࿩۠ؒ‫ݕ‬ग़. 9. 3.1. ൃ࿩۠ؒ‫ݕ‬ग़ͷ֓ཁ . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 9. 3.2. ൃ࿩۠ؒ‫ݕ‬ग़ͷྲྀΕ . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 10. 3.3. ࣮‫ ݧ‬. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 14. 3.4. ߟ࡯ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 15. ࿩ऀΫϥε෼ྨ. 16. 4.1. ࿩ऀΫϥε෼ྨͷ֓ཁ . . . . . . . . . . . . . . . . . . . . . . . . . . .. 16. 4.2. ಛ௃ྔ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 17. 4.3. SVMʢSupport Vector Machineʣ . . . . . . . . . . . . . . . . . . . .. 20. 4.4. DNNʢDeep Neural Networkʣ. . . . . . . . . . . . . . . . . . . . . .. 24. 4.5. ࣮‫ ݧ‬. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 29. ࡞‫಺ۀ‬༰ਪఆ. 34. 5.1. ໨త . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 34. 5.2. ࡞‫಺ۀ‬༰ਪఆͷྲྀΕ . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 34. 5.3. ಛ௃ྔͷ‫ݕ‬౼ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 36. 5.4. ࣝผ‫ث‬ͷ‫ݕ‬౼ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 46. 5.5. ࣮‫ ݧ‬. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 49. ୈ4ষ. ୈ5ষ. i.

(4) ୈ6ষ. ݁࿦. 54. 6.1. ੒Ռ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 54. 6.2. ՝୊ͱల։ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 55. ँࣙ. 56. ࢀߟจ‫ݙ‬. 57. ‫੷ۀڀݚ‬. 61. ii.

(5) ୈ1ষ. ং࿦ 1.1 ‫ڀݚ‬എ‫ܠ‬ αʔϏε‫ۀ‬͸೔ຊͷ࢈‫ۀ‬ͷ 7 ׂΛ઎ΊΔ͕ɼ੡଄‫ͱۀ‬ൺֱͯ͠ੜ࢈ੑͷ௿͕͞໰୊ͱ ͳ͍ͬͯΔɽ඼࣭؅ཧ΍ϚʔέςΟϯάɼधཁ༧ଌͳͲɼ͋ΒΏΔ෼໺͔ΒαʔϏεΛվ ળ͢ΔࢼΈ͸͋Δ͕ɼαʔϏεΛఏ‫͢ڙ‬Δ‫ݱ‬৔ͷै‫ۀ‬һͷ࿑ಇ‫ڥ؀‬ͷվળ΍ਓࡐ‫ڭ‬ҭͳ Ͳɼ‫ݱ‬৔Ϩϕϧͷվળʹ͍ͭͯ͸͍·ͩଟ͘ͷ໰୊͕͋Δɽओͳ໰୊ͱͯ͠ɼվળʹ͔͔ Δίετ͕ߴ͘ɼͦͷޮՌΛ࣮‫͛ڍ͕ͱ͍͘͜ʹ͠ײ‬ΒΕΔɽվળͷͨΊͷίετͷ௿Լ ΍վળޮՌͷ໌ࣔԽ͕՝୊ͱͳΔɽ·ͨɼै‫ۀ‬һͷଟ͘͸ύʔτλΠϚʔͳͲͷඇਖ਼‫ޏن‬ ༻ऀͰྲྀಈੑ͕ߴ͘ɼै‫ۀ‬һͷมԽʹซͤͨ‫ۀ‬຿εΩϧͷ‫ڭ‬ҭ͕ඞཁͱͳΔɽͦͷࡍɼΑ Γޮ཰త͔ͭૣ‫ۀैʹظ‬һͷεΩϧΛߴΊΒΕΔΑ͏ͳ෼ੳɾՄࢹԽख๏΍ɼվળͷͨΊ ͷϊ΢ϋ΢Λ஝ੵͯ͠վળ‫׆‬ಈʹ൓ө͍ͯ͘͠࢓૊Έ͕ඞཁͰ͋Δɽ ैདྷ͸ɼ࡞‫಺ۀ‬༰΍ঢ়‫گ‬Λ‫ه‬࿥͢ΔͨΊɼਓखʹΑΔ‫؍‬ଌख๏͕Α͘‫ݕ‬౼͞Ε͖ͯͨɽ ͜Ε͸ɼళ௕΍Ϛωʔδϟʔͱ͍ͬͨै‫ۀ‬һͷϦʔμʔతଘࡏͷਓ΍ίϯαϧλϯτͳͲ ͷୈࡾऀʹΑΔ‫هͱ࡯؍‬࿥͕ओͰ͋ͬͨɽ͜ΕΒ͸ଟ͘ͷखؒͱίετ͕͔͔Δ্ʹɼ‫؍‬ ࡯͞ΕΔଆͷෛ୲΋গͳ͘ͳ͍ɽ·ͨɼ‫ސ‬٬ͷ͍ΔۭؒͰ͸αʔϏεʹؔ܎ͷͳ͍‫ऀ࡯؍‬ Λ഑ஔ͢Δ͜ͱ͸޷·͘͠ͳ͍ɽ ۙ೥͸ɼਓͷߦಈ΍࡞‫ۀ‬ͷ‫ܭ‬ଌ΍෼ੳΛ໨తͱͯ͠ɼ΢ΣΞϥϒϧ୺຤ͷٕज़͕ൃల͠ ͖͍ͯͯΔɽ੡଄‫ۀ‬΍ҩྍ‫ݱ‬৔Ͱ͸ɼ͢Ͱʹ΢ΣΞϥϒϧ୺຤ʹΑΔै‫ۀ‬һͷ࡞‫ۀ‬ͷ‫ܭ‬ଌ ࣄྫ͕͋Δɽ‫ػ‬ցֶश΍ύλʔϯೝࣝͳͲͷ޻ֶతख๏΋ɼͦͷ‫ૅج‬ཧ࿦ͷΈͳΒͣɼ࣮ ‫͔ͭڥ؀‬େ‫ن‬໛ͳσʔλΛର৅ͱͨ͠Ԡ༻ٕज़ͷ‫ڀݚ‬΋ଟ͘ͳ͞Ε͍ͯΔɽͦ͜Ͱɼຊ‫ݚ‬ ‫Ͱڀ‬͸͜ΕΒͷ޻ֶతख๏ΛαʔϏε‫ݱ‬৔ͷै‫ۀ‬һͷߦಈ෼ੳʹద༻͠ɼਓखʹཔΒͳ͍ ߦಈ‫ܭ‬ଌͱ෼ੳɾՄࢹԽʹ͍ͭͯ‫ݕ‬౼Λߦ͏ɽ޻ֶతख๏Λ༻͍Δ͜ͱʹΑͬͯɼਓखΑ Γ΋٬‫؍‬త͔ͭ௕‫ظ‬తͳ෼ੳΛՄೳͱ͠ɼίετ΍ෛ୲ͷ໰୊Λղফ͢ΔଞɼΑΓޮՌత ͳ‫ۀ‬຿վળ͕ߦ͑Δ͜ͱ͕‫ظ‬଴͞ΕΔ [1][2]ɽ ෼ੳٕज़ͷҰͭͰ͋Δै‫ۀ‬һͷ࡞‫಺ۀ‬༰ਪఆ͸ɼै‫ۀ‬һ͕͋Δ࣌ࠁʹ͓͍ͯͲͷΑ͏ͳ ࡞‫ۀ‬Λߦ͍͔ͬͯͨΛਪఆ͢Δٕज़Ͱ͋Δ [3]ɽ͜ΕʹΑΓɼͦͷ೔ͷै‫ۀ‬һͷ໾ׂ΍‫ۀ‬. 1.

(6) ຿ͷ๩͕͠͞໌Β͔ʹͳΓɼ‫ۀ‬຿ͷ໰୊఺ͷ೺Ѳ΍վળ͕ଅਐ͞ΕΔɽ࡞‫಺ۀ‬༰ਪఆͷؔ ࿈ٕज़ͱͯ͠‫ج‬ຊಈ࡞‫ݕ‬ग़΍࡞‫ݕۀ‬ग़ɼ࡞‫ۀ‬ͷਫ਼౓ͷଌఆͳͲͷྫ͸͋Δ͕ɼ‫ج‬ຊಈ࡞Λ ૊Έ߹Θͤͨ਺ेඵ͔Β਺෼୯Ґͷ࡞‫ۀ‬Λਪఆ͢Δࣄྫ͸΄ͱΜͲΈΒΕͳ͍ɽ·ͨɼਪ ఆʹಈը૾৘ใΛ༻͍Δࣄྫ΋͋Δ͕ɼը૾ͷऔಘ͕೉͍͠‫ݱ‬৔Ͱ͸ผछͷσʔλΛऩू ͢Δඞཁ͕͋Δɽ. 1.2 ‫ڀݚ‬໨త ຊ‫͕ڀݚ‬໨ࢦ͢ͱ͜Ζ͸ɼαʔϏε‫͚͓ʹۀ‬Δै‫ۀ‬һͷ‫ۀ‬຿ͷՄࢹԽͰ͋ΔɽՄࢹԽ͢ Δࢦඪͷ 1 ͭͱͯ͠ै‫ۀ‬һͷ‫ۀ‬຿࣌ؒதͷ࡞‫಺ۀ‬༰͕‫͛ڍ‬ΒΕΔɽຊ‫Ͱڀݚ‬͸ɼ‫ػ‬ցֶ शΛ༻͍ͯै‫ۀ‬һͷ࡞‫಺ۀ‬༰ΛࣗಈͰਪఆ͢Δख๏ΛఏҊ͢Δɽ࡞‫಺ۀ‬༰ΛਓखͰ‫ه‬ड़͠ ͨΓ෼ੳͨ͠Γ͢Δ͜ͱ͸ߴίετͰ͋Δɽ·ͨɼ‫ސ‬٬΍ఏ‫͢ڙ‬ΔαʔϏεͷྲྀಈੑͷͨ Ίɼ࡞‫಺ۀ‬༰Λ௕‫ظ‬తʹ෼ੳ͢Δඞཁ͕͋ΔɽࣗಈͰਪఆ͢Δٕज़Λཱ֬͢Δ͜ͱʹΑͬ ͯɼ͜ΕΒͷίετ࡟‫͘ͳͰ͚ͩݮ‬ɼ౷‫ܭ‬తɼ޻ֶతͳࢹ఺Ͱͷ෼ੳ͕ՄೳͱͳΔɽ࡞‫ۀ‬ ಺༰ͷϞσϧ͸ै‫ۀ‬һ΍ͦͷ໾ׂ͝ͱʹ࡞‫ۀ‬ΛγϛϡϨʔγϣϯ͢Δ৔߹ʹ΋༻͍ΒΕ Δɽ͜Ε͸ɼαʔϏε‫ݱ‬৔ͷ࠷దͳਓһ഑ஔͷ‫ݕ‬౼΍ɼ৽‫ن‬ళฮͷग़ళલͷγϛϡϨʔ γϣϯʹΑΔ࠷దԽʹԠ༻Ͱ͖Δɽ αʔϏε‫ݱ‬৔ʹ͓͍ͯै‫ۀ‬һͷߦಈΛ‫ܭ‬ଌ͢Δ͜ͱ͸೉͍͠ɽಛʹɼ‫ސ‬٬͕ۙ͘ʹ͍Δ ৔߹ɼ‫ސ‬٬ͷϓϥΠόγʔ΍αʔϏεۭؒ΁ͷ഑ྀ͕ඞཁͱͳΔɽΧϝϥ΍ϚΠΫϩϗϯ ͳͲΛళ಺ʹઃஔ͢Δ͜ͱ͸ɼ๏཯্ɼ๷൜໨తҎ֎Ͱ͸ೝΊΒΕͳ͍ɽ·ͨɼै‫ۀ‬һʹ ૷ண͢Δ΢ΣΞϥϒϧ୺຤΋‫ސ‬٬ͷࢹ఺ʹೖΒͳ͍΋ͷͳͲɼඞཁ࠷௿‫ʹݶ‬཈͑ͳ͚Ε͹ ͳΒͳ͍ɽ͜ͷΑ͏ʹɼ‫ݶ‬ఆ͞Εͨঢ়‫گ‬ͷதͰɼै‫ۀ‬һͷࠊʹ૷ணͨ͠ηϯαɼै‫ۀ‬һಉ ͕࢜΍ΓͱΓ͢Δ௨৴‫෇ʹثػ‬ਵͨ͠ϚΠΫϩϗϯɼ‫ސ‬٬͕ྉཧΛ஫จɾձ‫͢ܭ‬Δࡍʹೖ ྗ͢Δ POS ୺຤σʔλͷ৘ใΛ‫ʹݩ‬ɼै‫ۀ‬һͷ࡞‫಺ۀ‬༰ਪఆΛࢼΈΔɽ ै‫ۀ‬һͷԻ੠σʔλʹ͸ɼΧϝϥը૾ͷΑ͏ʹɼ‫ݱ‬৔ͷঢ়‫گ‬΍ै‫ۀ‬һͷ࡞‫ؔ͢ʹۀ‬Δ৘ ใ͕‫ه‬࿥͞Ε͍ͯΔɽྫ͑͹ɼै‫ۀ‬һͱ‫ސ‬٬ͷձ࿩΍ɼ࡞‫ʹۀ‬൐͏෺ԻͳͲͰ͋Δɽൃ࿩ ಺༰ɾΩʔϫʔυͳͲɼԻ੠σʔλͷΑΓ۩ମతͳ৘ใΛநग़Ͱ͖Ε͹ɼ࡞‫಺ۀ‬༰ਪఆʹ ΋େ͍ʹ໾ཱͭͱߟ͑ΒΕΔɽ͔͠͠ɼԻ੠σʔλʹ͸ै‫ۀ‬һͷൃ࿩͚ͩͰ͸ͳ͘‫ސ‬٬ͷ ൃ࿩΋ೖΓಘΔɽൃ࿩಺༰ͷநग़͸‫ސ‬٬ͷϓϥΠόγʔ΍ै‫ۀ‬һͷਫ਼ਆతෛ୲ʹؔΘΔͨ Ίɼൃ࿩಺༰Λ࡞‫಺ۀ‬༰ਪఆʹ༻͍Δ͜ͱ͸೉͍͠ɽ࡞‫಺ۀ‬༰ਪఆͷ‫ػ‬ցֶशͷͨΊʹԻ ੠σʔλΛਓखͰௌ͍ͯ‫ࢣڭ‬σʔλΛ෇༩͢Δ͜ͱ΋ɼ࠷௿‫ʹݶ‬཈͑ΒΕΔ͜ͱ͕๬· ͍͠ɽຊ‫Ͱڀݚ‬͸ɼൃ࿩಺༰ͳͲϓϥΠόγʔʹؔΘΔ಺༰͸நग़ͤͣɼൃ࿩۠ؒ΍࿩ ऀͷ৘ใͳͲɼந৅తͳ֓೦Λநग़͠ɼ࡞‫಺ۀ‬༰ਪఆ΁ͷ‫ํ༻׆‬๏Λ‫ݕ‬౼͢Δɽ·ͨɼԻ ੠σʔλʹՃ͑ͯɼै‫ۀ‬һͷҐஔ΍ಈ࡞ͳͲΛද‫͢ݱ‬Δηϯασʔλ΍‫ސ‬٬ͷ஫จ৘ใ Λѻͬͨձ‫ܭ‬σʔλΛ༻͍ɼҟछͷσʔλΛಉ࣌ʹ࡞‫಺ۀ‬༰ਪఆʹద༻͢Δख๏Λ‫ݕ‬౼ ͢Δɽ. 2.

(7) 1.3 ؔ࿈‫ڀݚ‬ ޻৔΍‫ݐ‬ઃ‫ݱ‬৔౳Ͱ͸ɼ࿑ಇऀ*1 ͷ࡞‫ۀ‬ਫ਼౓ͱ҆શੑධՁͷͨΊɼ࿑ಇऀͷ࡞‫ۀ‬தͷಈ ࡞ͷ‫ܭ‬ଌͱɼ෼ੳख๏͕ఏҊ͞Ε͍ͯΔɽHartman Β [4] ͸ɼࣗಈं޻৔ʹ͓͍ͯɼ࡞‫ۀ‬ ৔ॴʹΧϝϥɼ࡞‫ʹ۩ثۀ‬ηϯαΛઃஔͯ͠ɼ࿑ಇऀͷಈ࡞ͱ࡞‫ۀ‬ਫ਼౓ͷਪఆΛߦͬͨɽ. Chae Β [5] ͸ɼ‫ݐ‬ઃ‫ݱ‬৔ͷ࿑ಇऀʹରͯ͠ΧϝϥͱηϯαΛ૷ணͤ͞ɼಈ࡞ͷ‫ܭ‬ଌͱ࡞‫ۀ‬ ͷ҆શੑʹର͢ΔධՁΛߦͬͨɽ͜ΕΒ͸ɼ࡞‫಺ۀ‬༰͕ࣗ໌Ͱ͋Γɼ࡞‫͍ͯͭʹۀ‬ͷධՁ Λߦ͏͜ͱ͕໨తͰ͋Δɽ հ‫ࢪޢ‬ઃ [6][7] ΍ҩྍࢪઃ [8] Ͱ͸ɼ‫ݱ‬৔ͷै‫ۀ‬һͷ࿑ಇ‫ڥ؀‬ͷ࣮ଶ͓Αͼ՝୊Λ೺Ѳ ͢ΔͨΊɼλΠϜελσΟௐࠪʹ‫ۀै͍ͯͮج‬һͷߦಈΛਓखͰ‫ه‬࿥ɾ‫͠࡯؍‬ɼհ‫ޢ‬΍‫ױ‬ ऀͷέΞʹؔ͢Δ࣮ଶͷௐ͕ࠪߦΘΕͨɽλΠϜελσΟௐࠪͱ͸ɼ‫ۀ‬຿ΛϫʔΫϢχο τͱ‫ݺ‬͹ΕΔ࡞‫ۀ‬୯Ґʹ෼ׂ͠ɼ࡞‫ۀ‬ͷ࣌ؒͱ಺༰ΛଌఆɾධՁ͢Δ෼ੳख๏Ͱ͋Δɽ࢓ ࣄྔͷఆྔత೺Ѳɼ࡞‫ۀ‬ͷແବͷൃ‫ͱݟ‬վળͷͨΊʹߦΘΕΔɽਓखͰͷ‫ه‬࿥͸ɼ1 ෼୯ ҐͰɼ͔ͭ‫ه‬࿥͢Δै‫ۀ‬һͷਓ਺ͱಉ͡‫͕ऀ࡯؍‬ඞཁͱͳΔͨΊɼ૬Ԡͷίετͱෛ୲ ͕‫ٻ‬ΊΒΕΔ͕ɼ‫ऀ࡯؍‬ͷՄೳͳൣғͰɼΑΓ۩ମతͳ‫ه‬ड़΍ධՁ͕Ͱ͖Δ͜ͱ͕ར఺ Ͱ͋ΔɽҰํɼλΠϜελσΟௐࠪΛਓखʹཔΒͣ΢ΣΞϥϒϧ୺຤Ͱߦ͏ࣄྫ΋͋Δ. [9][10][11]ɽҩྍࢪઃͰ͸ɼҩྍ‫۩ث‬΍୺຤ʹ૷ண‫ܕ‬ηϯαɼ෦԰ʹ‫ڥ؀‬ઃஔ‫ܕ‬ηϯαΛ ઃஔ͢Δ͜ͱʹΑͬͯɼ‫ࢣޢ؃‬ͷ࡞‫಺ۀ‬༰΍࡞‫ۀ‬৔ॴͷ‫ه‬࿥͕ߦΘΕͨɽਓखʹΑΔλΠ ϜελσΟௐࠪͱൺ΂ɼΑΓ௕‫ظ‬త͔ͭ௿ίετͰ‫ۀ‬຿ͷ࣮ଶΛਤΔ͜ͱ͕Ͱ͖ɼ‫ʹऀױ‬ Ԡͯ͡ྲྀಈతʹͳΔ‫ࢣޢ؃‬ͷ࡞‫ۀ‬Λ෼ੳͰ͖Δ͜ͱ͕ར఺Ͱ͋Δɽ ຊ‫Ͱڀݚ‬ର৅ͱ͢Δ֎৯࢈‫ۀ‬෼໺ʹ͍ͭͯ΋ɼௐཧ৔ʹઃஔͨ͠Χϝϥө૾΍ௐཧ܎ͷ ै‫ۀ‬һʹ૷ணͨ͠ηϯα৘ใ͔ΒಘΒΕΔҐஔ৘ใΛ‫ʹݩ‬ɼௐཧઃඋ΍ௐཧ࡞‫ۀ‬ͷվળΛ ‫ݕ‬౼͢Δ‫ߦ͕ڀݚ‬ΘΕͨ [12][13][14]ɽௐཧ܎ͷ࡞‫ۀ‬͸ɼ޻৔ͷ࿑ಇऀͷ࡞‫ͱۀ‬ൺֱతࣅ ͓ͯΓɼै‫ۀ‬һͷҐஔ΍ํ޲ʹΑͬͯԿͷ‫۩ث‬Λ࢖ͬͯԿͷ࡞‫ۀ‬Λ͍ͯ͠Δ͔Λྨਪ͠΍ ͍͢ɽ͢ͳΘͪɼҐஔ৘ใ͑͞ਖ਼͘͠ਪఆͰ͖Ε͹ɼௐཧ࡞‫ۀ‬ͷ‫ݕ‬ग़͸ͦΕ΄Ͳ೉͘͠ͳ ͍ɽ·ͨɼ‫ސ‬٬ཱ͕ͪೖΒͳ͍ۭؒͷͨΊɼΧϝϥʹΑΔࡱӨ΋ՄೳͰ͋Γɼ͜ͷΑ͏ͳ ৚݅Ͱ͸࡞‫಺ۀ‬༰ͷਪఆख๏΋ཱ֬͞Εͭͭ͋Δɽ ࿑ಇऀͷԻ੠σʔλͷ෼ੳͱ͍͏‫Ͱ఺؍‬͸ɼίʔϧηϯλʔͷΦϖϨʔλͱ‫ސ‬٬ؒͷձ ࿩Λ෼ੳ͢Δྫ͕Α͘‫ݟ‬ΒΕΔ [15][16]ɽձ࿩಺༰ͷςΩετԽ͚ͩͰ͸ͳ͘ɼൃ࿩଎౓ ΛϞσϧԽͯ͠Ԡର඼࣭Λ෼ੳͨ͠Γ [17]ɼ࿩ऀࣝผٕज़ʹΑͬͯࣗಈతʹ࿩ऀΛਪఆ͢ ΔͳͲͷࢼΈ΋͋Δ [18]ɽ͜ΕΒ͸ɼൃ࿩͕ओͨΔ‫ۀ‬຿Ͱ͋Γɼൃ࿩ͦͷ΋ͷΛ෼ੳ͠՝ ୊Λൃ‫͢ݟ‬Δ͜ͱ͕‫ۀ‬຿ͷվળʹ‫͕ܨ‬Δɽ. *1. ຊ‫Ͱڀݚ‬͸ै‫ۀ‬һʹ૬౰ɽ. 3.

(8) 1.4 ࿦จߏ੒ ຊ‫ڀݚ‬ͷྲྀΕͱ࿦จߏ੒Λਤ 1.1 ʹࣔ͢ɽຊ‫ڀݚ‬ͷഎ‫ߦͨͬͳͱܠ‬ಈ‫ܭ‬ଌ΍‫ۀ‬຿վળͷ ࿮૊Έʹ͍ͭͯ͸ୈ 2 ষͰ঺հ͢Δɽ࡞‫಺ۀ‬༰ਪఆʹ޲͚ͨԻ੠σʔλͷ෼ੳʹ͍ͭͯ͸ ୈ 3 ষɼୈ 4 ষͰड़΂Δɽຊ‫ڀݚ‬ͷ໨తͰ͋Δ࡞‫಺ۀ‬༰ਪఆ͸ୈ 5 ষͰड़΂Δɽ࡞‫಺ۀ‬༰ ਪఆ݁ՌͷԠ༻ٕज़΍ՄࢹԽͷࢼΈʹ͍ͭͯ͸ୈ 6 ষͰٞ࿦͢Δɽୈ 7 ষͰຊ࿦Λ·ͱ ΊΔɽҎԼʹɼ֤ষͷ໨తʹ͍ͭͯड़΂Δɽ ୈ 2 ষͰ͸ɼै‫ۀ‬һͷߦಈ‫ܭ‬ଌ΍࡞‫಺ۀ‬༰ਪఆɼൃ࿩ͷ෼ੳʹؔ͢Δؔ࿈‫͍ͯͭʹڀݚ‬ ঺հ͢ΔɽͦΕΛ౿·্͑ͨͰຊ‫ڀݚ‬ͷҐஔ͚ͮʹ͍ͭͯड़΂Δɽ·ͨɼຊ‫Ͱڀݚ‬෼ੳ͢ ΔԻ੠σʔλɾηϯασʔλɾձ‫ܭ‬σʔλͷऩूํ๏ͱͦͷৄࡉʹ͍ͭͯࣔ͢ɽ ୈ 3 ষͰ͸ɼԻ੠σʔλͷ෼ੳٕज़ͷ 1 ͭɼൃ࿩۠ؒ‫ݕ‬ग़ʹ͍ͭͯड़΂Δɽै‫ۀ‬һ͸Ϛ ΠΫϩϑΥϯΛ༻͍ͯԻ੠σʔλΛ࿥Իͨ͠ɽϚΠΫϩϑΥϯ͸ϋϯζϑϦʔͷͨΊɼ‫ۀ‬ ຿தɼৗʹ࿥Ի͞Εͨঢ়ଶͰ͋ͬͨɽै‫ۀ‬һͷൃ࿩ʹண໨ͯ͠෼ੳ͢ΔͨΊɼԻ੠σʔλ தͷै‫ۀ‬һ΍‫ސ‬٬ͷൃ࿩Ҏ֎ͷ۠ؒΛআ‫͢ڈ‬Δɽൃ࿩۠ؒ‫ݕ‬ग़͸‫͔͘ݹ‬Β‫͞ڀݚ‬Ε͍ͯΔ ٕज़Ͱ͋Δ͕ɼଟ༷ͷࡶԻΛ‫ؚ‬Έɼपғͷ‫ڥ؀‬΍ൃ࿩ύϫʔ͕࣌ؒͱͱ΋ʹมԽ͢ΔΑ͏ ͳঢ়‫Ͱگ‬͸ߴ౓ͳٕज़Λඞཁͱ͢Δɽຊ‫Ͱڀݚ‬͸ɼ‫ڥ؀‬ͷมԽ͕සൟʹൃੜ͢Δ৚݅ԼͰ ΑΓଟ͘ͷൃ࿩Λநग़Ͱ͖Δख๏Λ‫ݕ‬౼͢Δɽ ୈ 4 ষͰ͸ɼୈ 3 ষͰ‫ݕ‬ग़ͨ͠ൃ࿩۠ؒͷ࿩ऀΛਪఆ͢Δɽ࿩ऀ͸ϚΠΫΛ૷ணͨ͠ ै‫ۀ‬һʢҎԼɼϚΠΫ૷ணऀʣɼଞͷै‫ۀ‬һɼ‫ސ‬٬ͷ 3 Ϋϥεͱ͠ɼ֤࿩ऀͷൃ࿩ΛϞσ ϧԽ͠ɼ3 Ϋϥε෼ྨΛߦ͏ɽ࿩ऀΫϥε෼ྨͷ໨త͸ɼϚΠΫ૷ணऀ͕͋Δ࣌ؒଳʹ͓ ͍ͯ୭ʢଞͷै‫ۀ‬һ·ͨ͸‫ސ‬٬ʣͱΑ͘ձ࿩͍ͯ͠Δ͔Λ೺Ѳ͢Δ͜ͱͰ͋Δɽ͜ΕʹΑ ΓɼϚΠΫ૷ணऀ͕઀٬࡞‫ۀ‬Λ͍ͯ͠Δͷ͔ɼ઀٬Ҏ֎ͷ࡞‫ۀ‬Λ͍ͯ͠Δͷ͔Λେผ͢Δ ͜ͱ͕Ͱ͖Δɽ͜ͷ৘ใ͸ɼ࣍ষͰड़΂Δ࡞‫಺ۀ‬༰ਪఆ΁‫͞༻׆‬ΕΔɽྨࣅٕज़ͷ࿩ऀࣝ ผͰ͸ಛఆ࿩ऀͷΫϥεΛѻ͏͜ͱ͕ଟ͔͕ͬͨɼຊ‫ڀݚ‬ͷ࿩ऀΫϥε෼ྨͰ͸ɼଞͷै ‫ۀ‬һɼ‫ސ‬٬ͷ 2 Ϋϥε͸ෆಛఆ࿩ऀΛଟ͘‫ؚ‬ΉΫϥεͰ͋Γɼಛఆ࿩ऀΑΓ΋೉͍͠λε ΫͰ͋Δɽຊ‫Ͱڀݚ‬͸ɼ࿩ऀΫϥε෼ྨʹ SVM ΍ DNN ͳͲͷख๏Λద༻͠ɼੑೳͷൺ ֱΛߦ͏ɽ ୈ 5 ষͰ͸ɼԻ੠σʔλɾηϯασʔλɾձ‫ܭ‬σʔλΛ༻͍ͨै‫ۀ‬һͷ࡞‫಺ۀ‬༰ਪఆʹ ͍ͭͯड़΂Δɽ࡞‫಺ۀ‬༰͸ै‫ۀ‬һͷ‫ۀ‬຿தͷ໾ׂ΍໨తʹԠͯ͡ఆٛ͞Εͨ΋ͷͰɼʮ஫ จ࢕͍ʯʮ഑હʯ ʮձ‫ܭ‬ʯͷΑ͏ͳ઀٬࡞‫ۀ‬΍ɼʮ٬੮४උɾย෇͚ʯʮҠಈɾӡൖʯͷΑ͏ ͳඇ઀٬࡞‫͕͋ۀ‬Δɽ͜ΕΒ͸ɼෳ਺ͷ‫ج‬ຊಈ࡞΍ঢ়‫͕گ‬૊Έ߹Θͬͯ͞ 1 ͭͷ࡞‫ۀ‬Λߏ ੒͢Δɽ࡞‫಺ۀ‬༰ਪఆͷೖྗͱ͢Δ 3 छͷσʔλ͸ɼ͜ΕΒͷ࡞‫ͱۀ‬௚઀ඥ෇͚ΒΕΔ΋ ͷ͕গͳ͍఺Ͱ‫ط‬ଘͷߦಈਪఆΑΓ΋೉͍͠ɽ·ͨɼԻ੠৘ใΛ࡞‫಺ۀ‬༰ਪఆʹ‫͢༻׆‬Δ ‫ྫڀݚ‬͸গͳ͍ɽຊ‫Ͱڀݚ‬͸ɼ࡞‫಺ۀ‬༰ਪఆʹ༻͍Δಛ௃ྔʹ͍ͭͯɼԻ੠σʔλ͔Βಘ ͨൃ࿩۠ؒ΍࿩ऀͷ৘ใΛ༻͍Δɽ·ͨɼࣝผ‫ʹث‬͸ Adaboost ๏ʹ࣌ؒత෼෍Λ૊Έ߹ Θͤͨख๏ʹΑΓɼੑೳͷվળΛࢼΈΔɽ. 4.

(9) ਤ 1.1. શମͷྲྀΕͱ࿦จߏ੒ɽ. ୈ 6 ষͰຊ࿦จΛ·ͱΊΔɽ. 5.

(10) ୈ2ষ. ߦಈ‫ܭ‬ଌ ຊষͰ͸ɼαʔϏε‫ۀ‬ͷ‫ۀ‬຿վળͷͨΊͷ࿮૊ΈͰ͋Δߦಈ‫ܭ‬ଌʹ͍ͭͯड़΂Δɽͦ͠ ͯɼຊ‫Ͱڀݚ‬ѻ͏ٕज़ͷҐஔ͚ͮͱɼϨετϥϯͰ࣮ࡍʹ‫ܭ‬ଌͨ͠σʔλͷৄࡉʹ͍ͭͯ ड़΂Δɽ. 2.1 ߦಈ‫ܭ‬ଌͷ࿮૊Έ αʔϏε‫ۀ‬ͷ‫ۀ‬຿վળ͸‫͔͘ݹ‬ΒߦΘΕ͖͍ͯͯΔɽ‫ۀ‬຿վળʹ͸‫ۀ‬຿ͷ‫͑ݟ‬ΔԽ ͱ٬‫؍‬తͳࢹ఺͔Βͷ෼ੳɾධՁ͕ඞཁͱͳΔɽैདྷ͔ΒɼQC ‫׆‬ಈʢQuality Control. Activityʣ[19][20] ʹΑͬͯɼαʔϏε඼࣭ͷ؅ཧ΍࡞‫཰ޮۀ‬ͷվળͳͲΛ‫ݱ‬৔ϨϕϧͰ ٞ࿦͢ΔऔΓ૊Έ͕͋ͬͨɽ͔͠͠ɼ͜ΕΒͷ‫ͳͱݩ‬Δ৘ใ͸ϕςϥϯै‫ۀ‬һ΍‫ܦ‬Ӧऀͷ ओ‫ʹ؍‬པΔͱ͜Ζ͕େ͖͘ɼͦͷ৔͚ͩͷվળ͸ՄೳͰ΋ɼ௕‫ظ‬తͳվળ͸೉͔ͬͨ͠ɽ ՝୊͸େ͖͘ 2 ͭ͋Γɼࠜ‫ͱڌ‬٬‫؍‬ੑͷ͋ΔσʔλΛऩू͢Δ͜ͱɼͦͯ͠‫ݱ‬৔ͷै‫ۀ‬һ ͷ‫ͱ͖ͮؾ‬վળʹ‫͕ܨ‬Δ͜ͱͰ͋Δɽ αʔϏε޻ֶͰ͸ɼ‫؍‬ଌɼ෼ੳɼఏࣔɼઃ‫ܭ‬ͷϧʔϓΛ‫܁‬Γฦ͢͜ͱʹΑͬͯɼ‫ۀ‬຿վળ Λࢧԉ͢Δ࿮૊Έ͕ఏҊ͞Ε͍ͯΔɽ‫؍‬ଌͰ͸ɼै‫ۀ‬һͷߦಈσʔλ΍ళฮͷձ‫ܭ‬σʔλ ͷऩूɼ෼ੳͰ͸ऩूͨ͠σʔλͷ෼ੳͱ‫ۀ‬຿ࢦඪͷநग़ɼఏࣔͰ͸‫ݱ‬৔ͷै‫ۀ‬һ͕ղऍ Ͱ͖ΔͨΊͷ෼ੳ݁ՌͷՄࢹԽͱఏࣔɼઃ‫Ͱܭ‬͸‫ݱ‬৔ϨϕϧͰͷ໰୊఺ͷநग़ɼ໨ඪͷઃ ఆɼվળ఺ͷଧ਍ʹΑͬͯ৽ͨͳαʔϏεͷઃ‫ܭ‬Λߦ͏ɽͦͯ͠ɼ৽ͨͳαʔϏεʹର͠ ͯ࠶౓‫؍‬ଌΛߦ͍ɼվળ಺༰ͱͦͷޮՌʹ͍ͭͯ෼ੳΛߦ͏ɽຊ‫Ͱڀݚ‬͸ɼͦͷதͰ΋ɼ ‫؍‬ଌͱ෼ੳͷϑΣʔζʹண໨ͨ͠ɽ‫؍‬ଌͰ͸ɼηϯα΍ϚΠΫϩϑΥϯʹΑͬͯै‫ۀ‬һͷ ηϯαɾԻ੠σʔλΛऩू͠ɼPOS ୺຤౳Λ༻͍ͯ‫ސ‬٬ͷ஫จɾձ‫ܭ‬σʔλΛऩूͨ͠ɽ. 2.2 Ϩετϥϯʹ͓͚Δσʔλऩू ຊ‫ڀݚ‬͸ɼϨετϥϯͷ઀٬܎Λର৅ͱ͓ͯ͠Γɼ‫ސ‬٬ͱͷίϛϡχέʔγϣϯͷଟ͍ ‫͋Ͱڥ؀‬Δɽ·ͨɼ෼ੳʹ͸௕‫ؒظ‬ͷσʔλΛඞཁͱ͓ͯ͠Γɼσʔλऩूίετ΍ϓϥ. 6.

(11) ਤ 2.1. ै‫ۀ‬һͷߦಈ‫ܭ‬ଌπʔϧɽ ʢ্͸ϚΠΫϩϑΥϯͱϨίʔμɼԼ͸ηϯαϞδϡʔϧʣ. ਤ 2.2. ࠎ఻ಋϚΠΫϩϑΥϯ (ࠨ) ͱ૷ணྫ (ӈ)ɽ. Πόγʔɼର৅ऀͷਫ਼ਆతෛ୲ͷ໘͔Β‫࡯؍‬๏΍ઃஔ෺ʹΑΔ‫؍‬ଌ͸ద༻͠ʹ͍͘ɽͦ͜ Ͱɼ΢ΣΞϥϒϧ୺຤ʹΑΔ‫؍‬ଌΛߦͬͨɽै‫ۀ‬һʹηϯα΍ϚΠΫϩϑΥϯΛ૷ண͠ ͯɼηϯασʔλ΍Ի੠σʔλΛऔಘͨ͠ [21]ɽै‫ۀ‬һ΁ͷ૷ஔͷ૷ணྫͱɼࠎ఻ಋϚΠ ΫϩϑΥϯ [22] ͷྫΛਤ 2.1 ͱਤ 2.2 ʹࣔ͢ɽΧϝϥʹ͍ͭͯ͸ྙཧతʹಋೖ͕೉͍ͨ͠ Ίɼ୅ΘΓͱͯ͠Ի੠σʔλΛऩूͨ͠ɽԻ੠σʔλΛ࿥Ի͢Δʹ͋ͨͬͯɼ‫ސ‬٬ͷൃ࿩ ΍ै‫ۀ‬һͷ‫ۀ‬຿֎ͷൃ࿩͕ೖΔ͜ͱʹΑΔϓϥΠόγʔͷ໰୊ʹ഑ྀ͢Δඞཁ͕͋Δɽ· ͨɼ‫ۀ‬຿ʹඞཁͳൃ࿩Ͱ͋ͬͯ΋ɼൃ࿩಺༰Λ࿥Ի͞ΕΔͱ͍͏͜ͱ͸ਫ਼ਆతෛ୲͕ൃੜ ͢Δɽ͜ΕΒͷରࡦͱͯ͠ɼࠎ఻ಋϚΠΫϩϑΥϯ΍ࢦ޲ੑϚΠΫϩϑΥϯΛ༻͍Δ͜ͱ Ͱɼपғͷൃ࿩ΛೖΓʹ͘͘͢Δ͜ͱ΍ɼै‫ۀ‬һͷ‫ؒ࣌ܜٳ‬ͷσʔλ͸෼ੳ͠ͳ͍ͳͲɼ Ի੠σʔλͷ෼ੳ಺༰Λඞཁ࠷௿‫ʹݶ‬཈͑Δ͜ͱ͕‫͛ڍ‬ΒΕΔɽ. 2.3 Ի੠σʔλͷ‫ܭ‬ଌ ϨετϥϯͰ͸ɼपғͷൃ࿩΍৯‫ث‬ԻͳͲͷ෺Իɼళ಺ BGM ͳͲ༷ʑͳඇఆৗࡶԻ͕ ൃੜ͢ΔͨΊɼࡶԻରࡦ͕ඞཁͰ͋Δɽࠎ఻ಋϚΠΫϑΥϯ͸ɼҰൠతͳۭ‫఻ؾ‬ಋʹΑΔ ϚΠΫϩϗϯͱൺֱ͢ΔͱࡶԻͷॏ৞͕গͳ͍ɽͦΕΏ͑ɼϚΠΫϩϗϯΛ૷ணͨ͠ै‫ۀ‬ һͷൃ࿩ΛΑΓ໌ྎʹ࿥Ի͢Δ͜ͱ͕Ͱ͖Δɽ·ͨɼपғͷൃ࿩͕‫ݮ‬ਰ͢ΔͨΊɼ‫ސ‬٬ͷ. 7.

(12) ൃ࿩ͷϓϥΠόγʔอ‫͕ͳͭʹޢ‬Γɼ‫ސ‬٬ͷଟ͍৔ॴͰ࿥Ի͢Δ৔߹ʹࠎ఻ಋϚΠΫϩϗ ϯ͸༗༻Ͱ͋Δɽࠎ఻ಋϚΠΫϩϗϯʹ͸ɼϔουηοτ‫ܕ‬ͷ΋ͷ΋‫ݟ‬ΒΕΔ͕ɼ୤ண΍ ඇ૷ண࣌ͷ؅ཧ͕༰қͰɼै‫ۀ‬һ͕‫ۀ‬຿தʹ૷ண͍ͯ͠ΔΠϯΧϜʹ͍ۙ‫ܗ‬ঢ়Ͱ͋Δͱ͍ ͏఺ͰΠϠʔϚΠΫ‫ܕ‬Λ࠾༻ͨ͠ɽ զʑ͸ɼ਺ϲ݄ؒʹ౉ͬͯै‫ۀ‬һͷ‫ۀ‬຿தͷԻ੠σʔλΛ‫ܭ‬ଌͨ͠ [23]ɽै‫ۀ‬һ 1 ਓ 1 ೔͋ͨΓ 5ʙ10 ࣌ؒఔ౓ʢ‫ؚؒ࣌ܜٳ‬Ήʣͷ‫ۀ‬຿͕͋Γɼ࿈ଓͯ͠Ի੠σʔλΛ࿥Ի͢Δ ͨΊʹ MP3 ‫Ͱࣜܗ‬࿥Իͨ͠ɽԻ࣭ΛอͭͨΊɼϏοτϨʔτΛ 256kbps ͱͨ͠ɽ௕࣌ؒ ͔ͭ௕‫ؒظ‬ͷ‫ܭ‬ଌʹ͓͍ͯɼ૷ணͷෛ୲͕՝୊ͱͯ͠‫͛ڍ‬ΒΕͨɽ‫ܭ‬ଌͷࡍɼ‫ۀ‬຿ʹࢧো Λ͖ͨ͢৔߹͸ϚΠΫϩϗϯΛҰ࣌తʹ֎ͯ͠΋ྑ͍ͱ͍͏৚݅Ͱɼै‫ۀ‬һʹϚΠΫϩϗ ϯΛ࢖༻ͯ͠௖͍ͨɽࠎ఻ಋϚΠΫϩϗϯΛ༻͍ͯཧ૝తͳԻ੠Λऩू͢ΔͨΊʹ͸ɼਖ਼ ͍͠૷ணঢ়ଶΛอͭඞཁ͕͋Δɽ͔͠͠ɼࠎ఻ಋϚΠΫΫϩϑΥϯ͸ΠϠϗϯͱൺֱͯ͠ ૷ண෦ʹಥ‫͕͋ى‬ΔͨΊ૷ண‫ͳʹؾ͕ײ‬Γ΍͘͢ɼ‫ۀ‬຿தʹϚΠΫϩϗϯʹ৮ΕͨΓϚΠ ΫϩϗϯΛ֎ͨ͠Γ͢Δέʔε͕͋ͬͨɽͦͷ৔߹ɼࡶԻͷࠞೖ΍ϚΠΫϩϗϯΛ૷ண͠ ͨै‫ۀ‬һͷԻ੠͕े෼ͳύϫʔͰ࿥Ի͞Εͳ͍ͳͲͷ໰୊͕ൃੜͨ͠ɽ͜ͷ໰୊͸‫ޙ‬ड़ͷ Ի੠ॲཧʹେ͖͘Ө‫ڹ‬Λ༩͑ͯ͠·͍ͬͯΔͨΊɼϚΠΫϩϗϯͷ‫ܗ‬ঢ়ͷվྑ͸ඞਢͰ͋ Δɽ૷ணͷෛ୲ʹؔͯ͠͸ɼͦΕΛܰ‫͢ݮ‬Δ૷ஔ [24] ΍ NAM ϚΠΫ [25] ͳͲ͕։ൃ͞ Ε͍ͯΔɽ·ͨɼ૷ண࣌ͷෛ୲͚ͩͰͳ͘ɼ࿥Ի͢Δ͜ͱʹର͢Δै‫ۀ‬һͷཧղ΍ਫ਼ਆత ෛ୲ͷܰ‫ݮ‬΋՝୊ͱͯ͠‫͛ڍ‬ΒΕͨɽै‫ۀ‬һͰ΋ి࿩ΦϖϨʔλͳͲҰ෦ͷ‫ۀ‬຿ʹ͓͍ͯ ࿥Ի͢Δ͜ͱ͸Ұൠతʹͳ͍ͬͯΔɽ͔͠͠ɼαʔϏεͷ‫ݱ‬৔ʹ͓͍ͯ‫ۀ‬຿தͷൃ࿩Λ࿥ Ի͢Δ͜ͱ͸·ͩ·ͩ௝͘͠ɼ఍߅ͷ͋Δै‫ۀ‬һ͸গͳ͘ͳ͍ɽ࿥Իͨ͠Ի੠σʔλͷ༻ ్΍໨తΛ͸͖ͬΓͤ͞ɼै‫ۀ‬һͷෆ҆ʹରॲ͢Δ͜ͱ͕ඞཁͰ͋Δɽ·ͨɼ࣮ࡍʹ QC ‫׆‬ಈͳͲͷ‫ۀ‬຿վળʹ໾ཱͯɼԻ੠σʔλͷඞཁੑΛཧղͯ͠΋Β͏͜ͱͰ‫ܭ‬ଌ΁ͷϞν ϕʔγϣϯΛ্͛Δ͜ͱ΋େ੾Ͱ͋Δɽ. 8.

(13) ୈ3ষ. ൃ࿩۠ؒ‫ݕ‬ग़ ຊষͰ͸ɼै‫ۀ‬һͷԻ੠σʔλΛ෼ੳ͢Δ࠷΋‫ج‬ຊతͳॲཧͰ͋Δൃ࿩۠ؒ‫ݕ‬ग़ʹ͍ͭ ͯड़΂Δɽൃ࿩۠ؒ‫ݕ‬ग़ͷҙٛͱຊ࿦จʹ͓͚Δ໨తʹ͍ͭͯԆ΂ɼ࣮‫ͦͱݧ‬ͷߟ࡯Λߦ ͏ɽൃ࿩۠ؒ‫ݕ‬ग़ͷ݁Ռ͸ɼ‫ޙ‬ड़ͷΩʔϫʔυਪఆɼ࿩ऀΫϥε෼ྨɼ࡞‫಺ۀ‬༰ਪఆʹ༻ ͍ΒΕΔɽ. 3.1 ൃ࿩۠ؒ‫ݕ‬ग़ͷ֓ཁ (a) ઌߦ‫ڀݚ‬ ൃ࿩۠ؒ‫ݕ‬ग़ʢVoice Activity Detection; ҎԼɼVADʣͱ͸ɼԻ੠σʔλதͷൃ࿩۠ؒ Λநग़͢Δٕज़Ͱ͋Δ [26]ɽͦͷଟ͘͸ൃ࿩ͷ੾Γग़͠Λ໨తͱ͓ͯ͠ΓɼԻ੠ೝࣝ΍࿩ ऀࣝผͳͲͷલॲཧͱͯ͠༻͍Δ͜ͱͰɼͦͷ‫ޙ‬ͷॲཧͷ‫ݮ࡟ྔࢉܭ‬ɼࡶԻԼʹ͓͚Δ‫ޡ‬ ࣝผΛ‫ݮ‬Β͢ͳͲͷޮՌ͕͋Δɽ·ͨɼαʔϏε޻ֶʹ͓͍ͯ͸ɼൃ࿩۠ؒͷ௕͞͸ै‫ۀ‬ һ΍‫ސ‬٬ͳͲͷൃ࿩࣌ؒΛද͠ɼै‫ۀ‬һͷ๩͠͞΍‫ސ‬٬ͱͷίϛϡχέʔγϣϯʢ઀٬ʣ ͷྔɾ࣭ͳͲɼै‫ۀ‬һͷߦಈղੳʹ͓͚Δ౷‫ͯ͠ͱྔܭ‬ѻ͏͜ͱ͕Ͱ͖ΔɽͦͷͨΊɼൃ ࿩۠ؒͷ৘ใ΋ɼ࿩ऀ΍ΩʔϫʔυͳͲͷϝλ৘ใͱಉ༷ʹɼै‫ۀ‬һͷߦಈղੳʹ͓͍ͯ ॏཁͳ໾ׂΛ࣋ͭɽ. VAD ͷྺ࢙͸‫͘ݹ‬ɼۙ೥͸࣮‫ڥ؀‬σʔλʹରͯ͠΋ੵ‫ۃ‬తʹऔΓ૊·Ε͍ͯΔɽVAD ͷॲཧաఔ͸େ͖͘ಛ௃நग़෦ͱࣝผ෦͔ΒͳΔɽಛ௃நग़෦Ͱ͸ɼൃ࿩ͷಛੑΛද͠ ͨಛ௃ྔΛೖྗ৴߸ʢԻ੠σʔλʣ͔Β‫͢ࢉܭ‬Δɽࣝผ෦Ͱ͸ɼಛ௃ྔ͔Βൃ࿩ɾඇൃ࿩ Λࣝผ͢ΔͨΊͷ‫ج‬४΍౷‫ྔܭ‬ʢϞσϧʣΛֶश͠ɼൃ࿩ɾඇൃ࿩ͷ൑ఆΛߦ͏ɽ‫ݹ‬య తʹ͸ɼಛ௃ྔͱͯ͠ൃ࿩ͷର਺ύϫʔ΍θϩަࠩ਺͕༻͍ΒΕɼࣝผ෦Ͱ͸ᮢ஋ॲཧ Λߦ͏͜ͱͰൃ࿩ɾඇൃ࿩Λ൑ఆ͖ͯͨ͠ɽΫϦʔϯ‫Ͱڥ؀‬͸͜ͷํ๏Ͱ΋े෼ͳੑೳ ΛಘΔ͜ͱ͕Ͱ͖ɼᮢ஋ͷνϡʔχϯά͑͞ద੾ʹߦ͑͹‫ྔࢉܭ‬΋ඇৗʹগͳͯ͘ࡁΉɽ. VAD Ͱ͸௕࣌ؒͷԻ੠σʔλ΍ϦΞϧλΠϜͷೖྗ৴߸Λѻ͏͜ͱ͕ଟ͘ɼ‫ྔࢉܭ‬ͷগ ͳ͞΋ॏཁͱͳΔɽҰํɼ୯७ʹԿΒ͔ͷԻ͕ฉ͑͜Δ͔Ͳ͏͔Λ൑ఆ‫ج‬४ͱ͍ͯ͠Δͨ Ίɼൃ࿩Ҏ֎ͷԻʢࡶԻʣ΋ൃ࿩ͱ൑ఆͯ͠͠·͏͜ͱ͕ଟ͘ɼࡶԻԼͷԻ੠ʹରͯ͠͸. 9.

(14) े෼ͳਫ਼౓ΛಘΒΕͳ͔ͬͨɽͦ͜Ͱɼൃ࿩ͱࡶԻΛ۠ผ͢ΔͨΊͷಛ௃ྔ͕ఏҊ͞Ε ͖ͯͨɽྫ͑͹ɼԻ੠৴߸ͷ໬౓ɾ࿪౓ͳͲͷߴ࣍౷‫[ ྔܭ‬27]ɼεϖΫτϧͷ௿प೾੒෼ ͷύϫʔ [28]ɼεϖΫτϧͷௐ೾੒෼ͷύϫʔ [29]ɼMFCCʢMel-Frequency Cepstrum. Coefficientsʣͷ࿈ଓੑΛߟྀͨ͠΋ͷ [30]ɼ௕࣌ؒมಈಛ௃ྔ [31] ͳͲͰ͋Δɽ·ͨɼࣝ ผ෦Ͱ΋ɼᮢ஋ॲཧ͚ͩͰͳ͘ɼൃ࿩ɾඇൃ࿩࣌ͷಛ௃ྔΛ֬཰ϞσϧͰද‫ࣝͯ͠ݱ‬ผ͢ Δख๏΋ఏҊ͞Ε͖ͯͨɽ͞Βʹɼൃ࿩ͷ࿈ଓੑΛߟྀͨ͠ɼࣝผ݁ՌͷϋϯάΦʔόॲ ཧ͕ߦΘΕΔ͜ͱ΋ଟ͍ [28]ɽ͜ΕΒ͸ɼࡶԻͱൃ࿩Λ۠ผ͢ΔଞɼΑΓಛ௃తͳൃ࿩Λ ࣝผ͢Δ͜ͱ΋Մೳͱ͢Δɽ. (b) ຊ‫ڀݚ‬ͷ VAD ΁ͷ՝୊ ຊ‫ڀݚ‬ͷ VAD Ͱରॲ͢΂͖఺͸େ͖͘ 3 ͭ͋Δɽ1 ͭ໨͸ɼ࿥Ի‫ڥ؀‬ͷมԽͰ͋Δɽ ࿥Ի‫ͱڥ؀‬͸ɼ࿥Ի৔ॴʹΑΔपғͷࡶԻͷೖΓ΍͢͞΍࢒‫ڹ‬ͷେ͖͞ɼϚΠΫϩϑΥϯ ͷ૷ண۩߹ʹԠͨ͡ൃ࿩ͷ࿥Ի͠΍͢͞ʢύϫʔ΍໌ྎੑͳͲʣΛࢦ͢ɽै‫ۀ‬һ͸࡞‫࣌ۀ‬ ؒதɼৗʹϚΠΫϩϑΥϯΛ૷ண͓ͯ͠Γɼ৔ॴͷҠಈʹ൐͍࿥Ի‫͕ڥ؀‬มԽ͢Δɽ·ͨɼ ϚΠΫϩϑΥϯ΍ίʔυʹ઀৮͢Δ͜ͱͰ࿥Ի‫͕ڥ؀‬มԽ͢Δ৔߹΋͋Δɽ࿥Ի‫ʹڥ؀‬ద ԠతʹύϥϝʔλΛௐઅ͢Δ͜ͱ͕‫ٻ‬ΊΒΕΔɽ2 ͭ໨͸ɼଟछଟ༷ͳࡶԻͰ͋ΔɽϨε τϥϯ‫Ͱڥ؀‬͸ଟ͘ͷछྨͷࡶԻ͕Ի੠σʔλʹॏ৞͢Δɽ৯‫ث‬Ի΍ਫಓͷԻɼ଍Իɼ୺ ຤Իɼళ಺ BGM ͳͲ͕͋Δɽ͜ΕΒͷࡶԻ͸ൃ࿩ͷ෼ੳʹ͸ෆཁͰ͋Δ͕ɼগͳ͔Βͣ Ի੠ॲཧ΁ͷӨ‫ڹ‬Λ༩͑ΔͨΊɼࣄલʹআ‫͢ڈ‬Δ͔ɼࡶԻʹ‫ͳ݈ؤ‬ख๏Λ༻͍Δ͜ͱ͕๬ ·͍͠ɽ3 ͭ໨͸ɼൃ࿩ʹ΋ଟ͘ͷछྨ͕͋Δ͜ͱͰ͋Δɽ࿩ऀ΍ঢ়‫ʹگ‬Αͬͯൃ࿩ͷύ ϫʔ΍Իߴɼ࿩଎ͳͲͷಛ௃͕ҟͳΔɽ࿩ऀʹ͸ɼϚΠΫΛ૷ணͨ͠ै‫ۀ‬һɼଞͷै‫ۀ‬һɼ ‫ސ‬٬ͱ͍͏ 3 ͭͷΧςΰϦ͕͋Γɼঢ়‫Ͱگ‬͸઀٬ձ࿩ɼ‫ۀ‬຿࿈བྷɼࡶஊͳͲ͞Βʹෳ਺ͷ ΧςΰϦ͕͋ΔɽຊষͰѻ͏ VAD ͸ɼ͜ΕΒͷҧ͍Λ۠ผ͢Δ͜ͱͳ͘ɼΑΓଟ͘ͷൃ ࿩Λ‫ݕ‬ग़͢Δ͜ͱΛ໨ࢦ͠ɼൃ࿩ͷҧ͍ͷৄࡉ͸ୈ 4 ষͷ࿩ऀΫϥε෼ྨͰ෼ྨ͢Δɽ ਤ 3.1 ʹ͍͔ͭ͘ͷ࣮‫ڥ؀‬Ի੠σʔλͷ৴߸೾‫ܗ‬Λࣔ͢ɽ·ͨɼද 3.1 ʹͦΕͧΕͷ৴ ߸೾‫ܗ‬ͷิ଍Λࣔ͢ɽType A ͕ཧ૝ʹ͍ۙࠎ఻ಋϚΠΫϩϗϯͷԻ੠೾‫͋Ͱܗ‬Δɽ͜ͷ Α͏ͳԻ੠σʔλ͸શମͷ 4 ׂఔ౓Ͱ͋ΔɽType B ͸ࠎ఻ಋϚΠΫϩϗϯΛ૷ண͠ͳ ͔ͬͨ৔߹ͰɼԻ੠ͷύϫʔ͸ඇৗʹখ͍͞ɽ·ͨɼType C ͷΑ͏ʹࠎ఻ಋϚΠΫϩϗ ϯͷ૷ண͕ෆे෼ͳέʔε΍ɼType D ͷΑ͏ʹ IC ϨίʔμͷϚΠΫϩϑΥϯʹΑͬͯ ࿥Իͨ͠έʔε΋͋Γɼͦͷ৔߹ɼ༨‫ࡶͳܭ‬ԻΛଟ͘रͬͯ͠·͍ͬͯΔɽ͜ΕΒͷ૷ண ঢ়ଶ͸ɼै‫ۀ‬һ΍೔ʹΑͬͯҟͳΔ͚ͩͰͳ͘ɼ࣌ؒଳʹΑͬͯ΋มԽ͢Δ৔߹͕͋Δɽ ͦ͜Ͱɼ࿥Իঢ়ଶΛ൑ผ্ͨ͠Ͱͷ VAD ॲཧ͕ඞཁͱͳΔɽ. 3.2 ൃ࿩۠ؒ‫ݕ‬ग़ͷྲྀΕ ຊ࿦จͷ VAD ͷॲཧͷྲྀΕ͸ҎԼͷΑ͏ʹͳΔɽ. 1. ఆৗࡶԻআ‫ڈ‬. 10.

(15)   

(16) 

(17) 

(18)   .   

(19) 

(20) 

(21)    .   

(22) 

(23) 

(24)    

(25)  .  

(26)  

(27)   

(28)  . ਤ 3.1. Ի੠σʔλͷ೾‫ྫܗ‬ɽ. ද 3.1. Ի੠σʔλͷ೾‫ྫܗ‬ɽ. Ի࣭. ϚΠΫϩϗϯͷঢ়ଶ. Type A. ࠎ఻ಋԻ. ࠎ఻ಋϚΠΫϩϗϯΛਖ਼͘͠૷ணͨ͠ঢ়ଶ. Type B. ࠎ఻ಋԻ. ࠎ఻ಋϚΠΫϩϗϯΛʢࣖʹʣ૷ண͍ͯ͠ͳ͍৔߹. Type C. ۭ‫఻ؾ‬ಋԻͱࠎ఻ಋԻͷࠞ߹. ࠎ఻ಋϚΠΫϩϗϯͷ૷ண͕ෆे෼ͳ৔߹. Type D. ۭ‫఻ؾ‬ಋԻ. IC ϨίʔμͰ௚઀࿥Իͨ͠৔߹. 2. ಛ௃நग़ 3. ಛ௃ྔਖ਼‫ن‬Խ 4. ൃ࿩ʗඇൃ࿩൑ఆ 5. ϋϯάΦʔόॲཧ. (1) ఆৗࡶԻআ‫ڈ‬ ࡶԻʹΑΔ‫ݕ‬ग़ਫ਼౓ͷ௿ԼΛ཈͑ΔͨΊɼೖྗ৴߸ʹରͯ͠ RSFʢRunning Spectrum. Filteringʣ[32] Λద༻͠ɼՃ๏ੑͷఆৗࡶԻͷআ‫ڈ‬Λߦ͏ɽRSF ͱ͸ɼSSʢSpectrum Subtractionʣ๏ͷҰछͰ͋ΓɼεϖΫτϧΛ࣌ؒํ޲ʹฒ΂ͨϥϯχϯάεϖΫτϧ্ ʹ͓͚ΔࡶԻআ‫ڈ‬ख๏Ͱ͋Δɽೖྗ৴߸Λ୹࣌ؒϑʔϦΤม‫ٻ͠׵‬ΊͨεϖΫτϧΛ࣌ؒ ํ޲ʹฒ΂ͨ 3 ࣍‫ݩ‬ͷϥϯχϯάεϖΫτϧΛ Y (ω, t) ͱ͢Δɽω ͸प೾਺ binɼt ͸֤ε ϖΫτϧͷ࣌ࠁΛද͢ɽ໨తͷೖྗ৴߸ʢൃ࿩ʣʹࡶԻ͕Ճ๏తʹॏ৞͍ͯ͠ΔͱԾఆ͢ ɼ Δͱɼೖྗ৴߸ Y (ω, t) ͸ࣜ (3.1) ͷΑ͏ʹද͞ΕΔɽS(ω, t) ͸໨తͷೖྗ৴߸ʢൃ࿩ʣ. N (ω, t) ͸ࡶԻͷϥϯχϯάεϖΫτϧͰ͋Δɽ Y (ω, t) = S(ω, t) + N (ω, t) 11. (3.1).

(29) ϥϯχϯάεϖΫτϧΛ࣌ؒํ޲ʹΈΔͱɼఆৗతͳࡶԻ͸؇΍͔ʹมԽ͠ɼൃ࿩΍ඇ ఆৗͳࡶԻ͸ܹ͘͠มԽ͢Δɽͭ·ΓɼY (ω, t) ʹରͯ͠ɼͱͯ΋௿͍ΧοτΦϑप೾਺ Λ࣋ͭϋΠύεϑΟϧλΛ࣌ؒํ޲ʹ͔͚Δ͜ͱͰɼఆৗతͳࡶԻΛআ͘͜ͱ͕Ͱ͖Δɽ ͜ͷϋΠύεϑΟϧλΛ RSF ͱ‫Ϳݺ‬ɽRSF ͸Ұൠతͳ SS ๏ͱൺֱͯ͠ɼࡶԻεϖΫτ ϧͷਪఆΛඞཁͱ͠ͳ͍͜ͱ͕ར఺Ͱ͋Δɽ. (2) ಛ௃நग़ ࣍ʹɼϑϨʔϜ୯ҐͰಛ௃ྔΛநग़͢Δɽຊ‫Ͱڀݚ‬͸ɼεϖΫτϧͷ௿प೾੒෼ͷύ ɼεϖΫτϧͷഒԻ੒෼ͷύϫʔ஋ʢHarmonic PowerʣɼεϖΫτ ϫʔ஋ʢLow Powerʣ ɼ࿪౓ʢskewnessʣΛநग़͢Δɽ ϧͷઑ౓ʢkurtosisʣ ൃ࿩۠ؒͷԻ੠৴߸ͷಛ௃ͷ 1 ͭͱͯ͠ɼεϖΫτϧͷ௿प೾੒෼ʹଟ͘ͷύϫʔ͕ू த͢Δɽͦ͜Ͱɼ௿प೾੒෼ͷΈநग़͢ΔόϯυύεϑΟϧλʔΛ͔͚ͯग़ྗΛੵ෼͢Δ ͜ͱͰɼ௿प೾੒෼ͷύϫʔ஋Λ‫ٻ‬ΊΔɽόϯυύεϑΟϧλʔ͸ෳ਺ͷόϯυ෯Λ࣋ͨ ͤɼෳ਺ͷύϫʔ஋Λࢉग़͢Δɽຊ࣮‫ݧ‬ͷόϯυύεϑΟϧλʔ͸ɼԻ੠ೝࣝͰΑ͘༻͍ ΒΕΔಛ௃ྔͷҰͭͰ͋Δ MFCC(Mel-frequency cepstrum coefficient) Ͱ࢖༻͞ΕΔό ϯυύεϑΟϧλʔΛ࢖༻ͨ͠ɽ ൃ࿩۠ؒʹදΕΔ΋͏ 1 ͭͷಛ௃ͱͯ͠ɼεϖΫτϧͷௐ೾ߏ଄͕‫͛ڍ‬ΒΕΔɽௐ೾ߏ ଄ͱ͸ɼԻ੠৴߸ͷ‫ج‬ຊप೾਺ͱͦͷ੔਺ഒͷप೾਺ʢഒԻʣʹ‫͍ڧ‬ύϫʔ͕දΕΔεϖ Ϋτϧߏ଄Ͱ͋Γɼൃ࿩΍ָ‫ث‬ԻʹΑ͘‫ݟ‬ΒΕΔɽ͋Δ࣌ࠁ tɼप೾਺ ω ͷഒԻ੒෼ͷύ ϫʔ஋ f (ω, t) ΛɼύϫʔεϖΫτϧ Y (ω, t) ͱͦͷഒԻʢK ഒԻʣ·Ͱͷύϫʔͷฏ‫ۉ‬ ɽഒԻ੒෼Λ‫ͨ͠ʹݩ‬ಛ௃ྔ H(t) ͱͯ͠ɼf (ω, t) ͷ࠷େ஋͔Β ஋ͱఆٛ͢Δʢࣜ (3.2)ʣ ฏ‫ۉ‬ΛҾ͘͜ͱͰഒԻ੒෼ͷಥग़౓Λ‫ٻ‬ΊΔʢࣜ (3.3)ʣɽඇԻ੠۠ؒͰ͸ഒԻ੒෼͕ಥग़ ͠ͳ͍ͨΊɼH(t) ͕૬ରతʹ௿͘ͳΔɽω0 ͸ൃ࿩ͷ‫ج‬ຊप೾਺ͷऔΓ͏Δ஋ͷ্‫ݶ‬Λઃ ఆ͢Δɽ࣮‫Ͱݧ‬͸ K = 3ɼω0 ͸ 500Hz ʹ૬౰͢Δप೾਺ bin ͱͨ͠ɽ K 1  Y (kω, t) f (ω, t) = K. (3.2). k=1. H(t) = max{f (ω, t), ω = 1, 2, · · · , ω0 } −. Kω 1 0 f (ω) Kω0 ω=1. (3.3). εϖΫτϧॏ৺ [33] ΍εϖΫτϧͷઑ౓ɼ࿪౓ͳͲͷߴ࣍‫ݩ‬ಛ௃ྔ͸ɼൃ࿩ͷύϫʔ͕ ‫ݮ‬ਰ͢Δ৔߹Ͱ΋ൃ࿩Λ‫ݕ‬ग़͢Δ͜ͱ͕ՄೳͰ͋Δ͕ɼύϫʔͷ‫ࡶ͍ڧ‬Իʹऑ͍ɽ·ͨɼ ࠎ఻ಋϚΠΫϩϗϯͷप೾਺ಛੑ͔Βɼۭ‫఻ؾ‬ಋԻͷԻ੠σʔλͱൺֱ͢Δͱਫ਼౓͕མͪ Δɽࣜ (3.4) ʹεϖΫτϧॏ৺ͷ‫ࣜࢉܭ‬Λࣔ͢ɽ. K Ct =. k=1. K. Mt [k] ∗ k. k=1. 12. Mt [k]. (3.4).

(30) ͜͜ͰɼMt [k] ͸ t ൪໨ͷϑϨʔϜΛϑʔϦΤม‫ͯ͠׵‬ಘΒΕΔεϖΫτϧͷɼk ൪໨ ͷप೾਺Ϗϯͷৼ෯஋Ͱ͋ΔɽεϖΫτϧॏ৺ͷ஋ Ct ͕େ͖͍΄Ͳߴप೾੒෼Λ‫ؚ‬Ήͨ ΊɼԻ৭͸໌Δ͘ͳΔɽࠎ఻ಋԻͷ৔߹ɼ௿प೾੒෼ͷύϫʔ͕શମతʹ‫͘ڧ‬ɼॏ৺ͷ஋ ΋௿͘ͳΓ΍͍͢ɽൃ࿩۠ؒʹ͓͍ͯ͸ɼ஋͕͞Βʹ௿͘ͳΔɽ. (3) ಛ௃ྔਖ਼‫ن‬Խ Ի੠σʔλͷൃ࿩ύϫʔ͸ɼ଺ࡏ৔ॴ΍ࠎ఻ಋϚΠΫϩϗϯͷ૷ணঢ়ଶʹΑͬͯมԽ͢ Δ৔߹͕͋Δɽൃ࿩ύϫʔ͕ҟͳΔͱಛ௃ྔͷ஋΋มԽ͢Δɽ࣍ͷൃ࿩ɾඇൃ࿩ͷ‫ݕ‬ग़ॲ ཧͰ͸‫ݻ‬ఆ͞Ε͖͍ͨ͠஋Λ࢖͏ͨΊɼͦͷ··Ͱ͸‫ݕޡ‬ग़͕ଟ͘ͳΔɽͦ͜Ͱɼಛ௃ྔ ͷ֤࣍‫ʹݩ‬ରͯ͠ਖ਼‫ن‬ԽΛߦ͏ɽਤ 3.2 ͷΑ͏ʹɼԻ੠σʔλΛҰఆ۠ؒ͝ͱʹ෼ׂ͠ɼ ͋Δ۠ؒʢt0 ʙt1 ʣͷਖ਼‫ن‬Խʹ͸ͦͷલ‫ޙ‬ͷ۠ؒʢt−1 ʙt0 ͱ t1 ʙt2 ʣ΋‫ؚ‬Ίͯਖ਼‫ن‬ԽΛ͢ Δɽ͜ͷ 3 ۠ؒͷதʹ‫·ؚ‬ΕΔൃ࿩͕গͳ͍ͱɼਖ਼‫ن‬Խ͸ VAD ʹѱӨ‫ڹ‬Λ‫͢΅ٴ‬ɽҰ ํɼ1 ۠ؒΛ௕͘͢Δͱɼ‫ڥ؀‬ͷมԽʹରԠ͠ʹ͘͘ͳΔͨΊɼ1 ۠ؒͷ௕͞͸ద੾ʹઃ ఆ͢Δඞཁ͕͋Δɽ࣮‫Ͱݧ‬͸֤۠ؒͷ௕͞Λ 10 ෼ͱ͠ɼલ‫ ޙ‬10 ෼΋‫ؚ‬Ίͨ 30 ෼ؒͰਖ਼ ‫ن‬Խͨ͠ɽ. .  ਤ 3.2. . . . ಛ௃ྔͷਖ਼‫ن‬Խൣғɽ. (4) ᮢ஋ॲཧʹΑΔ൑ผ ਖ਼‫ن‬Խ͞Εͨಛ௃ྔʹᮢ஋ॲཧΛࢪ͢લʹɼ࣌ؒํ޲ʹಛ௃ྔͷฏ‫׈‬ԽΛߦ͏ɽൃ࿩۠ ؒͰ͋ͬͯ΋ɼແ੠Ի΍ϙʔζͷΑ͏ʹɼ୹࣌ؒͰ͸ൃ࿩ͷಛ௃͕දΕͳ͍৔߹΋͋Δͨ Ίɼ͋ΔϑϨʔϜʹରͯ͠લ‫਺ޙ‬ϑϨʔϜͷಛ௃ྔͷ஋ͷฏ‫ۉ‬ΛͱΔ͜ͱͰฏ‫׈‬Խ͢Δɽ ࣮‫Ͱݧ‬͸લ‫ ޙ‬5 ϑϨʔϜʢ߹‫ ܭ‬11 ϑϨʔϜʣͰฏ‫׈‬Խͨ͠ɽ ଓ͍ͯɼಛ௃ྔͷᮢ஋ॲཧʹΑ֤ͬͯϑϨʔϜ͕ൃ࿩ɾඇൃ࿩͔Λ൑ผ͢Δɽ͜ͷ࣌ͷ ᮢ஋͸ɼࣄલʹগྔͷσʔλΛ༻͍ͯ࠷΋ൃ࿩ɾඇൃ࿩ΛΑ͘෼͚Δ஋Λಛ௃ྔ͝ͱʹܾ ఆ͓ͯ͘͠ɽ. 13.

(31) (5) ϋϯάΦʔόॲཧ VAD ͸୹࣌ؒͷϑϨʔϜͰ‫ݟ‬Ε͹‫ݕޡ‬ग़΋গͳ͘ͳ͍ɽඇఆৗࡶԻ͸ॏ৞ͨ͠··ॲ ཧ͞Ε͍ͯΔͨΊɼඇൃ࿩Λൃ࿩ͱ‫ݕޡ‬ग़ͯ͠͠·͏Մೳੑ͕͋Δɽ·ͨɼൃ࿩ʹ΋ൃ࿩ தͷϙʔζ΍ແ੠ԻͳͲɼൃ࿩ͱೝࣝ͞ΕΔ΂͖͕ͩൃ࿩ͷಛ௃͕‫ݱ‬Εͳ͍ϑϨʔϜ΋ଘ ࡏ͠ɼൃ࿩Λඇൃ࿩ͱ‫غޡ‬٫ͯ͠͠·͏͜ͱ΋͋Δɽൃ࿩ɼඇൃ࿩ͱ΋ʹ࿈ଓੑ͕͋Δ͜ ͱΛߟྀ͠ɼൃ࿩ϑϨʔϜ‫·ؚʹ܈‬ΕΔಥൃతͳඇൃ࿩ϑϨʔϜͱɼඇൃ࿩ϑϨʔϜ‫ʹ܈‬ ‫·ؚ‬ΕΔಥൃతͳൃ࿩ϑϨʔϜΛআ‫͢ڈ‬Δɽ͜ΕΛϋϯάΦʔόॲཧͱ͍͍͏ɽ࣮‫Ͱݧ‬ ͸ɼ10 ϑϨʔϜҎ಺ͷ࿈ଓ͢Δඇൃ࿩Λൃ࿩ʹஔ͖‫Ͱޙͨ͑׵‬ɼ15 ϑϨʔϜҎ಺ͷ࿈ଓ ͢Δൃ࿩Λඇൃ࿩ʹஔ͖‫͑׵‬Δɽ. 3.3 ࣮‫ݧ‬ ࣮‫ʹݧ‬͸ɼϨετϥϯͰ‫ܭ‬ଌ͞ΕͨԻ੠σʔλͷ͏ͪɼ࿩ऀ 10 ໊෼ɼ‫ ܭ‬70 ࣌ؒΛ࢖༻ ͨ͠ɽࡶԻ͸‫ܭ‬ଌͷ࣌ؒଳʹΑ༷ͬͯʑͰ͋Γɼ࠷΋ΫϦʔϯʹ͍ۙ‫Ͱڥ؀‬͸ 15ʙ10dBɼ ‫ސ‬٬ͷଟ͍࣌ؒଳͰ͸ 5ʙ-5dB Ͱ͋Δɽൃ࿩಺༰͸ɼ઀٬ɼै‫ۀ‬һͱͷ΍ΓͱΓɼࡶஊ ͳͲࣗ༝ൃ࿩Ͱ͋Δɽ࿥Ի‫ࣜܗ‬͸ MP3 ‫ࣜܗ‬ɼ256kbps Ͱ͋ΔͨΊɼWAV ‫ࣜܗ‬ʢϏοτ Ϩʔτ 16bitɼαϯϓϦϯάϨʔτ 16kHzʣʹม‫͍ͯ͠׵‬ΔɽϑϨʔϜαΠζ‫ͼٴ‬γϑτ ௕͸ͦΕͧΕ 25msɼ10ms Ͱ͋ΔɽύϫʔεϖΫτϧࢉग़ͷࡍʹɼϋϛϯά૭ʹΑΔ૭ ֻ͚ΛߦͬͨɽධՁई౓͸ϑϨʔϜ୯Ґͷࣝผ݁Ռͷ FARʢFalse Acceptance Rateʣͱ. FRRʢFalse Rejection Rateʣͷௐ࿨ฏ‫ͨ͠ͱۉ‬ɽ ද 3.2 ʹɼಛ௃ྔผͷࣝผ݁ՌΛࣔ͢ɽεϖΫτϧͷ௿प೾੒෼ͷύϫʔ஋ʢLow. PowerʣɼεϖΫτϧͷഒԻ੒෼ͷύϫʔ஋ʢHarmonic PowerʣɼεϖΫτϧͷઑ౓ ʢkurtosisʣɼ࿪౓ʢskewnessʣͷ 4 ͭʹ͍ͭͯੑೳΛൺֱͨ͠ɽ࣮‫ݧ‬ͷ݁ՌɼLow Power ͕࠷΋ྑ͍݁ՌͱͳΓɼͦͷͱ͖ͷप೾਺ൣғ͸ 190Hzʙ431Hz Ͱ͋ͬͨɽଞͷ 3 छྨ ͷಛ௃ྔ΋ Low Power ʹ͍ۙਫ਼౓ͱͳͬͨɽࣝผख๏ͷൺֱͱͯ͜͠ΕΒͷಛ௃ྔ͔Β ࠞ߹ਖ਼‫ن‬෼෍ϞσϧʢGMMʣΛֶशࣝ͠ผΛߦ͕ͬͨɼԻ੠৴߸ͷ‫ڥ؀‬ͷมԽ͕ܹ͍͠ ͨΊେྔͷֶशσʔλΛඞཁͱ͢Δ্ɼද 3.2 ʹඖఢ͢Δਫ਼౓͕ಘΒΕͳ͔ͬͨɽ ද 3.2. 4 छྨͷಛ௃ྔ͝ͱͷ VAD ੑೳൺֱɽ. Feature. FAR[%]. FRR[%]. ௐ࿨ฏ‫[ ۉ‬%]. Low Power. 5.8. 11.5. 8.7. Harmonic Power. 7.1. 12.8. 9.9. Kurtosis. 8.8. 16.9. 13.3. Skewness. 13.2. 11.8. 12.5. 14.

(32) 3.4 ߟ࡯ ಛ௃ྔ͸௿प೾੒෼ͷύϫʔɼಛʹൃ࿩ͷ‫ج‬ຊप೾਺ଳҬͷύϫʔ͕࠷΋ྑ͍݁Ռͱ ͳͬͨɽ·ͨɼௐ೾੒෼ͷಛ௃ྔ΋΄΅ಉ౳ͷੑೳΛಘͨɽඇൃ࿩Λൃ࿩ͱ‫ޡ‬डཧͨ͠ྫ ͷଟ͘͸ɼস͍੠ɼ֏ɼ͋Δ͍͸໨త࿩ऀʢϚΠΫ૷ணऀʣҎ֎ͷൃ࿩Λ‫ݕ‬ग़͍ͯͨ͠ɽ ຊख๏Ͱ͸ൃ࿩ͷҰൠతͳಛ௃Λநग़͍ͯ͠ΔͨΊɼ໨త࿩ऀͷൃ࿩ͱͷ۠ผ͸࿩ऀࣝผ ͳͲผͷख๏͕ඞཁͱߟ͑ΒΕΔɽҰํɼൃ࿩Λඇൃ࿩ͱ‫غޡ‬٫ͨ͠৔߹͸ɼൃ࿩ͷதͰ ΋খ੠Ͱ͋Δ͔ɼൃ࿩ͷ։࢝ɾऴ͕ྃແԻʹ͍ۙͳͲ෦෼తʹ‫ޡ‬Δ܏޲͕ଟ͘ɼ͋Δఔ౓ ͷ௕͞Λ࣋ͭൃ࿩Λશͯ‫غޡ‬٫͢Δྫ͸‫ݟ‬ΒΕͳ͔ͬͨɽಡΈ্͛λεΫͷΑ͏ʹ͸͖ͬ Γͱൃ࿩͢Δ৔߹΋͋Ε͹ɼྲྀெ͔ͭࣗવʹൃ࿩͢Δ৔߹΋͋Δɽಛʹɼ‫ऀޙ‬͸ൃ࿩ͷ։ ࢝ɾऴྃ࣌ͷύϫʔ͕େ͖͘‫ݮ‬ਰ͢Δ܏޲ʹ͋Δ. VAD ͷ݁ՌΛԻ੠ೝࣝʹ༻͍Δ৔߹͸਺ेʙ਺ඦϛϦඵ୯ҐͰͷਫ਼౓͕๬·ΕΔɽҰ ํɼൃ࿩ͷ༗ແ΍ճ਺ɼ࣌ࠁͳͲΛ‫ٻ‬ΊΔ৔߹͸ɼVAD ͷਫ਼౓͕ඵ୯ҐͰ͋ͬͯ΋े෼ ʹ࢖༻Ͱ͖Δͱߟ͑ΒΕΔɽલऀͱ‫Ͱऀޙ‬͸ॲཧ࣌ؒʹେ͖ͳ͕ࠩͰͯ͘Δɽൃ࿩ͷස౓ ͕গͳ͍۠ؒ͸‫ۀ‬຿ʹؔ͢Δ৘ใྔ΋গͳ͍ͨΊɼ‫ۀ‬຿෼ੳͷର৅֎ͱ͢Δɽ͢ͳΘͪɼ େ‫ہ‬తͳ VAD ʹΑΓɼશମͷ౷‫ͱྔܭ‬ΑΓৄࡉͳ෼ੳ͕‫ٻ‬ΊΒΕΔ۠ؒͷ‫ݕ‬ग़Λߦ͍ɼ ଓ͍ͯͦͷ۠ؒʹண໨ͨ͠ߴਫ਼౓ͳ VAD Λߦ͏ͱ͍ͬͨɼൃ࿩۠ؒͷ࢖͍෼͚͕ॏཁͱ ͳΔɽ. 15.

(33) ୈ4ষ. ࿩ऀΫϥε෼ྨ ຊষͰ͸ɼୈ 3 ষͰ෼཭ͨ͠ൃ࿩۠ؒʹରͯ͠ߦ͏࿩ऀΫϥε෼ྨʹ͍ͭͯઆ໌͢Δɽ ࿩ऀΫϥε෼ྨͱ͸ɼൃ࿩͕ͲͷΫϥεʹଐ͢Δ࿩ऀ͔Λ෼ྨ͢Δ͜ͱͰ͋Δɽ͜͜Ͱ͍ ͏࿩ऀͱ͸ɼϨετϥϯͷै‫ۀ‬һʢϚΠΫ૷ணऀɼͦΕҎ֎ͷै‫ۀ‬һʣɼ‫ސ‬٬Λࢦ͢ɽ࿩ ऀ͕෼͔Δ͜ͱͰɼϚΠΫΛ૷ணͨ͠ै‫ۀ‬һ͕୭ͱձ࿩Λ͠ɼ͓͓ΑͦͲͷΑ͏ͳ࡞‫ۀ‬Λ ߦ͍ͬͯΔ͔ਪଌ͕ՄೳͱͳΔɽਪఆ͞Εͨ࿩ऀ৘ใ͸ୈ 5 ষͷ࡞‫಺ۀ‬༰ਪఆͷಛ௃ྔʹ ༻͍ΒΕΔɽ. 4.1 ࿩ऀΫϥε෼ྨͷ֓ཁ ൃ࿩۠ؒ‫ݕ‬ग़Ͱ͸ɼൃ࿩ʹ‫ڞ‬௨ͯ͠ΈΒΕΔಛ௃Λ‫ʹݩ‬ɼൃ࿩ͱඇൃ࿩ͷ෼ྨΛߦͬ ͨɽൃ࿩۠ؒͷଟ͘͸ϚΠΫΛ૷ணͨ͠ै‫ۀ‬һͷ‫ۀ‬຿ʹؔ͢Δൃ࿩͕ͩɼ༷ʑͳछྨͷൃ ࿩͕‫ݟ‬ΒΕΔɽྫ͑͹ɼѫࡰɼ઀٬ձ࿩ɼ‫ۀ‬຿ձ࿩ɼࡶஊͳͲ͕‫͛ڍ‬ΒΕΔɽ͜ΕΒ͸ɼ ੠ͷύϫʔɼτʔϯɼ࿩଎ͳͲ͕ҟͳΔɽ·ͨɼϚΠΫΛ૷ணͨ͠ै‫ۀ‬һҎ֎ͷ࿩ऀͷൃ ࿩΋‫·ؚ‬ΕΔɽ͜ΕΒ͸ɼϚΠΫΛ૷ணͨ͠ै‫ۀ‬һͷൃ࿩ΑΓ΋ύϫʔ͕খ͘͞ɼͱΓΘ ͚ɼ௿प೾੒෼ͷύϫʔ͕খ͍͞܏޲ʹ͋Δɽ ͢ͳΘͪɼൃ࿩Λ͍͔ͭ͘ͷಛ௃ʹ͕ͨͬͯ͠෼ྨ͢ΔλεΫ͕ߟ͑ΒΕΔɽ΋͠ɼલ ड़ͷΑ͏ͳɼൃ࿩ͷҙਤ΍໨త্ͷ෼ྨ͕Ͱ͖Ε͹ɼͦͷै‫ۀ‬һͷঢ়‫گ‬΍࡞‫಺ۀ‬༰Λਪଌ ͢Δख͕͔ΓͱͳΔɽ·ͨɼϚΠΫΛ૷ணͨ͠ै‫ۀ‬һҎ֎ͷൃ࿩Λ‫ݕ‬ग़͢Δ͜ͱͰɼ઀٬ ࡞‫ͳۀ‬ͷ͔ɼඇ઀٬࡞‫ͳۀ‬ͷ͔Λ෼ผ͢Δ͜ͱ΋ՄೳͱͳΔɽ ࿩ऀΫϥε෼ྨʹྨࣅٕͨ͠ज़ͱͯ͠ɼ࿩ऀࣝผ͕͋Δɽ͜Ε͸ɼൃ࿩ͷ࿩ऀΛಛఆ ͢Δ΋ͷͰ͋Δɽ୅දతͳख๏ͱͯ͠ɼ֤࿩ऀͷԻ‫ڹ‬ಛ௃ྔ͔ΒΨ΢εࠞ߹෼෍Ϟσϧ ʢGMMʀGaussian Mixture Modelʣ΍αϙʔτϕΫλʔϚγϯʢSVMʀSupport Vector. MachineʣΛֶशͯࣝ͠ผʹ༻͍Δ΋ͷ͕͋Δ [34][35][36]ɽۙ೥͸ DNNʢDeep Neural Networkʣ΋࿩ऀࣝผʹऔΓೖΕΒΕ͍ͯΔ [37]ɽಛ௃ྔʹ͸ɼϝϧप೾਺έϓετϥ Ϝ܎਺ʢMFCCʀMel-Frequency Cepstrum CoefficientʣͱԻ੠৴߸ͷର਺ύϫʔ [38]ɼ. i-vector[39] ͳͲ͕࠾༻͞Ε͍ͯΔɽ 16.

(34) +,-.  

(35)   5673  . !"#$. 1234 %&'()* /00. ਤ 4.1. MFCC நग़ͷྲྀΕɽ. ຊ‫ڀݚ‬ͷൃ࿩Ϋϥε෼ྨͰ͸ɼൃ࿩۠ؒΛʮϚΠΫ૷ணऀʯʮଞͷै‫ۀ‬һʯʮ‫ސ‬٬ʯͷ 3 ͭͷΫϥεʹ෼͚ΔɽʮϚΠΫ૷ணऀʯ͸ಛఆͷ࿩ऀͰ͋Δ͕ɼʮଞͷै‫ۀ‬һʯͱʮ‫ސ‬٬ʯ ͸ෳ਺ͷෆಛఆ࿩ऀΛର৅ͱ͢Δɽಛఆ࿩ऀͱෆಛఆ࿩ऀͷ྆ํͷൃ࿩Λѻ͏ͱ͍͏఺͸ ຊ‫ڀݚ‬ͷಛ৭Ͱ͋Δɽຊ‫Ͱڀݚ‬͸ɼಛ௃ྔͱͯ͠ MFCCɼࣝผ‫ ͯ͠ͱث‬SVM ͱ DNN Λ ༻͍Δɽ. 4.2 ಛ௃ྔ 4.2.1 ϝϧप೾਺έϓετϥϜ܎਺ʢMFCCʣ MFCC ͱ͸ɽεϖΫτϧ͔Β੠ಓͷԻ‫ڹ‬ಛੑʢ‫ߢޱ‬ͷ‫ܗ‬ʣ΍ϐον੒෼Λ෼཭ͨ͠έ ϓετϥϜΛɼώτͷௌ্֮ॏཁͳϝϧप೾਺ଳҬʹࣸ૾͠ɼ࣍‫ݩ‬ѹॖͨ͠΋ͷͰ͋Δɽ ಛʹɼMFCC ͷ௿࣍‫ݩ‬੒෼͸ɼԻ੠ೝࣝʹ͓͚ΔԻૉͷࣝผʹ༻͍ΒΕΔ୅දతͳಛ௃ ྔͰ͋ΔɽԻ੠৴߸͔Β MFCC Λநग़͢ΔྲྀΕΛਤ 4.1 ʹࣔ͢ɽ. (1) ϓϦΤϯϑΝγεॲཧ ͸͡ΊʹɼԻ੠৴߸͔Βप೾਺ղੳ͢ΔલʹϓϦΤϯϑΝγεॲཧΛߦ͏ɽԻ੠৴߸ ͸ɼ૬ରతʹΈͯ௿प೾੒෼͕େ͖͘ɼߴप೾ʹͳΔʹͭΕͯ࣍ୈʹৼ෯εϖΫτϧ͕খ ͘͞ͳΔಛ௃͕͋Δɽ͜Ε͸प೾਺ͷภΓͰ͋ΓɼέϓετϥϜ෼ੳʹӨ‫ڹ‬Λ‫ͨ͢΅ٴ‬ Ίɼࣜ (4.1) ͷϋΠύεϑΟϧλΛద༻͠ɼߴप೾੒෼ͷৼ෯Λ‫ڧ‬ௐ͢Δɽ. x(t) = y(t) − py(t − 1). (4.1). y(t) ͸Ի੠৴߸ͷαϯϓϧ tʢ࣌ࠁ t ʹ૬౰ʣͷৼ෯஋Ͱɼx(t) ͸ϓϦΤϯϑΝγε‫ޙ‬ ͷԻ੠৴߸Ͱ͋Δɽp ͸ϓϦΤϯϑΝγε܎਺ͰɼԻ੠ೝࣝͰ͸ 0.97 ͕࢖ΘΕΔɽ1 α. 17.

(36) ϯϓϧલͷ஋ʹରͯ͠େ͖͘஋͕มԽͨ͠৔߹ʢ͢ͳΘͪߴप೾੒෼ʣ͸ͦͷ஋͕อଘ ͞Εɼ஋ͷมԽ͕খ͔ͬͨ͞৔߹ʢ௿प೾੒෼ʣ͸‫͡ݮ‬ΒΕΔɽຊ࣮‫ݧ‬΋ಉ༷ʹϓϦΤϯ ϑΝγε܎਺Λ 0.97 ʹઃఆͨ͠ɽ. (2) ϑϨʔϜԽɾ૭ֻ͚ Ի੠৴߸Λप೾਺ղੳ͢Δͱ͖ɼ৴߸Λ୹࣌ؒͷϑϨʔϜʹ੾Γ෼͚ͯ෼ੳ͢Δɽ͜ ΕΛϑϨʔϜԽͱ͍͏ɽԻ੠৴߸ͷ֤ϑϨʔϜ͸೾‫ܗ‬ͷ࢝୺ͱऴ୺͕ෆ࿈ଓʹ్੾Εͯ ͓ΓɼϑʔϦΤม‫͢׵‬Δࡍʹෆ౎߹͕ੜ͡Δɽ͜ͷӨ‫ڹ‬Λͳͨ͘͢Ίɼࣜ (4.2) ͷ૭ؔ਺. w(t) Λ੾Γग़ͨ͠ೖྗ৴߸ʹΛద༻͠ʢࣜ (4.3)ʣɼ࢝୺ͱऴ୺ͷαϯϓϧ஋Λ 0 ʹ͚ۙͮ Δɽ͜ΕΛ૭ֻ͚ͱ͍͏ɽ. 2πt , (t : 0, 1, · · · , N − 1) N −1 x (t) = w(t)x(t). w(t) = 0.54 − 0.46 cos. (4.2) (4.3). N ͸ϑϨʔϜ௕ʢαϯϓϧʣɼx(t) ͸ϑϨʔϜԽͨ͠Ի੠৴߸ɼx (t) ͸૭ֻ‫ޙ‬ͷϑϨʔ ϜͰ͋Δɽ࿈ଓͨ͠εϖΫτϧͷมԽΛଊ͑ΔͨΊɼϑϨʔϜԽͱ૭ֻ͚ॲཧ͸Ұఆαϯ ϓϧͣͭͣΒͯ͠ߦ͏ɽ͜ͷͣΒ͠෯ΛϑϨʔϜγϑτͱ͍͏ɽຊ࣮‫Ͱݧ‬͸ɼϑϨʔϜ௕ Λ 25msecɼϑϨʔϜγϑτΛ 10msec ͱͨ͠ɽ. (3) ཭ࢄϑʔϦΤม‫׵‬ Ի੠৴߸ͷ֤ϑϨʔϜ͸཭ࢄϑʔϦΤม‫ʹ׵‬Αͬͯप೾਺ྖҬͰͷεϖΫτϧ৘ใʹม ‫͞׵‬ΕΔɽ཭ࢄϑʔϦΤม‫׵‬͸ࣜ (4.4) Ͱද͞ΕΔɽ. X(ω) =. N −1 . x(t)e−j. 2πωt N. (4.4). t=0. ω ͸प೾਺ binɼX(ω) ͸ෳૉεϖΫτϧͰ͋ΔɽෳૉεϖΫτϧͷ֤प೾਺ bin ͷઈ ର஋Λͱͬͨ΋ͷΛৼ෯εϖΫτϧͱ‫Ϳݺ‬ɽৼ෯εϖΫτϧ͸ɼ֤प೾਺ bin ʹ૬౰͢Δ प೾਺ͷԻ੠৴߸ͷ‫͞ڧ‬ʢύϫʔʣΛද͢ɽ֤प೾਺ bin ͷର਺ΛͱΕ͹ɼώτͷௌ֮ʹ ߹ͬͨύϫʔʹม‫͞׵‬ΕΔɽ. (4) ϑΟϧλόϯΫ ϑΟϧλόϯΫ͸ɼόϯυύεϑΟϧλͷू߹ମͰ͋Γɼೖྗ৴߸Λಛఆͷ਺ͷଳҬʹ ෼ׂ͢Δɽ֤ଳҬͷεϖΫτϧͷੵ෼Λ‫ٻ‬ΊΔ͜ͱͰɼεϖΫτϧͷ࣍‫਺ݩ‬ΛଳҬͷ਺ͱ ಉ͡ʹѹॖ͢Δ͜ͱ͕Ͱ͖Δɽ͜Ε͸ɼ‫ޙ‬ͷࣝผʹ͓͍ͯ‫ؒ࣌ࢉܭ‬Λ୹ॖͤ͞Δ໾໨Λ࣋ ͭɽϝϧϑΟϧλόϯΫ͸ɼ֤ϑΟϧλͷଳҬΛৼ෯εϖΫτϧͷΑ͏ͳप೾਺ͷ౳ࠩؒ ִͰ͸ͳ͘ɼࣜ (4.5) ͷΑ͏ͳϝϧई౓Λ‫͞ࢉܭʹݩ‬ΕΔɽϝϧई౓ͱ͸ɼप೾਺͕খ͞ ͍ଳҬ΄Ͳप೾਺෼ղೳ͕ྑ͘ɼେ͖͘ʹͳΔʹͭΕͯप೾਺෼ղೳ͕ૈ͘ͳΔई౓Ͱ͋. 18.

(37)  

(38)   . . .  ਤ 4.2. ϝϧϑΟϧλόϯΫͷ֓‫ܗ‬ɽ. Γɼώτͷௌ֮ಛੑʹΑΓ߹கͨ͠΋ͷͰ͋ΔɽMFCC ͷ‫ʹࢉܭ‬͸ɼਤ 4.2 ʹࣔ͢Α͏ ͳࡾ֯૭ͷϝϧϑΟϧλόϯΫ͕༻͍ΒΕΔɽຊ࣮‫Ͱݧ‬͸ɼϝϧϑΟϧλόϯΫͷ਺Λ. 20 ͱͨ͠ɽ M el(f ) = 2595 log10 (1 +. f ) 700. (4.5). (5) ର਺ɾ཭ࢄίαΠϯม‫׵‬ ϝϧϑΟϧλόϯΫʹΑͬͯѹॖ͞ΕͨεϖΫτϧ͸ɼ֤࣍‫ݩ‬ͷର਺Λͱͬͯεέʔϧ Λௐઅ͠ɼ཭ࢄίαΠϯม‫ʹ׵‬ΑͬͯϝϧέϓετϥϜʹม‫͢׵‬ΔɽέϓετϥϜͱ͸ɼ εϖΫτϧͷ‫ܗ‬ঢ়Λද‫ͨ͠ݱ‬΋ͷͰɼέϓετϥϜͷ௿प೾੒෼͕੠ಓಛੑɼߴप೾੒෼ ͕ϐον੒෼ʹ૬౰͢ΔɽϝϧέϓετϥϜ͸ɼέϓετϥϜͷप೾਺࣠Λϝϧई౓ʹࣸ ૾ͨ͠΋ͷͰ͋ΔɽԻ੠ೝࣝͰ͸Ի੠৴߸ͷ੠ಓಛੑΛॏࢹ͢ΔͨΊɼϝϧέϓετϥϜ ͷ௿࣍੒෼ΛऔΓग़ͯ͠ɼԻ‫ڹ‬ಛ௃ྔͱ͢Δɽ͜ΕΛ MFCC ͱ͍͏ɽຊ࣮‫Ͱݧ‬͸ɼϝϧ ϑΟϧλόϯΫʹΑͬͯѹॖ͞Εͨ 20 ࣍‫ݩ‬ͷ͏ͪɼ2 ࣍‫ݩ‬໨͔Β 14 ࣍‫ݩ‬໨ͷ‫ ܭ‬13 ࣍‫ݩ‬ Λ࢖༻͢ΔɽMFCC ͷ 1 ࣍‫ݩ‬໨͸ύϫʔʢ੠ྔʣʹ૬౰͢Δ੒෼ͰɼλεΫʹΑͬͯ͸ ࣝผੑೳΛ௿Լͤ͞Δ͜ͱ͕͋ΔͨΊɼຊ࣮‫Ͱݧ‬͸࢖༻͠ͳ͍ɽ. 4.2.2 ΔMFCC MFCC ͸฼ԻͷΑ͏ͳఆৗతͳԻӆΛΑ͘ද‫͢ݱ‬Δಛ௃ྔͰ͋Δ͕ɼࢠԻ΍൒฼Ի ͷΑ͏ͳಈతͳԻӆΛද‫͢ݱ‬Δʹ͸ෆे෼Ͱ͋Δɽͦ͜ͰɼMFCC ͷಈతಛ௃ྔʢσϧ λύϥϝʔλʣ͕ఏҊ͞Ε͓ͯΓɼԻ੠ೝࣝʹ͸Α͘༻͍ΒΕ͍ͯΔɽ͋ΔϑϨʔϜͷ. MFCC ʹ͍ͭͯɼͦͷલ‫਺ޙ‬ϑϨʔϜʢຊ࣮‫Ͱݧ‬͸ 2ʣͷσʔλʹରͯ͠ɼ໨తม਺ y Λ MFCC ͷ֤࣍‫ݩ‬ͷ஋ɼઆ໌ม਺ x Λ࣌ࠁʢϑϨʔϜ൪߸ʣͱ͠ɼ‫࠷͕ࠩޡ‬খʹͳΔΑ͏ͳ y = ax + b Λଟॏճ‫ؼ‬෼ੳʹΑͬͯ‫ٻ‬Ίɼͦͷ࣌ͷճ‫਺܎ؼ‬ϕΫτϧ a Λ ΔMFCC ͱ 19.

(39) ͢Δɽ·ͨɼΔMFCC ʹରͯ͠ɼಉ༷ʹ‫ٻ‬Ίͨճ‫਺܎ؼ‬ϕΫτϧΛ ΔΔMFCC ͱ͢Δɽ. 4.3 SVMʢSupport Vector Machineʣ SVM ͱ͸ɼ‫͋ࢣڭ‬ΓֶशΛ༻͍ΔύλʔϯೝࣝϞσϧͷҰͭͰ͋ΔɽSVM ͸Χʔω ϧτϦοΫͱ‫ݺ‬͹ΕΔख๏ʹΑͬͯඇઢ‫ܗ‬ͷࣝผؔ਺Λߏ੒Ͱ͖ΔΑ͏ʹ֦ு͞Ε͓ͯ Γɼύλʔϯೝࣝͷଟ͘ͷख๏ͷதͰ΋ೝࣝੑೳͷ༏Ε͍ͯΔֶशϞσϧͰ͋Δͱߟ͑Β Ε͍ͯΔɽSVM ͷ‫ڧ‬Έ͸ɼະֶशσʔλʹରͯ͠ߴ͍ࣝผੑೳΛಘΔͨΊͷ޻෉͕͋Δ ͜ͱͰ͋ΔɽSVM ͸ઢ‫ܗ‬ೖྗૉࢠΛར༻ͯ͠ 2 Ϋϥεͷύλʔϯࣝผ‫ث‬Λߏ੒͢Δख๏ Ͱ͋Δɽ‫܇‬࿅αϯϓϧ͔Βɼ֤σʔλ఺ͱͷ‫࠷͕཭ڑ‬େͱͳΔϚʔδϯ࠷େԽ௒ฏ໘Λ‫ٻ‬ ΊΔͱ͍͏‫ج‬४ʢ௒ฏ໘෼཭ఆཧʣͰઢ‫ܗ‬ೖྗૉࢠͷύϥϝʔλΛֶश͢Δɽ‫ݹ‬యతͳ. SVM ͸ઢ‫ܗ‬෼ྨ‫͕ͨͬ͋Ͱث‬ɼΧʔωϧؔ਺Λ༻͍ͯύλʔϯΛ༗‫ݶ‬΋͘͠͸ແ‫ݩ࣍ݶ‬ ͷಛ௃ۭؒ΁ࣸ૾͠ɼಛ௃্ۭؒͰઢ‫ܗ‬෼཭Λߦ͏ख๏͕ఏҊ͞Εɼඇઢ‫ܗ‬෼ྨ໰୊ʹ΋ ༏ΕͨੑೳΛൃ‫͢ش‬Δ͜ͱ͕ࣔ͞Ε͍ͯΔɽ. 4.3.1 SVM ͷ‫ૅج‬ SVM ͸ɼ߹‫ ܭ‬N ‫ݸ‬ͷ D ࣍‫ݩ‬ϕΫτϧ xi = (xi1 , xi2 , · · · , xiD )T Λࣝผؔ਺ f ʹΑͬ ͯΫϥε AʢCA ʣͱΫϥε BʢCB ʣʹࣝผ͢Δ͜ͱΛߟ͑ͨ৔߹ɼ‫܇‬࿅σʔλʹରͯ͠ ࣜ (4.6) Λຬͨ͢Α͏ʹࣝผؔ਺ f (xi ) ͷύϥϝʔλΛௐ੔͢Δɽ.  f (xi ) =. ≥1 if xi ∈ CA ≤ −1 if xi ∈ CB. (4.6). i = 1, 2, · · · , N Ͱ͋Δɽࣝผؔ਺ f ͸ࣜ (4.7) ͷΑ͏ʹఆٛ͞ΕΔɽ f (x) = wT x + b. (4.7). ͜͜Ͱɼw = (w1 , w2, · · · , wD )T ͸ॏΈϕΫτϧɼb ͸εΧϥʔͰද‫͞ݱ‬ΕΔ͖͍͠஋Ͱ ͋Δɽf ͸Ұൠʹ௒ฏ໘ͱ‫ݺ‬͹ΕΔ‫ڥ‬քͰ͋Γɼະ஌σʔλʹରͯ͠࠷దͳ௒ฏ໘ɼ͢ͳ Θͪ܎਺ w, b Λ‫ٻ‬ΊΔ͜ͱʹͳΔɽ͜ͷ࣌ɼSVM ͸ਤ 4.3 ʹ͋ΔΑ͏ʹɼ֤Ϋϥεͷ. Support Vector ͱ௒ฏ໘ʢਤதͷଠઢʣͱͷ‫཭ڑ‬ʢϚʔδϯʣΛ࠷େԽ͢Δ௒ฏ໘Λਪ ఆ͢Δɽ. 4.3.2 Ϛʔδϯ ௒ฏ໘ͷਪఆ͸ɼ௒ฏ໘ͱ֤Ϋϥεͷ‫཭ڑ‬ʢϚʔδϯʣ͕࠷େʹͳΔΑ͏ʹߦ͏ɽ௒ฏ ໘Λ‫ڬ‬Ή 2 ͭͷ‫ڥ‬ք໘Λࣜ (4.8) ͱ͓͘ɽ͜Ε͸ਤ 4.3 ͷ 2 ͭͷഁઢʹ૬౰͢Δɽ. f (x) = wT x + b = ±1 20. (4.8).

(40)  . ਤ 4.3. SVM ͷΠϝʔδɽ. ͜Ε͸࣍ࣜͱಉٛͰ͋Δɽ. |wT xi + b| = 1. (4.9). ·ͨɼσʔλ xi ͱ௒ฏ໘ͱͷ࠷খϢʔΫϦου‫཭ڑ‬͸ɼ. min i. |wT xi + b| w. (4.10). ͱද‫͞ݱ‬ΕΔɽw ͸ϕΫτϧ w ͷ௕͞Ͱ͋Δɽ͢Δͱࣜ (4.10) ͸ࣜ (4.9) ΑΓɼ. min i. |wT xi + b| 1 = w w. (4.11). ͱͳΔɽࣜ (4.11) ͷӈล͸‫ٻ‬ΊΔ௒ฏ໘ͱ࠷΋͍ۙσʔλ xi ͱͷϚʔδϯͰ͋ΔɽϚʔ δϯ͸௒ฏ໘ͷ྆ଆʹଘࡏ͢ΔͷͰɼ࣮ࡍ͸. 2 w. ͱͳΓɼ͜ΕΛ࠷େԽ͢Δ͜ͱͰ൚Խ. ೳྗͷߴ͍௒ฏ໘͕ಘΒΕΔɽ. 4.3.3 ύϥϝʔλਪఆ ‫܇‬࿅σʔλ xi ʹର͢Δ‫ࢣڭ‬৴߸ yi Λ࣍ͷΑ͏ʹఆٛ͢Δɽ.  yi =. 1 if xi ∈ CA −1 if xi ∈ CB. (4.12). ·ͨɼϚʔδϯ࠷େԽͷͨΊͷ੍໿৚݅͸࣍ͷ௨ΓͰ͋Δɽ. yi (wT xi + b) ≥ 1 21. (4.13).

(41) ͜ͷ੍໿৚݅ͷԼͰϚʔδϯ. 2 w. Λ࠷େԽ͢Δ͜ͱΛߟ͑Δɽ૒ର໰୊ͱͯ͠ɼϥάϥ. ϯδΣͷະఆ৐਺๏Λ༻͍ͯ͜ͷ໰୊Λղͨ͘ΊɼϚʔδϯͷ࠷େԽ͸. w2 2. ͷ࠷খԽ໰. ୊ʹஔ͖‫͑׵‬Δɽ͜͜Ͱɼࣜ (4.14) ͷΑ͏ʹ͓͖ɼϥάϥϯδϡະఆఆ਺Λ α ͱ͢Δͱɼ ࣜ (4.14) Λ࠷খԽ͢Δ໰୊͸ɼࣜ (4.15) Λࣜ (4.16) ͱࣜ (4.17) ͷ੍໿৚݅ʹ‫࠷͍ͯͮج‬ େԽ͢Δ໰୊ʹͳΔɽ. L(w) = L(w, b, α) =. N . 1 w2 2. (4.14). N. αi −. i=1. 1 yi yj αi αj xT i xj 2 i=1. αi ≥ 0 N . yi α i = 0. (4.15) (4.16) (4.17). i=1. ࠷‫߱ٸ‬Լ๏Λ༻͍ͯ͜ͷ໰୊Λղ͖ɼಘΒΕͨ࠷దղ α Λ༻͍ͯɼॏΈͷ࠷దύϥϝʔ λ w  ͸ࣜ (4.18) Ͱ‫ٻ‬ΊΒΕΔɽα ͷߋ৽͸ࣜ (4.19) ʹै͍ɼΔαi ͕े෼ʹখ͘͞ͳͬ ͨΒऩଋͨ͠ͱΈͳ͢ɽη ͸ֶश཰Ͱ͋Δɽ . w =. N . yi αi xi. (4.18). i=1. Δαi = η(1 −. . α j y i y j xT i xj ). (4.19). ͜͜Ͱɼαi > 0 Λຬͨ͢‫܇‬࿅αϯϓϧ xi ΛαϙʔτϕΫλʔͱ‫Ϳݺ‬ɽαϙʔτϕΫλʔ ͸௒ฏ໘ʹ࠷΋͍ۙ఺Ͱ͋Γɼਤ 4.3 Ͱ͸໢ֻ͚ʢփ৭ృΓͭͿ͠ʣͷ఺Ͱ͋Δɽαϙʔ τϕΫλʔΛ xs ͱ͓͚͹ɼb ͸ࣜ (4.20) Ͱ‫ٻ‬ΊΒΕΔɽ. b = ys − wT xs. (4.20). 4.3.4 ϋʔυϚʔδϯͱιϑτϚʔδϯ ਤ 4.3 ͷΑ͏ͳϚʔδϯ಺ʹ‫܇‬࿅σʔλ͕ଘࡏ͠ͳ͍৔߹ΛϋʔυϚʔδϯͱ͍͏ɽ͜ Εʹର͠ɼϚʔδϯ಺ʹ‫܇‬࿅σʔλ͕ଘࡏ͢Δ৔߹ΛιϑτϚʔδϯͱ͍͏ɽιϑτϚʔ δϯʹ͓͚Δ੍໿৚݅͸࣍ࣜͷΑ͏ʹͳΔɽ. yi (wT xi + b) ≥ 1 − ξi where ξi ≥ 0. (4.21). ξ ͸εϥοΫม਺ͱ‫ݺ‬͹ΕΔɽϋʔυϚʔδϯͳΒ ξ = 0ɼਖ਼͘͠෼ྨͰ͖͍ͯΔ͕Ϛʔ δϯ಺ʹσʔλ͕ଘࡏ͢Δ৔߹͸ 0 < ξ ≤ 1ɼ‫ޡ‬෼ྨ͞Εͨ৔߹͸ ξ > 1 ͱͳΔɽιϑτ ϚʔδϯΛߟྀͨ͠Ϛʔδϯ࠷େԽͷ໨తؔ਺͸ࣜ (4.22) ͱͳΔɽ. 22.

(42) N.  w2 ξi where C > 0 +C 2 i=1. (4.22). C ͸ϖφϧςΟΛද͢ύϥϝʔλͰɼC → ∞ ͳΒϋʔυϚʔδϯͱͳΔɽҰൠʹɼC ͕ େ͖͚Ε͹େ͖͍΄Ͳ‫܇‬࿅σʔλͷ‫ޡ‬Γʹର͢ΔϖφϧςΟ͕େ͖͘ͳΔͨΊɼաֶशΛ Ҿ͖‫͢͜ى‬Մೳੑ͕ߴ͘ͳΔɽ൚ԽੑೳΛߴΊΔͨΊʹ͸ɼάϦου୳ࡧΛ༻͍ͯ‫ޙ‬ड़ͷ Χʔωϧ๏ͷύϥϝʔλ σ ͱ C ͷ࠷దͳ૊Έ߹ΘͤΛ‫ٻ‬ΊΔɽ. 4.3.5 Χʔωϧ๏ SVM ͸ඇઢ‫ܗ‬໰୊ʹରͯ͠ɼ෼཭ੑೳͷྑ͍௒ฏ໘Λඞͣ͠΋ߏ੒Ͱ͖ΔΘ͚Ͱ͸ͳ ͍ɽྫ͑͹ɼ2 ࣍‫ ݩ‬XOR ໰୊Λղ͘͜ͱ͸ෆՄೳͰ͋Δɽͦ͜Ͱɼ‫܇‬࿅σʔλΛ‫ݩ‬ͷۭ ؒͷ࣍‫਺ݩ‬Ҏ্ͷ࣍‫ݩ‬Λ࣋ͭผͷۭؒʹࣸ૾͠ɼͦͷ্ۭؒͰ௒ฏ໘Λ‫ٻ‬ΊΔ͜ͱͰ෼཭ Մೳͱ͢Δํ๏͕ߟ͑ΒΕͨɽ͜ͷ࣌ɼ‫܇‬࿅σʔλ xi = (xi1 , xi2 , · · · , xiD )T Λ Φ(xi ) Ͱࣸ૾ͨ͠σʔλΛ zi = (zi1 , zi2 , · · · , ziD )T ͱ͢Ε͹ɼࣜ (4.15) ͸ࣜ (4.23) ʹॻ͖‫׵‬ ͑ΒΕΔɽ N . N. 1 L(w, b, α) = αi − yi yj αi αj ziT zj 2 i=1 i=1. (4.23). ࣜ (4.23) தͷ ziT zj ͸Ұൠʹ‫͕ྔࢉܭ‬๲େʹͳΔͨΊɼࣸ૾લͷ‫܇‬࿅σʔλΛ༻͍ͨ‫ܭ‬ ࢉࣜͰ୅༻͢Δɽྫ͑͹ɼຊ‫͍༻Ͱڀݚ‬Δ RBF Χʔωϧ͸ࣜ (4.24) Ͱද͞Εɼσ(> 0) ͸Ϣʔβ͕ࢦఆ͢Δɽσʔλ਺ͱൺֱͯ͠ಛ௃ྔͷ࣍‫͕਺ݩ‬ѹ౗తʹଟ͍Α͏ͳ৔߹͸ɼ ઢ‫ܗ‬Χʔωϧͷํ͕ྑ͍͜ͱ΋͋Δɽ. ziT zj. = =. K(xi , xj ) 2 e−σxi −xj . (4.24). 4.3.6 ଟΫϥε෼ྨ΁ͷԠ༻ SVM ͸ 2 Ϋϥε෼ྨͰ͋ΔͨΊɼଟΫϥε෼ྨʹԠ༻͢ΔͨΊʹ͸ɼ1 ରଞ෼ྨ๏΍ 1 ର 1 ෼ྨ๏ͳͲɼෳ਺ͷ SVM Λߏங͢Δ͜ͱ͕ඞཁͱͳΔɽ1 ରଞ෼ྨ๏͸ɼ͋ΔΫ ϥεͱͦͷଞͷΫϥεશͯͰ SVM Λߏங͍͖ͯ͠ɼͦΕΒΛ΋ͱʹଞΫϥε෼ྨΛߦ ͏ํ๏Ͱ͋Δ K Ϋϥε෼ྨͰ͸ K ‫ݸ‬ͷ SVM ͕ඞཁͱͳΔɽ1 ର 1 ෼ྨ๏͸ɼ2 Ϋϥε ͰϖΞΛ࡞͍͖ͬͯɼͦΕΒΛ෼ྨ͢Δ SVM Λߏங͢ΔɽK Ϋϥε෼ྨͰ͸ K C2 ‫ݸ‬ͷ. SVM ͕ඞཁͱͳΔɽ1 ର 1 ෼ྨ๏͸ɼΫϥε਺͕ଟ͍৔߹͸‫ࢉܭ‬ίετ͕͔͔Δ͕ɼ෼ ྨͷ೉͍͠σʔλʹରͯ͠΋෼ྨੑೳ͕ߴ͍ɽ. SVM ߏஙͷࡍɼΫϥεؒͷ‫܇‬࿅σʔλ਺ʹ͕ࠩ͋Δͱɼ‫܇‬࿅σʔλ਺ͷଟ͍Ϋϥεʹ ࣝผ݁Ռ͕ภͬͯ͠·͏͜ͱ͕͋Δɽ࣮ੈքͷଟ͘ͷ෼ྨ໰୊͸ɼσʔλΛ‫ۉ‬౳ʹ༻ҙ͢. 23.

(43) Δ͜ͱ͕೉͍ͨ͠Ίɼେ͖͘ 2 ͭͷํ๏Ͱରॲ͢Δɽ1 ͭ͸ɼࣜ (4.22) ʹ͓͚Δίετ ύϥϝʔλ C Λௐઅ͢Δํ๏Ͱ͋Δɽσʔλͷগͳ͍Ϋϥεʹର͢Δ C Λߴ͘͠ɼ‫ޡ‬Γ ʹରͯ͠‫͘͢͠ݫ‬Δ͜ͱͰσʔλͷগͳ͍ΫϥεͷࣝผੑೳΛ޲্ͤ͞Δɽ΋͏ 1 ͭ͸ɼ Ϋϥεؒͷσʔλ਺Λଗ͑Δํ๏Ͱ͋Δɽσʔλͷগͳ͍ํͷΫϥεʹσʔλ਺Λ߹Θͤ ΔʢΞϯμʔαϯϓϦϯάʣ৔߹͸ɼσʔλͷଟ͍Ϋϥεʹ͍ͭͯΫϥελϦϯάͳͲΛ ༻͍ͯຬวͳ͘αϯϓϦϯά͢Δɽσʔλͷଟ͍ํ͓Ϋϥεʹσʔλ਺Λ߹ΘͤΔʢΦʔ όʔαϯϓϦϯάʣ৔߹͸ɼσʔλͷগͳ͍Ϋϥεʹ͍ͭͯ k-NN ๏ͳͲΛ༻͍ͯσʔλ Λਫ૿͢͠Δɽ. 4.4 DNNʢDeep Neural Networkʣ 4.4.1 DNN ͷ‫ج‬ຊߏ଄ DNN ͱ͸ɼNeural Network Λଟ૚ʹ݁߹ͨ͠ϞσϧͰ͋Δɽೖྗͱग़ྗͷؔ܎Λଟ ͘ͷӅΕ૚ͱͦͷύϥϝʔλͰද‫͢ݱ‬Δ͜ͱͰɼະ஌ͷσʔλʹର͢Δࣝผੑೳ͕ߴ͍͜ ͱ͕ಛ௃Ͱ͋Γɼۙ೥͸ଟ͘ͷ‫ػ‬ցֶशͷ෼໺ʹऔΓೖΕΒΕ͍ͯΔɽ. DNN ͷ࠷খ୯ҐͰ͋ΔϢχοτ͸ਤ 4.4ʢࠨʣͷΑ͏ʹ ॏΈ w ͱόΠΞεθ ͷύϥ ϝʔλΛ࣋ͭɽͦͯ͠ɼଞͷϢχοτ͔Βͷೖྗ x ΛॏΈ෇͚ͯ͠όΠΞεΛՃ͑ɼ‫׆‬ੑ Խؔ਺ f Λ௨ͯ࣍͠ͷϢχοτ΁ͷग़ྗͱ͢Δ (ࣜ (4.26))ɽ‫׆‬ੑԽؔ਺ f ͸ᮢ஋ؔ਺΍. tanh ؔ਺ɼγάϞΠυؔ਺ͳͲ͕༻͍ΒΕΔɽ. z = wx + θ x = f (z). (4.25) (4.26). ͜ΕΛෳ਺ͷ૚ʹ֦ு͠ɼ͔֤ͭ૚ʹෳ਺ͷϢχοτΛ഑ஔ͢Δߏ଄Λ MLPʢMulti-. Layer Perceptronʣͱ͍͏ʢਤ 4.4ʢӈʣʣɽMLP Ͱ͸ɼୈ 1 ૚͔Βୈ 2 ૚ɼୈ 2 ૚͔Β ୈ 3 ૚΁ͱɼ૚ͷ֤Ϣχοτ͕࣍ͷ૚ͷ֤Ϣχοτ΁ग़ྗ͢Δɽ֤Ϣχοτ͸࣍ͷ૚ͷϢ χοτ΁ͷॏΈ܎਺ߦྻ W ͱόΠΞε߲ θ Λ࣋ͭɽࣜ (4.27) ࣜ (4.28) ͷ֤߲͸ҎԼͰ ͋Δɽ (q). • Wij ɿୈ q − 1 ૚ͷϢχοτ i ͔Βୈ q ૚ͷϢχοτ j ΁ͷ݁߹ॏΈɽ (q−1). • xi • •. ɿୈ q − 1 ૚ͷϢχοτ i ͷग़ྗɽ. (q) θj ɿୈ q (q) xj ɿୈ q. ૚ͷϢχοτ j ͷόΠΞεɽ ૚ͷϢχοτ j ͷग़ྗɽ࣍ͷ૚ͷϢχοτͷೖྗʹͳΔɽ. (q). zj. =. . (q) (q−1). Wij xi. i (q) xj. (q). = f (zj ) 24. (q). + θj. (4.27) (4.28).

(44)  . ਤ 4.4. . χϡʔϥϧωοτϫʔΫͷϢχοτʢࠨʣͱ݁߹ͷྫʢӈʣɽ.  . .

(45) . . ਤ 4.5. . . MLP ʹΑΔଟΫϥε෼ྨɽ. MLP ΛଟΫϥε෼ྨʹ༻͍Δ৔߹ɼਤ 4.5 ͷΑ͏ʹ࠷ॳͷ૚Λೖྗ૚ͱͯ͠ɼ‫؍‬ଌ σʔλͷ஋΍‫؍‬ଌσʔλΛՃ޻ͨ͠ಛ௃ྔͳͲΛೖྗ͢Δɽ࠷‫ޙ‬ͷ૚͸ग़ྗ૚ͱͯ͠ɼ‫؍‬ ଌσʔλ X ʹର͢ΔΫϥε c ͷग़ྗ֬཰ P (c|X) Λग़ྗ͢Δɽೖྗ૚ͱग़ྗ૚ͷؒͷ૚ Λதؒ૚·ͨ͸ӅΕ૚ͱ‫Ϳݺ‬ɽ‫͋ࢣڭ‬ΓֶशΛ͢Δ৔߹ɼೖྗ૚ʹֶशσʔλΛ༩͑ɼग़ ྗ૚·Ͱ৴߸Λ఻ൖͤ͞ɼग़ྗ૚ͷग़ྗͱ‫ࢣڭ‬৴߸ͷ‫ࠩޡ‬Λগͳ͘͢ΔΑ͏ʹֶश͢Δɽ ‫׆‬ੑԽؔ਺ʹ͸γάϞΠυؔ਺ (ࣜ (4.29)) ͕Α͘༻͍ΒΕΔ͕ɼग़ྗ૚ʹΑΔࣝผΫϥ εͷग़ྗʹ͸ιϑτϚοΫεؔ਺ (ࣜ (4.30)) Λ༻͍Δ͜ͱ͕ଟ͍ɽιϑτϚοΫεؔ਺ ͸ɼ࣍ͷ૚΁ͷग़ྗͷ૯࿨Λ 1 ʹ͢ΔͨΊɼ֬཰తʹग़ྗͰ͖Δɽ. 1 1 − e−xi exi f (xi ) =  xn ne. f (xi ) =. (4.29) (4.30). 4.4.2 ‫͋ࢣڭ‬ΓֶशʢFine-tuningʣ (q). (q). DNN ͷ‫͋ࢣڭ‬Γֶशͷ໨ඪ͸ɼ֤૚ɼ֤ϢχοτͷॏΈ Wij ͱόΠΞε θj. Λ‫ࢣڭ‬. ৴߸ʹΑֶͬͯश͠ɼ‫؍‬ଌ৴߸͔Β‫ࢣڭ‬৴߸ͱͷ‫͕ࠩޡ‬গͳ͍ग़ྗΛฦ͢Α͏ʹ͢Δ͜ͱ Ͱ͋ΔɽॏΈͱόΠΞε͸ɼॳ‫ظ‬஋͸ϥϯμϜʹઃఆ͞Εɼֶशσʔλͱͦͷ‫ࢣڭ‬৴߸ Λ‫఻ࠩޡٯʹݩ‬ൖ๏ʢBack-PropagationʀҎԼɼBP ๏ʣΛ༻͍ͯॏΈΛߋ৽͢Δɽֶश σʔλͷग़ྗͱ‫ࢣڭ‬৴߸ͱͷ‫ʹ਺ؔࠩޡ‬͸ɼަࠩΤϯτϩϐʔ΍ೋ৐‫͍༻͕ࠩޡ‬ΒΕΔɽ. 25.

(46) ຊ‫͍ͨ༻Ͱڀݚ‬ೋ৐‫ࠩޡ‬͸ࣜ (4.31) Ͱද͞ΕΔɽ. E(W ) = (n). ͜͜Ͱɼxj. 1  (n) (xj − dj )2 2 i. (4.31). ͸ग़ྗ૚ n ͷ j ൪໨ͷϢχοτͷग़ྗɼdj ͸ग़ྗ૚ͷ j ൪໨ͷϢχοτʹର (q). Ԡ͢Δ‫ࢣڭ‬৴߸Ͱ͋ΔɽॏΈͷߋ৽ʹ͸֬཰తޯ഑߱Լ๏͕༻͍ΒΕɼWij ͸ࣜ (4.32) ͷΑ͏ʹߋ৽͞ΕΔɽη ͸ֶश཰Ͱ͋ΔɽόΠΞε΋ಉ༷ʹ‫͞ࢉܭ‬ΕΔɽ. ˆ (q) = W (q) − η ∂E(W ) W ij ij (q) ∂Wij. (4.32). ࣜ (4.32) ͷୈ 2 ߲͸࣍ͷΑ͏ʹ‫͢ࢉܭ‬Δɽ. ∂E(W ) (q). (q). =. (q). ∂Wij. (q). ࣜ (4.34) ͷΑ͏ʹ δj. (q). ∂xj =. (q). ∂E(W ) ∂xj ∂zj. ∂E(W ) (q) ∂xj. ∂zj. (q). ∂Wij. (q). (q−1). f  (zj )xi. (4.33). Λఆٛ͢Δͱɼࣜ (4.33) ͸ࣜ (4.35) ʹม‫͖Ͱܗ‬Δɽ (q). δj. ∂E(W ). =−. (q) ∂xj. ∂E(W ). (q). f  (zj ). (4.34). (q) (q−1). = −δj xi. (q) ∂Wij. (4.35). q = n ͷ৔߹ɼ͢ͳΘͪग़ྗ૚ͷ‫ࠩޡ‬͸؆୯ʹ‫͖Ͱࢉܭ‬ɼࣜ (4.34) ͷภඍ෼ͷ߲͕ࣜ (4.36) ͱͳΔͨΊࣜ (4.34) ͸ࣜ (4.37) ʹͳΔɽ·ͨɼࣜ (4.35) ͸ࣜ (4.38) ʹͳΔɽ ∂E(W ) (n) ∂xj (n). δj. (n). = xj. (n). = −(xj. − dj. (4.36) (n). − dj )f  (zj ). (4.37). ∂E(W ) (n) (n−1) = −δj xi ∂Wijn. (4.38). ࣜ (4.37) ͷγάϞΠυؔ਺ͷඍ෼͸ࣜ (4.39) ͷͨΊɼࣜ (4.38) ͸ࣜ (4.37) ͱࣜ (4.28) ͔Β࠷ऴతʹࣜ (4.40) ʹͳΔɽ.  1 f (x) = 1 − e−x = f (x){1 − f (x)} . . ∂E(W ) (n) ∂Wij. (n). = −(xj. (n). (4.39) (n). (n−1). − dj )xj (1 − xj )xi 26. (4.40).

(47) (q). ଓ͍ͯɼq < n ͷ৔߹ɼ͢ͳΘͪӅΕ૚ͷ‫͑ߟ͍ͯͭʹࠩޡ‬Δɽδj. ͸ɼͦͷ࣍ͷ૚. ʢୈ q + 1 ૚ʣͷग़ྗΛ༻͍Δ͜ͱͰɼࣜ (4.41) Ͱද͞ΕΔɽ (q). δj. =−. ∂E(W ) . =−. (q). f  (zj ). (q) ∂xj.  ∂E(W ) ∂x(q+1) ∂z (q+1) (q+1) ∂xk. k. k (q+1) ∂zk. . k. (q) ∂xj. (q). f  (zj ). (4.41). ͜ΕΛղ͘ͱɼ (q). δj. (q). = fj (zj ). =. (q) ∂Wij (q). ͱͳΔɽδj. =. .  k. (q+1). Wjk. (q+1) (q) δj Wjk. (q). (q). (1 − xj )xj. (4.42). (q+1) (q) δj Wjk. (q+1). Λ‫͢ࢉܭ‬Δʹ͸ɼδj. (q+1). δj. k. k. ∂E(W ). . (q). (q) (q−1). (1 − xj )xj xi. (4.43). ͕ඞཁͱͳΓɼ‫͕ࠩޡ‬ग़ྗ૚͔Β‫఻ٯ‬ൖ͍ͯ͠Δ͜. ͱ͕෼͔Δɽຊ‫ڀݚ‬ͷ֬཰తޯ഑߱Լ๏Ͱ͸ɼ֬཰తޯ഑ͷ‫ʹࢉܭ‬શͯͷσʔλΛ࢖͏ͷ Ͱ͸ͳ͘ɼϛχόονͱ‫ݺ‬͹ΕΔ୯ҐͰֶशσʔλΛϥϯμϜʹநग़͠ɼͦͷฏ‫ۉ‬Λ࢖༻ ͢Δ͜ͱͰɼղ͕‫࠷ॴہ‬దղʹऩଋ͢Δʢաֶश͢Δʣ͜ͱΛ๷͙ɽ. 4.4.3 ‫ֶ͠ͳࢣڭ‬शʢPre-trainingʣ DNN Ͱ‫͋ࢣڭ‬ΓֶशΛ͢Δ࣌ͷύϥϝʔλͷॳ‫ظ‬஋͸ϥϯμϜͰ͋Δ͕ɼ‫ֶ͠ͳࢣڭ‬ शͷΞϧΰϦζϜΛ༻͍ͯ͋Δఔ౓σʔλʹґଘͨ͠஋ʹॳ‫ظ‬஋Λߋ৽͢Δ͜ͱͰֶशੑ ೳΛߴΊΒΕΔ͜ͱ͕஌ΒΕ͍ͯΔɽʢจ‫ݙ‬Ҿ༻ʣ͜ΕΛ Pre-training ͱ͍͏ɽຊ‫Ͱڀݚ‬ ͸ SdAʢStacked denoising Auto-encoderʣΛ Pre-training ʹऔΓೖΕΔɽ. Autoencoder ͸‫ֶ͠ͳࢣڭ‬शͷҰछͰɼਤ 4.6 ͷΑ͏ʹɼೖྗσʔλ͔ΒӅΕ૚Λհ ͯ͠ೖྗσʔλͱಉ͡΋ͷΛग़ྗ͢ΔΑ͏ʹύϥϝʔλΛֶश͢Δख๏Ͱ͋Δɽਤ 4.6 ͷ. x(q−1) ͸ୈ q − 1 ૚ͷϢχοτɼx(q) ͸ୈ q ૚ͷϢχοτͰ͋Δɽग़ྗʹ͸‫ࢣڭ‬৴߸ͷม ΘΓʹೖྗσʔλΛ༻͍ɼֶशΞϧΰϦζϜʹ͸ BP ๏Λ༻͍Δɽࣜ (4.32) ͷ‫ࢉܭࠩޡ‬ Ͱ͸ɼ‫ࢣڭ‬৴߸ di ͷ୅ΘΓʹೖྗ৴߸ vi Λ༻͍Δɽ. Denoising Autoencoder(dA)[40] ͸ɼAutoencoder Λϕʔεͱͯ͠ɼೖྗ v Λ֬཰త ʹॻ͖‫͍͠৽ͨ͑׵‬ೖྗ v  ʹ͔ͯ͠Βɼ‫ݩ‬ͷೖྗ v Λग़ྗͤ͞ΔΑ͏ͳχϡʔϥϧωο τϫʔΫΛֶश͢Δɽ͜ΕʹΑΓɼೖྗσʔλʹϊΠζͷॏ৞΍ܽଛ஋͕ൃੜͯ͠΋ɼΫ ϦʔϯͳೖྗσʔλΛ෮‫͖Ͱݩ‬ΔΑ͏ʹͳΔɽdA ͸σʔλͷϊΠζআ‫ʹڈ‬ΑͬͯೝࣝΛ ༰қʹ͢ΔσʔλΛ෮‫͢ݩ‬Δ͜ͱ͕ओͳ໨తͰ͋ΔɽҰൠʹ͸ dA ͷֶशʹ༻͍Δೖྗ σʔλ͸ΫϦʔϯͰ͋ΓɼdA ͷதؒ૚ͰϊΠζΛ෇༩͢Δɽ৽͍͠ೖྗ v  ͷੜ੒ʹ͸ɼ. 27.

(48)    ਤ 4.6. Autoencoder.. Ψ΢εϊΠζʢGaussian noiseʣ΍Ԙ͜͠ΐ͏ϊΠζʢSolt and pepper noiseʣͳͲ͕༻ ͍ΒΕΔɽຊ‫ڀݚ‬ͷ৔߹ɼࡶԻ͕ॏ৞ͨ͠Ի੠ͷΈѻ͏ͨΊɼࡶԻআ‫͏͍ͱڈ‬ΑΓ΋ɼࡶ ԻʹΑͬͯೖྗσʔλ͕ଟগมԽͯ͠΋ॊೈʹࣝผͰ͖Δ͜ͱΛ dA ʹ‫ظ‬଴͢Δɽຊ‫ڀݚ‬ Ͱ͸ɼԘ͜͠ΐ͏ϊΠζʹΑͬͯɼೋ߲෼෍Λ༻͍ͯ֬཰తʹ͍͔ͭ͘ͷ࣍‫ݩ‬ͷಛ௃ྔΛ. 0 ʹஔ͖‫ͨ͑׵‬ɽ Stacked denoising AutoencoderʢSdAʣ[41] ͸ɼdA ΛԿ૚΋ॏͶͯ࡞ΒΕΔɽDNN ͷ MLP ͷΑ͏ͳଟ૚ͷχϡʔϥϧωοτϫʔΫʹ͓͍ͯ‫ֶ͠ͳࢣڭ‬शΛ࣮‫͢ݱ‬ΔͨΊʹ ߟҊ͞Εͨɽֶश͸ dA ͱಉ͘͡ 1 ૚ͣͭߦΘΕΔɽ࠷ॳ͸ೖྗ૚ɾӅΕ૚ 1 ૚໨ɾೖྗ ૚ͱ͍͏ߏ଄Ͱɼೖྗ૚͔ΒӅΕ૚ 1 ૚໨΁ͷύϥϝʔλΛֶश͢Δɽ࣍ʹɼӅΕ૚ 1 ૚ ໨ɾӅΕ૚ 2 ૚໨ɾӅΕ૚ 1 ૚໨ͱ͍͏ߏ଄ͰɼӅΕ૚ 1 ૚໨͔ΒӅΕ૚ 2 ૚໨΁ͷύϥ ϝʔλΛֶश͢ΔɽӅΕ૚ 1 ૚໨ͷग़ྗ͸ɼઌ΄Ͳֶशͨ͠ೖྗ૚ͱӅΕ૚ 1 ૚໨ͷύ ϥϝʔλΛ‫ʹݩ‬ɼೖྗ৴߸͔Βॱ࣍‫ٻ‬ΊΒΕΔɽಉ༷ʹͯ͠ɼӅΕ૚ 2 ૚໨Ҏ߱΋ dA ʹ ΑֶͬͯशΛ͢Δɽ࠷‫ޙ‬ͷӅΕ૚͔Βग़ྗ૚΁ͷύϥϝʔλ͸͜͜Ͱ͸ֶश͠ͳ͍ɽ. 28.

参照

関連したドキュメント

研究計画書(様式 2)の項目 27~29 の内容に沿って、個人情報や提供されたデータの「①利用 目的」

歩行 体力維持と気分転換 屋外歩行・屋内歩行 軽作業 蝶番組立作業等を行い、工賃収入を得る 音楽 カラオケや合唱をすることでのストレスの解消

 「事業活動収支計算書」は、当該年度の活動に対応する事業活動収入および事業活動支出の内容を明らか

問13 あなたの職種を教えてください? 

By the method I, emotional recognition rate is 60% for close data, and 50% for open data(8 sentence speech of another speaker).The method II improves drastically the recognition

である水産動植物の種類の特定によってなされる︒但し︑第五種共同漁業を内容とする共同漁業権については水産動

 「事業活動収支計算書」は、当該年度の活動に対応する事業活動収入および事業活動支出の内容を明らか

調査地点2(中央防波堤内側埋立地)における建設作業騒音の予測結果によると、評