第 4 章 「ヒット製品」の事例検証
第 2 部 新聞記事の表現から見る
5.2 word2vec を用いた新聞記事分析
5.2.3 word2vec の試行
まず、第1部で「ヒット製品」として選択したiPod(アイポッド)と、その競合製品で あるWALKMAN(ウォークマン)38をpositive wordとして与えて、図4-1でiPodの新聞 記事が増え始めた2004年の日本経済新聞の記事データを用いてword2vecを実行した。そ の結果として得られたiPodとWALKMANのそれぞれの類義語とコサイン類似度が表5-1 である。得られた類義語はコサイン類似度の高い順に上位30位までを表示している。
iPodで得られた類義語の上位はi-pod(0.83)39、携帯音楽プレーヤー(0.82)、mini(ミ ニ)(0.81)で、WALKMANで得られた類義語の携帯音楽プレーヤー(0.68)、ネットワー クウォークマン(0.67)、GIGA(ギガ)(0.65)であった。iPodの類義語で最上位のi-pod はiPodと同じ語であるので、iPod、WALKMANのどちらも携帯音楽プレーヤーという製 品カテゴリー(製品の一般名称)が最上位に現れている。しかし、iPod で得られた携帯音 楽プレーヤーという類義語のコサイン類似度が0.82なのに対して、ウォークマンで得られ
38 本研究においてword2vecで求めた類義語は英字で表示されるものが多い。これはword2vec用に形態 素解析をおこなった時に用いた辞書の関係であるが、新聞記事に現れるすべての語を確認することはで きないので、本論文ではそのまま使用し、必要に応じて( )で正しいと思われる語を記述する。
39 コサイン類似度およびその計算結果は論文中の表では小数点以下9桁で記述しているが、文中では小数 点以下3桁で四捨五入し、小数点以下2桁で記述している。
52
表 5-1 iPodおよびWALKMANでの2004年のword2vecの類義語抽出結果
た携帯音楽プレーヤーという類義語のコサイン類似度は0.68と、その値に大きな差があっ た。またiPod で得られた類義語にはアップルコンピュータあるいはアップル40という企業 名が現れたが、WALKMANで得られた類義語にはソニーという企業名は現れなかった。
逆にアップル、ソニーという企業名をpositive wordとして与えて得られた類義語とコサ イン類似度が表5-2 である。アップルで得られた類義語にはiPod という製品名や iTunes
(アイチューンズ:iTunes Music Store)というアップルのサービス名が上位に現れたが、
ソニーで得られた類義語には東芝、松下電器産業、キヤノンといったソニーと競合すると 考えられる企業名が上位に現れ、WALKMANという製品名は現れなかった。さらにアップ ルの類義語には携帯音楽プレーヤーという製品カテゴリーも上位に現れたが、ソニーの類
40 アップルは2007年にアップルコンピュータよりApple Inc.(アップル)に改称。
類義語 コサイン類似度 類義語 コサイン類似度
i-pod 0.831242204 携帯音楽プレーヤー 0.682863474
携帯音楽プレーヤー 0.818595648 ネットワークウォークマン 0.665872812
mini 0.809828103 DIGA 0.654897094
アップルコンピュータ 0.748638391 ミニコンポ 0.647984743
photo 0.737503171 iPod 0.635259151
iTunes 0.670550227 プレーヤー 0.633379936
WALKMAN 0.635259151 i-pod 0.612213135
Store 0.622879803 MiniDisc 0.611296773
Music 0.613997102 MP3 0.606139123
有料配信ネットサービス 0.606758952 ハードディスク内蔵型 0.604582310
アップル 0.584962368 PlayStation 0.599443436
ハードディスク内蔵型 0.584587216 スゴ録 0.595024347
音楽配信サービス 0.575705647 VALUESTAR 0.588494718
マッキントッシュ 0.574407101 記憶容量 0.586081743
ネットワークウォークマン 0.572707415 mini 0.576130152 スティーブ・ジョブズ 0.559431791 gigabeat 0.575643778
名刺サイズ 0.556700826 photo 0.570724130
MP3 0.553927898 メディアプレーヤー 0.569875240
Apple 0.543958962 ヘッドホンステレオ 0.568400025
音楽配信 0.540111661 IXY 0.564414203
廉価版 0.528677166 TVチューナー 0.563937068
プレーヤー 0.525577068 DVD 0.563760281
有料音楽配信 0.519638300 Blu-Ray 0.559081554
音楽ネット配信 0.519593775 パソコン経由 0.555813909
記憶容量 0.517822504 音楽ネット配信 0.555065453
i-mac 0.517245531 SDカード 0.554355145
デジタルオーディオプレーヤー 0.512735188 ZEN 0.552984953 パソコン経由 0.508603215 マッキントッシュ 0.550675750
Mac 0.504922986 ダビング 0.549651504
デル 0.504340172 iTunes 0.547508061
1)網掛けは企業名。
2)word2vecの実行結果より上位30件を表示。
positive_word ⇒ iPod positive_word = WALKMAN
処理対象ベクトル: 処理対象ベクトル:
・単位 = 記事 ・単位 = 記事
・期間 = 2004 all ・期間 = 2004 all
53
表 5-2 アップルおよびソニーでのした2004年のword2vecの類義語抽出結果
義語には現れなかった。ソニーで得られた製品名の類義語はDVDレコーダーのスゴ録で、
製品カテゴリーではBlu-Rayや光ディスク、DVDであった。これは2004年当時のソニー が力を入れていた分野がDVDレコーダーやBlu-Rayであったからではないかと推測する。
次に、同じく第1部で「ヒット製品」として選択したPrius(プリウス)とその製造企業 であるトヨタ、Priusの製品カテゴリーであるハイブリッド車をそれぞれpositive wordに 与えて2004年の日本経済新聞の記事データを用いてword2vecを実行して得られた類義語 とコサイン類似度が表5-3である。2004年時点ではプリウスの新聞記事数の変化はなく、
前述のソニーのウォークマンと同じような条件と考えられる。
Prius で得られた類義語にはハイブリッド車という製品カテゴリーが 0.81という高い値
のコサイン類似度で最上位に現れている。その他に上位に現れた類義語でコサイン類似度 が0.7以上のものはCymru(カムリ)、アコード、クラウン、オデッセイ、カローラ、アベ ンシス、エスティマ、エスケープ、Vitz(ヴィッツ)、マークXなどである。アコード、オ デッセイ、エスケープを除くとほとんどがトヨタの製品名である。また企業名のトヨタも 現れている。
処理対象ベクトル: 処理対象ベクトル:
・単位 = 記事 ・単位 = 記事
・期間 = 2004 all ・期間 = 2004 all
positive_word ⇒ アップル positive_word = ソニー
類義語 コサイン類似度 類義語 コサイン類似度
iTunes 0.636223555 東芝 0.786344647
コネクト 0.615669250 松下電器産業 0.719805777
携帯音楽プレーヤー 0.607483983 キヤノン 0.669824719
Store 0.606293023 松下 0.648261070
Music 0.592372656 Blu-Ray 0.634111047
iPod 0.584962368 日立製作所 0.616925120
アップルコンピュータ 0.570137322 シャープ 0.615402937
i-pod 0.546431065 パイオニア 0.615248084
音楽配信サービス 0.540925503 三洋電機 0.601416826
photo 0.531721294 NEC 0.600000501
楽曲販売 0.522895217 日本ビクター 0.588965833
有料配信ネットサービス 0.519067645 富士通 0.586688519
オリコン 0.515100121 タイム・ワーナー 0.571953714
リアルネットワークス 0.515037179 次世代ゲーム機 0.567930162
音楽配信 0.508816123 フィリップス 0.561092794
音楽ネット配信 0.506919205 ディスプレイテクノロジー 0.559734464
マッキントッシュ 0.506598473 スゴ録 0.555687129
有料音楽配信 0.506173015 光ディスク 0.551856697
Napstar 0.494050026 TDK 0.550634503
Apple 0.491646856 DIGA 0.545437932
WALKMAN 0.489513814 出井伸之 0.545003653
楽曲 0.484898448 安藤国威 0.544452190
有線 0.466070563 久多良木 0.543116391
アプリックス 0.465827882 サムスン電子 0.540439069
ブロード 0.462383598 規格争い 0.539689660
有料配信 0.461941063 DVD 0.538999259
mini 0.459066510 日立マクセル 0.537852168
ネットワークウォークマン 0.454624355 メトロ・ゴールドウィン・メイヤー 0.536341906
廉価版 0.450369626 エプソン 0.535341382
テンアートニ 0.449173570 三菱電機 0.532919228
1)網掛けはアップルまたはソニーの製品名。
2)word2vecの実行結果より上位30件を表示。
54
表 5-3 Priusとトヨタ、ハイブリッド車での2004年のword2vecの類義語抽出結果
逆にトヨタという企業名で得られた類義語には Prius という製品名が現れている。また ホンダや日産、マツダといったトヨタと競合する企業名が類義語の上位に現れたが、同時 にカローラやCymru、クラウン、エスティマ、LEXUS(レクサス)などのトヨタのPrius 以外の製品名や、ハイブリッド車というPriusの製品カテゴリーも類義語に現れている。
ハイブリッド車で得られた類義語ではPriusがコサイン類似度0.81という高い値で現れ ている。他には製品名では同じくトヨタのCymruが類義語の上位に現れているが、コサイ ン類似度は0.66とPriusに比べるとかなり低くなっている。さらにハイブリッド車で得ら れた類義語にはホンダやトヨタ、フォードといった企業名も現れている。