• 検索結果がありません。

第 4 章 「ヒット製品」の事例検証

第 2 部 新聞記事の表現から見る

5.2 word2vec を用いた新聞記事分析

5.2.3 word2vec の試行

まず、第1部で「ヒット製品」として選択したiPod(アイポッド)と、その競合製品で あるWALKMAN(ウォークマン)38をpositive wordとして与えて、図4-1でiPodの新聞 記事が増え始めた2004年の日本経済新聞の記事データを用いてword2vecを実行した。そ の結果として得られたiPodとWALKMANのそれぞれの類義語とコサイン類似度が表5-1 である。得られた類義語はコサイン類似度の高い順に上位30位までを表示している。

iPodで得られた類義語の上位はi-pod(0.83)39、携帯音楽プレーヤー(0.82)、mini(ミ ニ)(0.81)で、WALKMANで得られた類義語の携帯音楽プレーヤー(0.68)、ネットワー クウォークマン(0.67)、GIGA(ギガ)(0.65)であった。iPodの類義語で最上位のi-pod はiPodと同じ語であるので、iPod、WALKMANのどちらも携帯音楽プレーヤーという製 品カテゴリー(製品の一般名称)が最上位に現れている。しかし、iPod で得られた携帯音 楽プレーヤーという類義語のコサイン類似度が0.82なのに対して、ウォークマンで得られ

38 本研究においてword2vecで求めた類義語は英字で表示されるものが多い。これはword2vec用に形態 素解析をおこなった時に用いた辞書の関係であるが、新聞記事に現れるすべての語を確認することはで きないので、本論文ではそのまま使用し、必要に応じて( )で正しいと思われる語を記述する。

39 コサイン類似度およびその計算結果は論文中の表では小数点以下9桁で記述しているが、文中では小数 点以下3桁で四捨五入し、小数点以下2桁で記述している。

52

表 5-1 iPodおよびWALKMANでの2004年のword2vecの類義語抽出結果

た携帯音楽プレーヤーという類義語のコサイン類似度は0.68と、その値に大きな差があっ た。またiPod で得られた類義語にはアップルコンピュータあるいはアップル40という企業 名が現れたが、WALKMANで得られた類義語にはソニーという企業名は現れなかった。

逆にアップル、ソニーという企業名をpositive wordとして与えて得られた類義語とコサ イン類似度が表5-2 である。アップルで得られた類義語にはiPod という製品名や iTunes

(アイチューンズ:iTunes Music Store)というアップルのサービス名が上位に現れたが、

ソニーで得られた類義語には東芝、松下電器産業、キヤノンといったソニーと競合すると 考えられる企業名が上位に現れ、WALKMANという製品名は現れなかった。さらにアップ ルの類義語には携帯音楽プレーヤーという製品カテゴリーも上位に現れたが、ソニーの類

40 アップルは2007年にアップルコンピュータよりApple Inc.(アップル)に改称。

類義語 コサイン類似度 類義語 コサイン類似度

i-pod 0.831242204 携帯音楽プレーヤー 0.682863474

携帯音楽プレーヤー 0.818595648 ネットワークウォークマン 0.665872812

mini 0.809828103 DIGA 0.654897094

アップルコンピュータ 0.748638391 ミニコンポ 0.647984743

photo 0.737503171 iPod 0.635259151

iTunes 0.670550227 プレーヤー 0.633379936

WALKMAN 0.635259151 i-pod 0.612213135

Store 0.622879803 MiniDisc 0.611296773

Music 0.613997102 MP3 0.606139123

有料配信ネットサービス 0.606758952 ハードディスク内蔵型 0.604582310

アップル 0.584962368 PlayStation 0.599443436

ハードディスク内蔵型 0.584587216 スゴ録 0.595024347

音楽配信サービス 0.575705647 VALUESTAR 0.588494718

マッキントッシュ 0.574407101 記憶容量 0.586081743

ネットワークウォークマン 0.572707415 mini 0.576130152 スティーブ・ジョブズ 0.559431791 gigabeat 0.575643778

名刺サイズ 0.556700826 photo 0.570724130

MP3 0.553927898 メディアプレーヤー 0.569875240

Apple 0.543958962 ヘッドホンステレオ 0.568400025

音楽配信 0.540111661 IXY 0.564414203

廉価版 0.528677166 TVチューナー 0.563937068

プレーヤー 0.525577068 DVD 0.563760281

有料音楽配信 0.519638300 Blu-Ray 0.559081554

音楽ネット配信 0.519593775 パソコン経由 0.555813909

記憶容量 0.517822504 音楽ネット配信 0.555065453

i-mac 0.517245531 SDカード 0.554355145

デジタルオーディオプレーヤー 0.512735188 ZEN 0.552984953 パソコン経由 0.508603215 マッキントッシュ 0.550675750

Mac 0.504922986 ダビング 0.549651504

デル 0.504340172 iTunes 0.547508061

1)網掛けは企業名。

2)word2vecの実行結果より上位30件を表示。

positive_word ⇒ iPod positive_word = WALKMAN

処理対象ベクトル: 処理対象ベクトル:

・単位 = 記事 ・単位 = 記事

・期間 = 2004 all ・期間 = 2004 all

53

表 5-2 アップルおよびソニーでのした2004年のword2vecの類義語抽出結果

義語には現れなかった。ソニーで得られた製品名の類義語はDVDレコーダーのスゴ録で、

製品カテゴリーではBlu-Rayや光ディスク、DVDであった。これは2004年当時のソニー が力を入れていた分野がDVDレコーダーやBlu-Rayであったからではないかと推測する。

次に、同じく第1部で「ヒット製品」として選択したPrius(プリウス)とその製造企業 であるトヨタ、Priusの製品カテゴリーであるハイブリッド車をそれぞれpositive wordに 与えて2004年の日本経済新聞の記事データを用いてword2vecを実行して得られた類義語 とコサイン類似度が表5-3である。2004年時点ではプリウスの新聞記事数の変化はなく、

前述のソニーのウォークマンと同じような条件と考えられる。

Prius で得られた類義語にはハイブリッド車という製品カテゴリーが 0.81という高い値

のコサイン類似度で最上位に現れている。その他に上位に現れた類義語でコサイン類似度 が0.7以上のものはCymru(カムリ)、アコード、クラウン、オデッセイ、カローラ、アベ ンシス、エスティマ、エスケープ、Vitz(ヴィッツ)、マークXなどである。アコード、オ デッセイ、エスケープを除くとほとんどがトヨタの製品名である。また企業名のトヨタも 現れている。

処理対象ベクトル: 処理対象ベクトル:

・単位 = 記事 ・単位 = 記事

・期間 = 2004 all ・期間 = 2004 all

positive_word ⇒ アップル positive_word = ソニー

類義語 コサイン類似度 類義語 コサイン類似度

iTunes 0.636223555 東芝 0.786344647

コネクト 0.615669250 松下電器産業 0.719805777

携帯音楽プレーヤー 0.607483983 キヤノン 0.669824719

Store 0.606293023 松下 0.648261070

Music 0.592372656 Blu-Ray 0.634111047

iPod 0.584962368 日立製作所 0.616925120

アップルコンピュータ 0.570137322 シャープ 0.615402937

i-pod 0.546431065 パイオニア 0.615248084

音楽配信サービス 0.540925503 三洋電機 0.601416826

photo 0.531721294 NEC 0.600000501

楽曲販売 0.522895217 日本ビクター 0.588965833

有料配信ネットサービス 0.519067645 富士通 0.586688519

オリコン 0.515100121 タイム・ワーナー 0.571953714

リアルネットワークス 0.515037179 次世代ゲーム機 0.567930162

音楽配信 0.508816123 フィリップス 0.561092794

音楽ネット配信 0.506919205 ディスプレイテクノロジー 0.559734464

マッキントッシュ 0.506598473 スゴ録 0.555687129

有料音楽配信 0.506173015 光ディスク 0.551856697

Napstar 0.494050026 TDK 0.550634503

Apple 0.491646856 DIGA 0.545437932

WALKMAN 0.489513814 出井伸之 0.545003653

楽曲 0.484898448 安藤国威 0.544452190

有線 0.466070563 久多良木 0.543116391

アプリックス 0.465827882 サムスン電子 0.540439069

ブロード 0.462383598 規格争い 0.539689660

有料配信 0.461941063 DVD 0.538999259

mini 0.459066510 日立マクセル 0.537852168

ネットワークウォークマン 0.454624355 メトロ・ゴールドウィン・メイヤー 0.536341906

廉価版 0.450369626 エプソン 0.535341382

テンアートニ 0.449173570 三菱電機 0.532919228

1)網掛けはアップルまたはソニーの製品名。

2)word2vecの実行結果より上位30件を表示。

54

表 5-3 Priusとトヨタ、ハイブリッド車での2004年のword2vecの類義語抽出結果

逆にトヨタという企業名で得られた類義語には Prius という製品名が現れている。また ホンダや日産、マツダといったトヨタと競合する企業名が類義語の上位に現れたが、同時 にカローラやCymru、クラウン、エスティマ、LEXUS(レクサス)などのトヨタのPrius 以外の製品名や、ハイブリッド車というPriusの製品カテゴリーも類義語に現れている。

ハイブリッド車で得られた類義語ではPriusがコサイン類似度0.81という高い値で現れ ている。他には製品名では同じくトヨタのCymruが類義語の上位に現れているが、コサイ ン類似度は0.66とPriusに比べるとかなり低くなっている。さらにハイブリッド車で得ら れた類義語にはホンダやトヨタ、フォードといった企業名も現れている。