め
,
シーズン序盤では野手間での打撃成績の差が少ない中で,
それらの数が多い打者の評価値だけ が大きくなったことが考えられる.
また,
分析者は時点ごとの散布図を見比べ,
シーズン前半では 明確に各グループが分離されていないと考えた.
そのため,
次のような手順により打撃タイプごと の傾向をより強調しようと試みた.
分析者は
,
シーズンを通して活躍した野手の凸包に絶対的操作を行い, X
軸の値が大きい範囲 にそれらが配置されるようにωを修正した.
また,
各打撃タイプに該当すると判断した野手のグ ループごとの凸包に対して,
相対的操作を用いてそれらがY
軸の上下端に配置されるようにαを 変更した後,
明示的にαの変更をωに反映した.
パラメータ調整後のt=
2018/04/15
におけるインタフェース画面を図31(b)
に示す.
図中の赤 枠は,
調整前後で特筆すべき強調度合いの変化が確認された属性に対応する.
散布図より,
分析者 の意図と対応して, X
軸の値が大きい位置にシーズンを通して活躍した野手の凸包は調整前からX
軸の値が大きい領域に位置していたが,
分析者の意図を反映し, X
軸の値が2.2
以上の領域まで 広がっていることが確認できる.
また, Y
軸の値の大きい方向に俊足巧打タイプ,
小さい方向に強 打者タイプに該当する野手が移動し,
両方の打撃タイプに対応する凸包が調整前より分離して表 示されていることが確認できる.
これらの結果より,
相対的操作・絶対的操作により分析者の意図 が投影上に反映されたと考える.
また,
属性値の強調度合いωを分析すると, X
軸における打席数(PA)
の強調度合いはシーズン序盤の方が0.5
程度であり,
シーズン後半では0.3
程度と,
データ セットの前半では重み付けが大きく,
後半にいくにつれて小さくなることがアニメーション再生 により確認された.
分析者はこの傾向を,
シーズン全体で安定して活躍する打者は,
シーズン序盤 から安定して試合に出場する必要があるという意味で解釈した. Y
軸では,
三塁打(3B)
や盗塁数(SB)
などの属性が更新前よりもプラス方向に高く重み付けされているため.
俊足巧打タイプの野 手の特性と解釈した.
一方で,
二塁打(2B)
や本塁打(HR)
などの属性は,
更新前後共にマイナス方 向に重み付けされているため,
強打者タイプの特性と解釈した.
また,
図31(b)
には現れていない が, Y
軸における強調度合いの時間的変化に関して,
四球はシーズン前半で強調度合いがプラス方 向であったが段階的に減少し,
後半ではマイナス方向へと変化する傾向が確認できた.
分析者は指標の叩き台となるパラメータωの特性とドメイン知識の対応を確認した上で
,
最 終的に構築する指標を検討した.
例えば,
打撃成績の評価指標として用いられる塁打数*15や出塁 率*16の計算式を参考に,
野手の活躍度合いを絶対値で,
打撃タイプを符号で表現する式(11)
のよ うな指標Btypeを作成した.
分子に採用した属性と重みはY
軸から得られた知見に基づいている.
また, X
軸から得られた知見に基づき,
シーズン前半では規定打席数*17を分母として打席数の傑 出度合いを評価し,
後半では通常の出塁率と同様に,
各野手の打席数を分母としている.
Btype=
単打×2+盗塁数×2+三塁打×2−(二塁打+本塁打×3)
規定打席数 (シーズン前半)
単打×2+盗塁数×3+三塁打×3−(四球+二塁打+本塁打×4)
打席 (シーズン後半) (11) 探索的分析に基づき作成された指標 Btype の有効性を
, Baseball-Reference.com
より取得した2019
年のデータセットを用いて確認した.
データセットの取得方法や特性は可視化に用いたもの と同様であるが,
Btypeを算出するために各属性値の正規化処理は行わなかった.
*15塁打=単打×1+二塁打×2+三塁打×3+本塁打×4
*16出塁率=(安打+四球+死球)÷(打数+四球+死球+犠飛)
*17試合数×3.1
俊足巧打タイプ
Silver Slugger 受賞者
強打者タイプ
PA: シーズン前半で強く重み付け
𝜔 𝑡 (Y) 𝜔 𝑡 (X)
𝜔 𝑡 ′(Y) 𝜔 𝑡 ′(X)
α→ ω
(a) (b)
SF HBP
BB: 後半で負方向に変化 SB
HR 3B 2B 1B PA
図
31. MLB
データセットにおける野手の傾向ごとの凸包とパラメータ調整結果(t =
2018 / 04 / 15): (a)
パラメータ調整前(b)
パラメータ調整後2019
年シーズン中に公式試合に出場した野手について,
出場試合数,
Btype,
出塁率,
塁打数を算 出した結果を表5
と6
に示す.
各において,
Btypeが上位10
名の野手と,
下位10
名の野手を示して いる.
表5
はシーズン前半(t
=2018/05/13)
のランキング,
表6
は後半(t
=2018/09/16)
のラン キングにそれぞれ対応する.
両者を比較すると, Dee Gordon
やGary S´anchez
などの野手は年間 を通じてランキングの上位,
下位に共通して存在することが確認できる.
そのため,
Btypeは出場試 合数などのシーズン中における時間的特性の影響を受けずに,
これらの野手を評価できると解釈 できる.
各表において. Silver Slugger Award
やGold Glove Award
のような,
年間を通して活躍し た野手に与えられる賞の受賞者や,
三塁打や四球のような,
特定の打撃成績に関して突出した成績 を持つ野手が上位や下位に存在することが確認できる.
例えば,
Btypeが上位のAdalberto Mondesi
や
Mallex Smith
などの野手は,
三塁打や二塁打,
盗塁などの打撃成績で突出した成績を残している
.
これらは,
前述の俊足巧打タイプに該当する野手の特徴と一致する.
また, Jorge Soler
やAlex
Bregman
のようなBtypeが下位の野手は本塁打や四球などで突出した成績を残しているため,
強打者タイプの特徴と一致する
.
そのため,
Btypeを野手の評価指標として利用することで,
指標構築 の目的である 野手のシーズンを通した活躍度合いと打撃タイプの分類”
が実現できると考える.
以上の分析および指標構築事例より
,
提案フレームワークを通じて,
分析者は自身の意図を投影 に反映しながら各属性値の強調度合いを調整できることが示されたと考える.
また,
得られたパラ メータωのたたき台としての活用に基づく,
非線形なものも含めた評価指標の構築可能性が示さ れたと考える.
表
5. 2019
年シーズンにおける野手成績の各種指標による評価(5 / 13)
野手名 出場試合数 Btype 塁打数 出塁率 備考 上位
Dee Gordon 30 0.565 44 0.328
Tim Anderson 24 0.466 59 0.379 首位打者
Adalberto Mondesi 29 0.441 62 0.308 最多三塁打
Hanser Alberto 23 0.427 29 0.342
Leury Garc´ıa 24 0.406 39 0.319 最多犠打
David Fletcher 28 0.376 36 0.351
Elvis Andrus 27 0.346 63 0.425 最多犠飛
Whit Merrifield 30 0.344 59 0.343 オールスター選出
Josh Reddick 25 0.333 44 0.404
Rafael Devers 30 0.323 38 0.381 最多二塁打
下位
Daniel Vogelbach 37 -0.409 68 0.390 オールスター選出
Mitch Moreland 37 -0.369 70 0.321
Gary S´anchez 26 -0.291 63 0.346 オールスター選出
Alex Bregman 41 -0.270 84 0.383 最多四球,オールスター選出, Silver Slugger
Robinson Chirinos 32 -0.218 51 0.397
Luke Voit 40 -0.212 66 0.354
George Springer 43 -0.210 112 0.410 オールスター選出, Silver Slugger
Josh Donaldson 39 -0.207 63 0.379
Jorge Soler 42 -0.207 83 0.316 最多出場,最多本塁打,最多三振
Khris Davis 39 -0.205 73 0.312
表
6. 2019
年シーズンにおける野手成績の各種指標による評価(9 / 16)
野手名 出場試合数 Btype 塁打数 出塁率 備考 上位
Dee Gordon 117 0.494 141 0.302
Myles Straw 56 0.484 37 0.375
Adalberto Mondesi 102 0.449 176 0.289 最多三塁打
Harold Castro 97 0.431 136 0.304
V´ıctor Reyes 69 0.421 119 0.336
Brad Brach 53 0.400 1 0.200
Mallex Smith 134 0.399 171 0.299 盗塁王
Erik Gonz´alez 53 0.397 45 0.295
Delino DeShields 118 0.387 124 0.319
Elvis Andrus 147 0.381 236 0.313 最多犠飛
下位
Mitch Garver 93 -0.106 196 0.365 Silver Slugger
Miguel San´o 105 -0.096 219 0.346
Gary S´anchez 106 -0.070 208 0.316 オールスター選出
Jorge Soler 162 -0.046 335 0.352 最多出場,最多本塁打,最多三振
Max Kepler 134 -0.030 272 0.336
Matt Olson 127 -0.022 263 0.351 Gold Glove
Daniel Vogelbach 144 -0.020 203 0.341 オールスター選出
Rougned Odor 145 -0.015 229 0.282 最多三振
Nelson Cruz 120 -0.015 290 0.392 Silver Slugger
Welington Castillo 72 -0.012 96 0.267
6 評価実験
本章では
,
提案インタフェースの有効性を検証するために実施した, 2
つの評価実験の概要とそ の結果を述べる.
評価実験の実験タスクは, 5
章のケーススタディで示したインタフェースの使用 例に関する仮説に基づき定義した.
実験は人工データを用いて行い,
実験協力者には特定のドメイ ン知識に依存しないタスクの実行を行ってもらった. 6.1
節では,
ケーススタディに基づく実験の 要件定義を行い, 6.2
節で両実験について共通する実験環境や設定を説明する. 6.3
節と6.4
節に,
各実験の実験方法と設定を示す. 6.5
節, 6.6
節では実験結果を示し,
インタフェースの有効性を定 量的・定性的側面から考察する.
6.1 ケーススタディに基づく要件定義
ケーススタディにおいて
,
分析者は少数のオブジェクト間の比較には軌跡表現を用いていた.
一 方で,
複数のデータから特定の傾向のものを探すためには,
スケッチベース入力により凸包を作成 した後に,
詳細ビューで全体的な傾向を確認し,
軌跡の表示や選択に基づき興味深いオブジェクト を探索していた.
この分析行動より,
プロトタイプインタフェースの有効性に関する次の仮説が得 られる(
仮説1).
分析者は
,
プロトタイプインタフェースの複数の可視化手法を適切に使い分けることで,
多次元時系列データを効率的に探索できる. ”
また
,
分析者は,
提案フレームワークのパラメータ調整手法を次のように組み合わせていた.
• 絶対的操作
:
特定のオブジェクトに対する知識に基づき,
それを強調するように属性値の強 調度合いを調整する.
その後,
対象と他オブジェクトの移動度合いや,
それらの位置関係の 変化を分析し,
後続のパラメータ調整や指標構築に活用できる属性を発見する.
• 相対的操作
:
外れ値と属性値の関連を確認するタスクや,
オブジェクト間の位置関係を調整 するタスクのような,
探索的分析を通じて発見された視覚的傾向に基づき,
それらをより強 調するようにオブジェクト間の相対的な位置関係を微調整する.
絶対的操作や
,
軌跡や凸包に対する相対的操作は投影に大きな変更を加えるという目的で,
探索 の初期時点で行われていた.
一方で.
ノードを対象とした相対的操作や,
棒グラフに基づく重みの 調整は,
探索後半における配置の微調整を目的として用いられる傾向が確認された.
各パラメータ 調整手法について,
分析者は棒グラフの操作に基づく間接的なパラメータ調整よりも,
直接操作に 基づく手法の方が調整すべきパラメータの探索コストが軽減され,
使いやすかったと回答した.
ま た,
軌跡の直接操作に基づき,
複数時点に対してパラメータを調整できるため,
各時点についての 調整が必要な棒グラフと比べてインタラクションコストが軽減されたと回答した.
上述の分析行動は
, 3.7
節で示したパラメータ調整の目的とも一致する.
そのため,
パラメータ調 整に関する分析行動より,
次の仮説が得られる(
仮説2).
分析者は
,
提案フレームワークの相対的操作と絶対的操作,
棒グラフによるパラメータ調整を 使い分けながら,
意図や知識を投影に反映するためのパラメータを効率的に獲得できる. ”
このとき