1.基礎統計量
• 資料の代表値と散布度
• 代表値
– 平均・モード・メジアン – 平均とは何か?
• 散布度
– 標準偏差
– 高次のモーメント:歪度・尖度
1.基礎統計量
• 物理的なデータを縮約するには、静的
な(代表値:平均)成分と動的な(散 布度:変動・偏差)成分とに分けて考 察すると都合が良い。
基礎統計量
代表値
平均値 mean 中央値 median 最頻値 mode 最大値・最小値
分散ー標準偏差 var/std 平均偏差 mean dev.
範囲(Max-Min) 散布度
札幌の日平均気温の時系列(1976-1997)
平均値
平均
頻度分布
中央値(Median) 分位 p-quantile
Median 50%
ある性質の水が占める空間の面積で 重み付けした大きさ
水温
塩分
密度
Rho(T,S,p)
最頻値(Mode) モード水 Mode Water
平均とは何か? 平均と偏差に分けて解釈する
2004年は暑かった。。。
気象庁報道発表資料(2005年2月2日付け)より
気象庁の統計では、西暦の下1ケタが1の年から30年間の平均を「平年値」とするこ とになっており、「平年差」とは平均値から平年値を差し引いた値(「平年偏差」と もいう)を意味する。2001年1月1日から2010年12月31までについては、1971年か ら2000年までの平均値を「平年値」として使用する。
平均とは何か? 時間平均と空間平均の類似性
500hPa面でのジオポテンシャル高度分布
ジオポテンシャル高度 〜 高さ
ニューステージ地学図表
平均とは何か? 時間平均と空間平均の類似性 偏西風の蛇行
「渦」がいっぱい!
ニューステージ地学図表
平均とは何か? 時間平均と空間平均の類似性 平均+偏差 = 帯状平均流+渦
H L H L
波打っている
H L
平均とは何か? 平均の階層性
より長いスケールでは 平均も変動する
適切な平均
climatological mean+ anomaly
絶対値=平均値+偏差
いつもより 暖水
いつもより 南東貿易風 冷水
つよい
南東貿易風 よわい
http://www.pmel.noaa.gov/tao/elnino/el-nino-story.html
anomaly
現象を代表するために
領域平均値をインデックスとする
•エルニーニョ監視速報でいうところの「エルニーニョ監視海域」は「B海域」にあたる。
http://www.data.kishou.go.jp/climate/elnino/index/regionmap.html
Nino3 index
エルニーニョ監視海域の海面水温と南方振動指数の推移(1976年1月〜2000年12月)。
(1) エルニーニョ監視海域の海面水温の基準値との差(℃)。折線は月平均値、滑らかな太線は5か月移動平均値を 示し、正の値は基準値より高いことを示す。赤はエルニーニョ現象の発生期間、青はラニーニャ現象の発生期間。
(2) 南方振動指数。太線は5か月移動平均値を示す。
http://www.data.kishou.go.jp/climate/elnino/faq/qa/sstsoi.html
SO index
偏差
散布度 − 標準偏差
札幌の日平均気温の時系列(1976-1997)
平均値 標準偏差
海流の平均場
海面高度変動の標準偏差
ここでの海面高度とは潮汐成分や気圧成分を除いたもの
平均値と散布度
500hPaジオポテンシャル高度平均場
8.5km Low 9km
High 300hPaのジオポテンシャル高度の平均場
SACRp3
original Slow
Longer than10days
Baroclinic
Between 2.5 and 6 days
FastBetween 1 and 2 days
100 100
50 20
標準偏差 time-filtered 500 hPa height (m)
SACR p58 140
Var(X) ~Var(Xs) + Var(Xb) +Var(Xf)
変数の頻度分布と歪度 (skewness)
高次モーメント
右すそが長い 左右対称 左すそがながい
μ x
γ1 >0 γ1=0 γ1<0
変数の頻度分布と尖度 (kurtosis)
なだらか 正規分布 とんがり
β2 <3 β2=3 β2 >3
歪度 Skewness
Geopotential height Sea-level pressure
stormtrack 太平洋
positive negative
Nakamura and Wallace 1991 J.Atmos.Sci, 48, 1441-1448
ストームトラックの高緯度側ではskewnessは正で、
低緯度側では負になっている。
高緯度 58N
低緯度 23N
高緯度のブロッキングと 低緯度の切離低気圧を示
している(と解釈している)
まとめ
• 絶対値は平均と偏差とに分けられる。
• 平均とは、時間・空間を問わず、見たいスケー ルを切り分ける操作である。(スケールによっ て主として働く力学が違う)
• 分散はデータのばらつき具合を示すもので、
変動の強さの指標となる。
• 場合によってはより高次の統計量が有効なこ とがある。