第 8 章 胃癌取扱い規約に関して 76
12.2 度数分布
データをカテゴリー毎に表にまとめ,それをグラフで表現することによって,データの 分布状態を視覚的に把握することが出来る.
12.2.1 質的データの度数分布
胃がんX線検診の精検受診者の二次精密検査(内視鏡検査)結果は質的データであるの で,検査結果別に度数と相対頻度をまとめるとその特徴が明らかとなる(表12.1).なお 相対頻度とは,合計に占める度数の割合である.相対頻度の大きさを円の角度で表した円 グラフ(図12.1)で表現することもできる.
12.2.2 量的データの度数分布
表12.2は,二次精密検査で胃癌と診断された受診者9名の年齢である.年齢すなわち量 的データをそのまま眺めても,その特徴は分かりづらい.そこで,年齢を区分けして表現 すると特徴が分かりやすくなる.表12.3は,幹葉(かんよう)表示と呼ばれる表示方法で ある.10歳単位の階級を木の幹に例え,その階級に入る受診者年齢の一桁目をその幹に 繁る葉として表現することで,データがもつ情報の漏れがなくなるという特徴がある.し かし,データが多くなると全てを表示することが難しい.その場合はやはり度数分布表が
表12.1 二次精密検査結果の度数分布表 二次精密検査結果 度数 相対頻度
胃癌 9 1.54%
非上皮性悪性腫瘍 0 0.00%
胃腺腫(異型上皮) 0 0.00%
胃ポリープ 33 5.66%
胃潰瘍(瘢痕を含) 94 16.12%
その他の良性疾患 313 53.69%
異常なし 26 4.46%
不明 0 0.00%
その他 104 17.84%
食道癌 4 0.69%
合計 583 100.00%
図12.1 2次精密検査結果の相対頻度円グラフ
便利である.表12.3を度数分布表で示したものが表12.4である.累積相対度数とは,低 い階級の度数を足し上げた相対度数のことで,ある階級の上限値までの相対度数のことで ある.図12.2にはヒストグラムを示した.ヒストグラムとは度数分布を視覚的に表現し た者で,度数分布表を棒グラフにしたものである.一般的に,縦軸には度数または相対度 数を配置し,横軸には階級に対応する変数を配置する.度数分布表もヒストグラムもとも に,データの全体的な分布の様子を見るために重要な分析方法の1つである.
第12章 データと記述統計 110
表12.2 胃癌患者の年齢 受診者 年齢(才)
No1 54
No2 61
No3 66
No4 50
No5 68
No6 59
No7 56
No8 57
No9 60
表12.3 胃癌患者年齢の幹葉表示
幹 葉
年齢
50歳前半 4 0
50歳後半 9 6 7
60歳前半 1 0
60歳後半 6 8
表12.4 胃癌患者年齢の度数分布表 年齢階級 度数 相対度数 累積%
50-54 2 22.2% 22.2%
55-59 3 33.3% 55.5%
60-64 2 22.2% 77.7%
65-69 2 22.2% 99.9%
計 9 100.0%
12.2.3 度数分布曲線
図12.2に示した胃癌患者年齢のヒストグラムは,データが9人分だったので,階級の幅 をあまり細かくできずでこぼこした形を呈している.しかし,もしデータ数が多く階級の 幅を小さくすれば,ヒストグラムはなめらかな曲線を描く.集団のデータの分布の様子を 曲線で表したものを度数分布曲線または単に分布曲線という.図12.3は,2009年にある
図12.2 胃癌患者年齢のヒストグラム
検診施設で実施された胃がんX線検診受診者年齢を分布曲線で表したものである.