第1章 データの表示
第1.1節
1変量の場合
ヒストグラム
得られたデータはそのままでは数値の雑然とした集まりである。例えば、テストの点数(V1で表す)として次のようなデータ(表1.1.1)が得られたとする。
表1.1.1 テストの点数
|
66 |
59 |
62 |
64 |
63 |
68 |
65 |
59 |
68 |
64 |
|
65 |
51 |
67 |
64 |
83 |
59 |
61 |
62 |
57 |
72 |
|
65 |
64 |
54 |
60 |
53 |
65 |
67 |
60 |
53 |
79 |
|
74 |
53 |
61 |
68 |
75 |
50 |
57 |
55 |
66 |
56 |
|
55 |
61 |
70 |
71 |
49 |
69 |
70 |
80 |
73 |
72 |
表1.1.1のままでは点数がどのように分布しているのか様子がわかりにくい。それを図1.1.1のようにグラフとして表すとデータの分布の様子が視覚的によくわかる。

図1.1.1 表1.1.1のヒストグラム(SPSSで作成)
図1.1.1のようなグラフはヒストグラムと呼ばれている。ヒストグラムでは、横軸は数値であり、メモリは等間隔になっている。横軸に記されている代表値のとり方についてはここをクリックして表示されるページを参照のこと。
棒グラフと折れ線グラフ
これに対して棒グラフでは、横軸として等間隔に目盛られた数値以外のものをとることができる。例えば、表1.1.2の平成7年における国勢調査の人口データ
表1.1.2 平成7年国勢調査
|
地域 |
東京都 |
鹿児島県 |
鳥取県 |
|
|
人口(万人) |
1177.4 |
179.4 |
61.5 |
78.1 |
を棒グラフで表すと図1.1.2のようになる。

図1.1.2 棒グラフ(Excelで作成)
上の棒グラフでは、横軸は地名である。
ヒストグラムでは縦軸は度数あるいは比率であるが、棒グラフではそれ以外のものをとることができる。
ヒストグラムあるいは棒グラフはグループ別の数値を視覚化して表示するものであるが、横軸を時間軸にとって時間の経過にともなう変化を表すときは折れ線グラフが用いられる。
表1.1.3 人口問題研究所による調査
|
調査年次 |
1940 |
1952 |
1957 |
1962 |
1967 |
1972 |
|
平均出生児数 |
4.27 |
3.5 |
3.6 |
2.83 |
2.65 |
2.2 |
表1.1.3のデータを折れ線グラフで表したものが図1.1.3のグラフである。

図1.1.3 折れ線グラフ(Excelで作成)
第1.2節 2変量の場合: 散布図
データが数値の対
、・・・、
として得られたときには、
および
それぞれについて図1.1.1のようなヒストグラムを描けばそれぞれの変量についての分布の様子を知ることができる。しかし、2つの変量が別々に表示されているのでそれらの関係はわからない。例えば、体重と身長のデータ(表1.2.1)について考えてみる。
表1.2.1 2変量(体重と身長)のデータ
|
(70, 168) |
(68, 165) |
(62, 159) |
(56, 156) |
(70, 170) |
(64, 162) |
(59, 162) |
(70, 169) |
(68, 168) |
(69, 170) |
|
(67, 168) |
(63, 166) |
(58, 163) |
(74, 170) |
(65, 168) |
(60, 160) |
(65, 165) |
(72, 175) |
(61, 164) |
(77, 174) |
|
(68, 164) |
(64, 161) |
(70, 166) |
(47, 147) |
(66, 165) |
(68, 170) |
(73, 174) |
(74, 172) |
(63, 164) |
(83, 182) |
|
(58, 159) |
(64, 166) |
(67, 167) |
(75, 174) |
(67, 163) |
(68, 166) |
(68, 167) |
(66, 165) |
(63, 165) |
(55, 154) |
|
(61, 163) |
(60, 160) |
(62, 164) |
(62, 160) |
(59, 160) |
(51, 155) |
(59, 163) |
(68, 170) |
(56, 157) |
(79, 180) |
体重と身長それぞれの分布の様子をヒストグラムで表すと図1.2.1および図1.2.2のようになる。これらの図から、体重あるいは身長それぞれの値の分布の様子はわかるが、2つの変量の関係はわからない。

図1.2.1 体重のヒストグラム 図1.2.2 身長のヒストグラム
2つの変量の値をX座標、Y座標として散布図を描いたものが図1.2.3である。この散布図を見ると、身長が高いほど体重も重くなっているようすがよくわかる。

図1.2.3 散布図(SPSSで作成)
統計学の入門書として<岡本安晴「データ分析のための統計学入門――統計学の考え方――」おうふう、2009>を用意している。
参考文献
鈴木義一郎(1997).グラフィック統計学.実務出版.