次の表 1 は、全国の 1 住宅当たりの延べ面積(2018年、単位:$m^2$)に関するデータである。

表 1 1住宅当たりの延べ面積
 
北海道91石川127岡山106
青森122福井138広島94
岩手120山梨112山口102
宮城97長野122徳島111
秋田132岐阜122香川109
山形135静岡103愛媛100
福島113愛知95高知95
茨城108三重110福岡85
栃木107滋賀115佐賀112
群馬107京都87長崎97
埼玉87大阪77熊本101
千葉90兵庫93大分100
東京66奈良111宮崎94
神奈川78和歌山106鹿児島89
新潟129鳥取122沖縄76
富山145島根123
 

考え方と適用手法

データの個数が多いときには、まず、データの要約を行う。データの要約とはデータをまとめることである。データをまとめ、視覚的に特徴をみる方法に、度数分布表、ヒストグラムがある。

度数分布表(Excel関数:MAX, MIN, FREQENCY)

度数分布表とは、データの分布範囲を適当な間隔で分割し(階級化)、その分割された範囲に含まれる観測データの個数をもとにした表である。

  1. 観測データの中から最大値 (max) と最小値 (min) を探し、範囲 $R=\max-\min$ を求める。
  2. 階級の幅および階級の数 $n$ を定め、範囲 $R$ を $n$ 等分する。$n$ の値はデータの個数 $N$ にしたがって、$7\sim 15$ 程度とするのが一般的である。
  3. 境界値と階級値を決める。境界値とは 1 つ 1 つの級の境目の値、階級値とは境界と境界の中間すなわち各級の中央の値である。
  4. 各階級 $a_{i-1}\sim a_i$ に属するデータの個数 $f_i$(度数)を関数:FREQENCY を用いて求め、相対度数、累積度数、累積相対度数も求める。

なお、関数:FREQENCY は、各階級の境界値の上限値(第 1 階級であれば $a_0$ 以上~ $a_1$ 未満)の $a_1$ を引数に指定するが、関数としては $a_1$ 以下として度数を求める仕様となっているので注意が必要である。また、複数の値(各階級の度数)を返す配列関数なので、他の関数と違い少々特殊な扱いが必要となる。

表 2 度数分布表
境界値階級値度数相対度数累積度数累積相対度数
$a_0\sim a_1$$\frac{a_0+a_1}{2}$$f_1$$\frac{f_1}{N}$$f_1$$\frac{f_1}{N}$
$a_1\sim a_2$$\frac{a_1+a_2}{2}$$f_2$$\frac{f_2}{N}$$f_1+f_2$$\frac{f_1+f_2}{N}$
$\vdots$$\vdots$$\vdots$$\vdots$$\vdots$$\vdots$
$a_{n-1}\sim a_n$$\frac{a_{n-1}+a_n}{2}$$f_n$$\frac{f_n}{N}$$f_1+f_2+\cdots +f_n$$\frac{f_1+f_2+\cdots +f_n}{N}$

ヒストグラム

ヒストグラムとは、度数分布表をグラフ表現したもので、横軸に階級、縦軸に度数をとった棒グラフである。ヒストグラムから、データの分布の状態を読みとることができる。また、図 1 中には、合わせて累積相対度数を折れ線グラフ(右側第 2 軸)で示している。

histgram.png
図 1 敷地面積のヒストグラム
[授業計画に戻る]

添付ファイル: filehistgram.png 48件 [詳細]

トップ   編集 凍結解除 差分 履歴 添付 複製 名前変更 リロード   新規 一覧 検索 最終更新   ヘルプ   最終更新のRSS
Last-modified: 2023-07-10 (月) 09:24:40