次の表 3 は、新生児の体重と胎盤重量に関するデータである。
No. | 新生児体重(g) | 胎盤重量(g) |
1 | 3470 | 760 |
2 | 2550 | 490 |
3 | 2920 | 580 |
4 | 2530 | 520 |
5 | 3280 | 550 |
6 | 2840 | 480 |
7 | 2520 | 400 |
8 | 3350 | 560 |
9 | 3610 | 590 |
10 | 3430 | 530 |
このデータをグラフで表現し、新生児体重と胎盤重量の関係を調べよ。
2つの量的な変数($x$ と $y$、ここでは新生児体重と胎盤重量)があるとき、この2つの変数の関係を視覚的にとらえて把握するためには、散布図と呼ばれるグラフを適用する。また、変数の相関を示す指標として相関係数がある。
散布図とは、2つの変数のうち、一方を横軸にとり、もう一方を縦軸にとって、対応するデータを1点ずつプロットしたグラフである。散布図から、相関関係の有無を視覚的に確認することができる。
相関係数は、一般に $r$ で表され、$-1\leq r\leq 1$ の値をとる。相関係数の符号は、正のときには正の相関関係を、負のときには負の相関関係があることを示している。
相関関係の強さは、$|r|$ または $r^2$ で評価する。どちらも1に近いほど相関が強いことを意味する。相関関係が存在しないときには、相関係数は0に近い値を示す。
ここでは、次式にもとづく表計算から相関係数を求める。
\begin{eqnarray} r &=& \displaystyle{\frac{S(xy)}{\sqrt{S(x)S(y)}}} \\ S(x) &=& \sum_{i=1}^n{(x_i-\bar{x})^2} \qquad\qquad\quad\cdots xの偏差平方和 \\ S(y) &=& \sum_{i=1}^n{(y_i-\bar{y})^2} \qquad\qquad\quad\cdots yの偏差平方和 \\ S(xy)&=& \sum_{i=1}^n{(x_i-\bar{x})(y_i-\bar{y})} \qquad\cdots xとyの偏差平方和 \end{eqnarray}