共分散と相関係数
相関係数 \(r\) は、
となります。
また、\(x~,~y\) の共分散 \(C_{xy}\) の求め方は、
\(x\) の偏差 | \(y\) の偏差 | \(x\) の偏差× \(y\) の偏差 |
\(\vdots\) | \(\vdots\) | \(\vdots\) |
この表より、\(x\) の偏差× \(y\) の偏差の和をデータの個数で割ったものが共分散 \(C_{xy}\) となります。
問題解説:相関係数
① | ② | ③ | ④ | ⑤ | ⑥ | |
\(x\) | \(9\) | \(6\) | \(2\) | \(5\) | \(8\) | \(6\) |
\(y\) | \(5\) | \(2\) | \(7\) | \(4\) | \(4\) | \(8\) |
データ \(x\) の \(6\) 個の平均値は、$$~~~~~~\frac{9+6+2+5+8+6}{6}$$$$~=\frac{36}{6}$$$$~=6$$データ \(x\) の偏差と偏差の2乗を表にまとめると、
\(x\) | 偏差 | 偏差の2乗 |
\(9\) | \(3\) | \(9\) |
\(6\) | \(0\) | \(0\) |
\(2\) | \(-4\) | \(16\) |
\(5\) | \(-1\) | \(1\) |
\(8\) | \(2\) | \(4\) |
\(6\) | \(0\) | \(0\) |
表より、偏差の2乗の合計は、$$~~~~~~9+0+16+1+4+0$$$$~=30$$よって、分散は$$~~~30\div6=5$$これより、\(x\) の標準偏差 \(S_x\) は、$$~~~S_x=\sqrt{5}$$
次に、データ \(y\) の \(6\) 個の平均値は、$$~~~~~~\frac{5+2+7+4+4+8}{6}$$$$~=\frac{30}{6}$$$$~=5$$データ \(y\) の偏差と偏差の2乗を表にまとめると、
\(y\) | 偏差 | 偏差の2乗 |
\(5\) | \(0\) | \(0\) |
\(2\) | \(-3\) | \(9\) |
\(7\) | \(2\) | \(4\) |
\(4\) | \(-1\) | \(1\) |
\(4\) | \(-1\) | \(1\) |
\(8\) | \(3\) | \(9\) |
表より、偏差の2乗の合計は、$$~~~~~~0+9+4+1+1+9$$$$~=24$$よって、分散は$$~~~24\div6=4$$これより、\(y\) の標準偏差 \(S_y\) は、$$~~~S_y=\sqrt{4}=2$$
次にデータ \(x\) の偏差とデータ \(y\) の偏差とそれらの値のかけ算を表にまとめると、
\(x\) の偏差 | \(y\) の偏差 | 偏差のかけ算 |
\(3\) | \(0\) | \(0\) |
\(0\) | \(-3\) | \(0\) |
\(-4\) | \(2\) | \(-8\) |
\(-1\) | \(-1\) | \(1\) |
\(2\) | \(-1\) | \(-2\) |
\(0\) | \(3\) | \(0\) |
表より、\(x\) の偏差と \(y\) の偏差のかけ算の合計は、$$~~~~~~0+0+(-8)+1+(-2)+0$$$$~=-9$$これをデータの個数 \(6\) で割ると共分散 \(C_{xy}\) となるので、$$~~~C_{xy}=-9\div6=-1.5$$
以上より、相関係数 \(r\) は$$~~~~~~\frac{-1.5}{\sqrt{5}\times2}$$ここで、\(\sqrt{5}=2.23\) より、$$~=\frac{-1.5}{2.23\times2}$$$$~=-\frac{1.5}{4.46}$$$$~=-0.336\cdots$$
よって、答えは \(-0.34\) となります。
今回のまとめ
相関係数を求めるときは、2種類のデータの標準偏差を求める表と共分散を求める表を書いて考えましょう。