高校数学:データxをax+bにするとどうなるか

こんにちは。今回は変量x, yのデータがax+b, cy+dに変換された場合どう変化するか見ていきましょう。

平均

データ x_1, x_2, x_3, \cdots,x_nの平均を\overline{x}とすると,
\overline{x}=\dfrac{1}{n}\left(x_1+x_2+x_3\cdots+x_n\right)
ここで, データをそれぞれa倍してb加えた平均\overline{x'}をとると,
\begin{array}{lll}\overline{x'}&=&\dfrac{1}{n}\{(ax_1+b)+(ax_2+b)+\cdots+(ax_n+b)\}\\&=&a\cdot  \underbrace{  \dfrac{1}{n}(x_1+x_2+\cdots+x_n)  }_{\LARGE{\overline{x}}} +\dfrac{1}{n}\cdot nb\\&=&a\overline{x}+b\end{array}
同様に, データ y_1, y_2, y_3, \cdots,y_nの平均を\overline{y}とすると,
このデータをそれぞれc倍してd加えた平均\overline{y'}は,
\overline{y'}=c\overline{y}+d
となる。
このようにデータxの平均はa倍されb増え, データyの平均はc倍されd増えます。

偏差

偏差はそれぞれのデータから平均を引いたものなので,
データxの偏差は,
\begin{array}{rcl}(ax_1+b)-(a\overline{x}+b)&=&a(x_1-\overline{x})\\(ax_2+b)-(a\overline{x}+b)&=&a(x_2-\overline{x})\\&\vdots&\\(ax_n+b)-(a\overline{x}+b)&=&a(x_n-\overline{x})\end{array}

データyの偏差も同様に,
\begin{array}{rcl}(cy_1+d)-(c\overline{y}+d)&=&c(y_1-\overline{y})\\(cy_2+d)-(c\overline{y}+d)&=&c(y_2-\overline{y})\\&\vdots&\\(cy_n+d)-(c\overline{y}+d)&=&c(y_n-\overline{y})\end{array}
このように偏差はa倍, c倍されます。

分散

分散は偏差の2乗の平均ですから, データxの元の分散をs_x^2とすると,
s_x^2=\dfrac{1}{n}\left\{\left(x_1-\overline{x}\right)^2+\left(x_2-\overline{x}\right)^2+\left(x_3-\overline{x}\right)^2+\cdots+\left(x_n-\overline{x}\right)^2\right\}
a倍してb加えたデータでは, 偏差がa倍されるので, その分散s'_x^2は,
\begin{array}{rcl}s'_x^2&=&\dfrac{1}{n}\left[\left\{a\left(x_1-\overline{x}\right)\right\}^2+\left\{a\left(x_2-\overline{x}\right)\right\}^2+\left\{a\left(x_3-\overline{x}\right)\right\}^2+\cdots+\left\{a\left(x_n-\overline{x}\right)\right\}^2\right]\\&=&a^2\cdot  \underbrace{  \dfrac{1}{n}\left\{\left(x_1-\overline{x}\right)^2+\left(x_2-\overline{x}\right)^2+\left(x_3-\overline{x}\right)^2+\cdots+\left(x_n-\overline{x}\right)^2\right\}  }_{\LARGE{s_x^2}} \\&=&a^2\cdot s_x^2\end{array}
同様に, c倍してd加えたデータでは, 偏差がc倍されるので, その分散s'_y^2は,
s'_y^2=c^2\cdot s_y^2
したがって, 分散は元の分散のa^2倍, c^2倍になる

標準偏差

標準偏差は分散の正の平方根なので,
分散がa^2倍, c^2倍されるなら標準偏差は|a|倍, |c|されます。絶対値が付いてるのはa<0, c<0の場合を考慮してのことです。
つまり, s'_x=|a|s_x, s'_y=|c|s_yになります。

相関係数

2つのデータx_1, x_2, x_3,\cdots, x_n, y_1, y_2, y_3, \cdots, y_nがあるとき, 共分散s_{xy}は次式で与えられます。
s_{xy}=\dfrac{1}{n}\left\{\left(x_1-\overline{x}\right)\left(y_1-\overline{y}\right)+\left(x_2-\overline{x}\right)\left(y_2-\overline{y}\right)+\cdots+\left(x_n-\overline{x}\right)\left(y_n-\overline{y}\right)\right\}
また, それぞれのデータの標準偏差をs_x, s_yとすると,
相関係数r
r=\dfrac{s_{xy}}{s_x\cdot s_y}
で与えられます。
データx, yの偏差はそれぞれa倍, c倍されているので, 共分散s'_{xy}は,
\begin{array}{rcl}s'_{xy}&=&\dfrac{1}{n}\left\{ac\left(x_1-\overline{x}\right)\left(y_1-\overline{y}\right)+ac\left(x_2-\overline{x}\right)\left(y_2-\overline{y}\right)+\cdots+ac\left(x_n-\overline{x}\right)\left(y_n-\overline{y}\right)\right\}\\&=&ac\cdot \underbrace{  \dfrac{1}{n}\left\{\left(x_1-\overline{x}\right)\left(y_1-\overline{y}\right)+\left(x_2-\overline{x}\right)\left(y_2-\overline{y}\right)+\cdots+\left(x_n-\overline{x}\right)\left(y_n-\overline{y}\right)\right\}  }_{\LARGE{s_{xy}}}  \\&=&ac\cdot s_{xy}\end{array}
このように, 共分散はac倍されます。
また, 標準偏差s'_x, s'_yはそれぞれ, s'_x=|a|s_x, s'_y=|c|s_yであるから, このときの相関係数r'は,
\begin{array}{rcl}r'&=&\dfrac{s'_{xy}}{s'_x\cdot s'_y}\\&=&\dfrac{ac\cdot s_{xy}}{|a|s_x\cdot |c|s_y}\\&=&\dfrac{ac\cdot s_{xy}}{|ac|\cdot s_x\cdot s_y}\\&=&\dfrac{ac}{|ac|}r\end{array}
となり, ac>0なら, 元の相関係数と変化がなく, ac<0なら相関係数の符号が反対になる (例:強い正の相関が強い負の相関になる) ことがわかる。
ちなみに, xのデータだけax+bに変換した場合の相関係数r''は,
r''=\dfrac{a}{|a|}r
となり, a>0なら元の相関係数と変わらず, a<0なら相関係数の符号が反対になる。

データがa倍されb加えると
①平均はa倍されb増える。
②偏差はa倍される。
③分散はa^2倍になる。
④標準偏差は|a|倍になる。
⑤相関係数は片方のデータをすべてa倍してb加えたときは\dfrac{a}{|a|}倍される。
a>0なら相関係数に変化なし, a<0なら相関係数の符号が反対になる。
もう一方のデータをすべてc倍してd加えたなら, \dfrac{ac}{|ac|}倍される。
ac>0なら相関係数に変化なし, ac<0なら相関係数の符号が反対になる。

以下関連記事

関連記事

高校数学:データの値がa倍されたらどうなる 高校数学:データの値がa増えたらどうなる

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

日本語が含まれない投稿は無視されますのでご注意ください。(スパム対策)