こんにちは。相城です。今回は分散と標準偏差のお話です。
平均
データの平均をとすると,
偏差とは
偏差は, 一言でいえば平均との差の値です。
データの平均値をとするとき,
を平均値からの偏差といいます。
分散s^2
分散とはデータの散らばり度合いを表す値です。偏差ではデータと平均の違いを求めると正の数だったり, 負の数だったりするので, 平均との違いがあったとしても, もう一方で平均との違いがなら, そのまま加えると, 見かけ上, 違いが0になってしまいます。それでは都合が悪いので, 偏差を2乗して正負の符号を取りはらって計算します。
ですから, 分散は, 偏差の2乗の平均値になります。したがって
で求められます。
ちなみに, 平均をとるのは, 標本数が違っても対比できるようにするためです。
偏差が平均との差を表しているので,この値が小さければ平均に近い値が多く, 大きければ平均との差が大きい値のものが多いことになります。
また, 分散の右辺を展開していくと,
※下線部はと同値
としても分散は求められます。
標準偏差s
標準偏差は分散の正の平方根であるから, 標準偏差の意味は分散と同じで, データの散らばり度合いを表します。分散はデータを2乗しているので, 例えばデータが長さ(単位m)なら, 2乗するので単位が面積の単位(m)になってしまいます。それではちょっと都合が悪いので, 単位を元に戻す意味で, 分散の正の平方根をデータの散らばり度合いとして, 標準偏差を一般的に用います。
または,
具体的にやってみよう
5人のテスト結果1
45, 65, 60, 95, 85
平均
分散
もう一つの分散の公式を用いて求めてみると,
同じになりましたね。
したがって, 標準偏差は,
因みに点数にばらつきがないように設定してみると
5人のテスト結果2
70, 70, 65, 70, 75
の場合, 結果だけ示すと
平均
分散
標準偏差
テスト結果1より分散, 標準偏差の値は小さくなっています。
このことは, テスト結果2のほうがテスト結果1に比べ, 平均点に近い点数が多く, ばらつきが少ないことを意味しています。
偏差値の計算
偏差値を求めてみよう
偏差値は平均との差に10をかけて, 標準偏差で割り, 50を足せば求まります。はじめに記したテスト結果1の5人の偏差値は以下です。
平均との差なので, 平均点と同じであれば偏差値はちょうど50になりますね。