こんにちは。相城です。今回は分散と標準偏差のお話です。
平均
データ
の平均を
とすると,![]()
偏差とは
偏差は, 一言でいえば平均との差の値です。
データ
の平均値を
とするとき, ![]()
を平均値からの偏差といいます。
分散s^2
分散とはデータの散らばり度合いを表す値です。偏差ではデータと平均の違いを求めると正の数だったり, 負の数だったりするので, 平均との違いが
あったとしても, もう一方で平均との違いが
なら, そのまま加えると, 見かけ上, 違いが0になってしまいます。それでは都合が悪いので, 偏差を2乗して正負の符号を取りはらって計算します。
ですから, 分散
は, 偏差の2乗の平均値になります。したがって![]()
で求められます。
ちなみに, 平均をとるのは, 標本数が違っても対比できるようにするためです。
偏差が平均との差を表しているので,この値が小さければ平均に近い値が多く, 大きければ平均との差が大きい値のものが多いことになります。
また, 分散
の右辺を展開していくと, ![]()
![]()
![]()
※下線部は
と同値
としても分散は求められます。
標準偏差s
標準偏差
は分散の正の平方根であるから, 標準偏差の意味は分散と同じで, データの散らばり度合いを表します。分散はデータを2乗しているので, 例えばデータが長さ(単位m)なら, 2乗するので単位が面積の単位(m
)になってしまいます。それではちょっと都合が悪いので, 単位を元に戻す意味で, 分散の正の平方根をデータの散らばり度合いとして, 標準偏差を一般的に用います。![]()
または, ![]()
具体的にやってみよう
5人のテスト結果1
45, 65, 60, 95, 85
平均![]()
![]()
分散![]()
![]()
![]()
![]()
もう一つの分散の公式を用いて求めてみると, ![]()
![]()
![]()
![]()
![]()
![]()
同じになりましたね。
したがって, 標準偏差
は,![]()
因みに点数にばらつきがないように設定してみると
5人のテスト結果2
70, 70, 65, 70, 75
の場合, 結果だけ示すと
平均![]()
分散![]()
標準偏差![]()
テスト結果1より分散, 標準偏差の値は小さくなっています。
このことは, テスト結果2のほうがテスト結果1に比べ, 平均点に近い点数が多く, ばらつきが少ないことを意味しています。
偏差値の計算
偏差値を求めてみよう
偏差値は平均との差に10をかけて, 標準偏差で割り, 50を足せば求まります。はじめに記したテスト結果1の5人の偏差値は以下です。![]()
![]()
![]()
![]()
![]()
平均との差なので, 平均点と同じであれば偏差値はちょうど50になりますね。
数樂管理人のブログ 
