標準偏差とは?求め方や平均との関係もわかりやすく解説
標準偏差とは、データの特徴を示した数値のひとつです。計算することで、対象のデータが平均値からどれくらい散らばっているかがわかります。
本記事では、標準偏差の意味や求め方、役立つ場面などについてわかりやすく解説します。
標準偏差(シグマ)は投資に関係する
標準偏差(シグマ、σ)は投資との関係が深い指標です。標準偏差を確認すれば、対象の金融商品のおよそのリスク・リターンを把握できます。
標準偏差を投資に適用した指標がボラティリティです。ボラティリティは標準偏差を使い、値動きの荒さの度合いを示しています。
一般的に、ボラティリティ(もしくは標準偏差)が大きい金融商品ほどハイリスク・ハイリターンで、ボラティリティが小さい金融商品ほどローリスク・ローリターンです。
標準偏差を求めるには平均値と分散が必要
標準偏差について理解する上で、平均値と分散の知識が欠かせません。まず、それぞれの概要を解説します。
平均値とは
平均値とは、対象のデータの数値をすべて加え、その個数で割った値です。例えば、X地域に5つの会社(A〜E社)があり、それぞれ従業員数が50人・35人・40人・33人・82人いる場合、平均値は以下のように求めます。
・(50+35+40+33+82)÷5=48
つまり、X地域の会社の従業員数の平均値(平均従業員数)は48人です。
平均値を計算すれば、データ全体の特徴を把握できます。ただし、外れ値(極端に大きい値・小さい値)がある場合に、実態と異なる数値が算出される点に注意が必要です。
なお、外れ値の影響を受けにくい値として、中央値や最頻値があります。平均値・中央値・最頻値の違いについては、以下の記事を参考にしてください。
平均値と中央値の違いとは?それぞれの求め方や最頻値の意味も紹介
分散とは
分散とは、対象データの散らばりの度合いを示す指標です。分散が小さいほどデータの数値が平均値中心に集まっており、分散が大きいほど数値が平均値から離れていることを意味します。
分散を計算するまでの流れは、以下のとおりです。
1. データの平均値を計算する
2. 偏差(へんさ)を計算する
3. 偏差を2乗する
4. 3の結果を合計する
5. 4を個数で割る
偏差とは、対象データの数値と平均値の差のことです。数値が平均値を下回っていて「マイナス」の偏差を「プラス」にするため、2乗しています。
X地域にある会社の従業員数(A社50人・B社35人・C社40人・D社33人・E社82人)で、分散を計算してみましょう。
まず、平均値は48です(前の見出し「平均値とは」参照)。続いて、偏差はそれぞれ2・(-13)・(-8)・(-15)・34と計算できます。
最後に、各偏差を2乗した数値を合計し、個数で割りましょう。
・(4+169+64+225+1,156)÷5=323.6
よって、X地域にある会社の従業員数の分散は323.6です。