統計学の標準偏差とは?初心者でもわかる計算方法と実践活用法

株式投資や日常のデータ分析で「標準偏差」という言葉を耳にすることがありますよね。「平均値はわかるけど、標準偏差って何?」「計算方法が難しそう…」と感じている方も多いのではないでしょうか。

標準偏差は、データのばらつきや散らばり具合を数値化する統計学の基本的なツールで、平均値だけでは見えない情報を明らかにしてくれます。投資判断においても、値動きのリスクを測る際に欠かせない指標なんです。

この記事では、統計学の初心者でも理解できるように、標準偏差の基本的な意味から具体的な計算方法、実際の活用シーンまでを順を追って解説していきます。計算式も丁寧にステップ分けしているので、安心して読み進めてくださいね。

目次

目次

  • 標準偏差とは何か?平均値では分からないデータの特徴
  • 標準偏差と分散の関係を理解しよう
  • 標準偏差の計算方法を4ステップで解説
  • 標準偏差の68%ルールと95%ルール
  • 標準偏差を株式投資に活かす実践例
  • 標準偏差と偏差値の関係
  • エクセルで標準偏差を求める方法
  • まとめ

標準偏差とは何か?平均値では分からないデータの特徴

統計学を学ぶ上で、まず知っておきたいのが標準偏差という概念です。これは英語で「Standard Deviation」と呼ばれ、データのばらつきを測る最も基本的な指標の一つなんです。

平均値だけでは見えないもの

例えば、AさんとBさんの過去5日間の株式売買の損益を見てみましょう。

日付 Aさんの損益(円) Bさんの損益(円)
1日目 +1,000 +10,000
2日目 +1,200 -5,000
3日目 +900 +15,000
4日目 +1,100 -8,000
5日目 +800 +13,000
平均 +1,000 +5,000

平均だけを見るとBさんの方が優秀に見えますが、日々の損益の変動を見ると、Aさんは安定しているのに対し、Bさんは大きく変動していることがわかります。この「ばらつき」を数値化したものが標準偏差であり、リスクの大きさを表す重要な指標になるのです。

標準偏差が示すもの

標準偏差は、各データが平均値からどれくらい離れているかを平均化した値です。標準偏差が大きければデータのばらつきが大きく、小さければデータが平均値の周辺に集まっていることを意味します。

株式投資の世界では、この標準偏差が「ボラティリティ(価格変動の激しさ)」として使われます。標準偏差が大きい銘柄は値動きが激しく、小さい銘柄は比較的安定した値動きをする傾向があると判断できるんですね。

偏差とは平均値からの距離

標準偏差を理解するには、まず偏差という概念を知っておく必要があります。偏差とは、各データと平均値との差のことです。

\(\text{偏差} = \text{データの値} – \text{平均値}\)

例えば、平均気温が20度の週に、ある日の気温が25度だったとすると、その日の偏差は +5度ということになります。逆に15度だった日の偏差は -5度です。

この偏差を使ってデータ全体のばらつきを表現しようとすると、プラスとマイナスが打ち消し合って合計がゼロになってしまいます。そこで工夫が必要になるのですが、それが次に説明する分散と標準偏差なのです。

標準偏差と分散の関係を理解しよう

標準偏差を学ぶ際に必ず出てくるのが分散という概念です。実は、標準偏差と分散は密接に関係していて、セットで理解することが大切なんです。

分散とは何か

分散は、各データの偏差を二乗して平均したものです。偏差をそのまま合計するとゼロになってしまう問題を解決するために、二乗することでマイナスの値を消しているんですね。

\(\text{分散} = \frac{(\text{偏差}_1)^2 + (\text{偏差}_2)^2 + \cdots + (\text{偏差}_n)^2}{n}\)

ここで、nはデータの個数を表します。分散が大きいほど、データが平均値から離れた位置に散らばっていることを意味します。

なぜ標準偏差が必要なのか

分散にはひとつ問題があります。それは「単位が元のデータの二乗になっている」という点です。

例えば、身長のデータ(単位:cm)の分散を計算すると、単位は「cm²」になってしまいます。これでは元のデータと単位が合わず、直感的に理解しにくいですよね。

そこで、分散の平方根(ルート)を取ることで単位を元に戻したものが標準偏差なのです。標準偏差なら元のデータと同じ単位で表現されるので、「平均値から標準的にどれくらい離れているか」を直感的に把握できます。

\(\text{標準偏差} = \sqrt{\text{分散}}\)

記号で表すと

統計学では、標準偏差を記号で表すことがよくあります。

  • 母集団の標準偏差:ギリシャ文字のシグマ「σ(シグマ)」で表します
  • 標本の標準偏差:アルファベットの「s」で表します
  • 分散:σ²(母集団)またはs²(標本)で表します

母集団とは調査対象全体のこと、標本とはそこから抜き出した一部のデータのことです。実際のデータ分析では標本を使うことが多いため、標本標準偏差を計算するケースがほとんどです。

標準偏差の計算方法を4ステップで解説

ここからは、実際に標準偏差を計算する手順を4つのステップに分けて詳しく解説していきます。初めての方でも理解できるよう、具体的な数値例を使って進めていきますね。

例題:5人のテスト結果から標準偏差を求める

5人の生徒が受けたテストの点数が以下の通りだったとします。

70点、80点、75点、85点、90点

この5つのデータから標準偏差を求めてみましょう。

ステップ1:データの平均値を求める

まず最初に、すべてのデータの平均値を計算します。

\(\text{平均値} = \frac{70 + 80 + 75 + 85 + 90}{5} = \frac{400}{5} = 80\)

平均点は80点ですね。

ステップ2:各データの偏差を求める

次に、各データと平均値との差(偏差)を計算します。

点数 偏差(点数 – 平均値)
70 70 – 80 = -10
80 80 – 80 = 0
75 75 – 80 = -5
85 85 – 80 = +5
90 90 – 80 = +10

平均より低い点数はマイナスの偏差、高い点数はプラスの偏差になります。

ステップ3:偏差を二乗して分散を求める

偏差をそのまま足すとゼロになってしまうので、それぞれの偏差を二乗してから平均します。これが分散です。

偏差 偏差の二乗
-10 100
0 0
-5 25
+5 25
+10 100
合計 250

\(\text{分散} = \frac{100 + 0 + 25 + 25 + 100}{5} = \frac{250}{5} = 50\)

分散は50となりました。

ステップ4:分散の平方根を取って標準偏差を求める

最後に、分散の平方根(ルート)を計算すれば標準偏差が求められます。

\(\text{標準偏差} = \sqrt{50} \approx 7.07\)

この結果から、5人のテスト結果は平均80点で、標準的に約7点のばらつきがあることがわかります。つまり、多くの生徒は73点から87点の範囲に収まっていると解釈できるのです。

POINT

標準偏差を求める手順は、①平均値を計算、②各データの偏差を計算、③偏差を二乗して平均(分散)、④分散の平方根を計算、の4ステップです。この流れを覚えておけば、どんなデータでも標準偏差を求められます。

標準偏差の68%ルールと95%ルール

標準偏差には、データ分析で非常に役立つ経験則があります。それが68%ルール95%ルールです。この法則を知っておくと、標準偏差の実践的な意味がより理解しやすくなります。

正規分布とは

これらのルールが成り立つのは、データが正規分布(ガウス分布)と呼ばれる特定のパターンに従う場合です。正規分布は、平均値を中心に左右対称の釣鐘型になるデータの分布のことで、自然界や社会現象の多くがこの分布に従うことが知られています。

身長、体重、テストの点数、株価の変動など、多くのデータが正規分布に近い形を取ります。

68%ルール(1σの範囲)

68%ルールは、正規分布するデータの約68%が「平均値±1標準偏差」の範囲に収まるという法則です。

\(\text{平均値} – 1\sigma \leq \text{データ} \leq \text{平均値} + 1\sigma\)

先ほどのテストの例(平均80点、標準偏差7.07点)で考えると、約68%の生徒が73点から87点の間に収まるということです。

95%ルール(2σの範囲)

95%ルールは、正規分布するデータの約95%が「平均値±2標準偏差」の範囲に収まるという法則です。

\(\text{平均値} – 2\sigma \leq \text{データ} \leq \text{平均値} + 2\sigma\)

同じ例で言えば、約95%の生徒が66点から94点の間に収まります。

99.7%ルール(3σの範囲)

さらに、データの約99.7%が「平均値±3標準偏差」の範囲に収まります。これは3σルールと呼ばれ、この範囲を外れるデータは非常に稀な異常値とみなされます。

株式投資での活用例

ある株式の日次リターンが平均0.5%、標準偏差が2%だとします。

  • 68%の確率で:日次リターンは-1.5%から+2.5%の範囲に収まる
  • 95%の確率で:日次リターンは-3.5%から+4.5%の範囲に収まる

この情報から、もし日次リターンが-4%を下回った場合は統計的に稀な出来事であり、何か特別な要因があると判断できます。このように、標準偏差は異常値の検知やリスク管理に活用できるのです。

標準偏差を株式投資に活かす実践例

ここからは、統計学の標準偏差を実際の株式投資でどのように活用できるかを見ていきましょう。理論を学んだ後は、実践での使い方を知ることが大切です。

ボラティリティとしての標準偏差

投資の世界で最もよく使われるのが、価格変動の激しさ(ボラティリティ)を測る指標としての標準偏差です。

株価の日次リターン(前日比の変動率)の標準偏差を計算することで、その銘柄がどれだけ値動きが激しいかを数値化できます。標準偏差が大きい銘柄はハイリスク・ハイリターン、小さい銘柄は比較的安定した値動きをする傾向があります。

ボリンジャーバンドへの応用

テクニカル分析で有名なボリンジャーバンドは、標準偏差を直接利用した指標です。

ボリンジャーバンドは、移動平均線を中心に、±1標準偏差、±2標準偏差のラインを引いたものです。価格が±2標準偏差のバンドに触れると「買われ過ぎ」「売られ過ぎ」と判断する材料になります。

  • 上部バンド(+2σ):価格が統計的に高い水準にあり、反転の可能性
  • 下部バンド(-2σ):価格が統計的に低い水準にあり、反発の可能性

これは、95%ルールに基づいた判断手法なんですね。

リスク管理での活用

ポートフォリオ管理では、標準偏差を使って投資リスクを定量化します。

例えば、保有する複数銘柄のリターンの標準偏差を計算することで、ポートフォリオ全体のリスク(値動きの不確実性)を数値で把握できます。リスクを数値化することで、自分のリスク許容度に合った投資戦略を立てやすくなるのです。

異常値の検知

日々の株価チェックで、平均から±2標準偏差を超える値動きがあった場合、それは統計的に稀な出来事です。

このような異常な値動きを検知することで、決算発表や重要ニュースなど、何か特別な材料が出た可能性を疑うことができます。逆に、標準偏差の範囲内の値動きであれば、通常の変動の範囲内と判断できます。

銘柄比較での活用

複数の銘柄を比較する際にも標準偏差は役立ちます。

銘柄 平均リターン 標準偏差 特徴
A社 0.8% 1.5% 安定志向
B社 0.8% 3.5% ハイリスク

この2社は平均リターンが同じですが、標準偏差が異なります。A社は値動きが安定していて長期保有向き、B社は値動きが激しく短期トレード向きという判断ができます。

POINT

投資判断では、平均リターンだけでなく標準偏差(リスク)も併せて評価することが重要です。高いリターンでも標準偏差が大きければ、大きな損失のリスクも伴うことを理解しておきましょう。

標準偏差と偏差値の関係

「偏差値」という言葉は、学生時代に誰もが聞いたことがあるはずです。実は、この偏差値は標準偏差の応用版なんです。両者の関係を理解すると、標準偏差の実用性がさらによく分かります。

偏差値とは何か

偏差値は、テストの点数などで「集団の中での自分の位置」を分かりやすく示すために開発された指標です。平均点を50、標準偏差を10として標準化した値で表現されます。

\(\text{偏差値} = 50 + 10 \times \frac{\text{得点} – \text{平均点}}{\text{標準偏差}}\)

偏差値の計算例

平均点が60点、標準偏差が15点のテストで、あなたが75点を取ったとします。

  1. 偏差を求める:75 – 60 = 15
  2. 標準偏差で割る:15 ÷ 15 = 1.0
  3. 10倍して50を足す:1.0 × 10 + 50 = 60

あなたの偏差値は60です。これは、あなたが平均より1標準偏差分高い位置にいることを意味します。

偏差値で分かること

偏差値の便利なところは、異なるテストや科目間でも比較できる点です。

  • 偏差値50:ちょうど平均
  • 偏差値60:上位約16%(平均+1標準偏差)
  • 偏差値70:上位約2.5%(平均+2標準偏差)
  • 偏差値40:下位約16%(平均-1標準偏差)

68%ルールから、偏差値40から60の間に約68%の人が収まることが分かります。つまり、偏差値60以上なら上位約16%に入っているということですね。

株式投資での偏差値的発想

投資の世界でも、偏差値と同じ考え方が使えます。

例えば、ある銘柄の現在の株価が、過去の平均株価から何標準偏差離れているかを計算することで、「今の株価は割高か割安か」を統計的に判断できます。過去の平均から+2標準偏差以上離れていれば「統計的に割高」、-2標準偏差以下なら「統計的に割安」と考えられます。

これは、株価が正規分布に従うと仮定した場合の一つの判断材料になります。

エクセルで標準偏差を求める方法

手計算で標準偏差を求める方法は理解できましたが、実際のデータ分析では数十、数百のデータを扱うことも珍しくありません。そんな時に便利なのがエクセルです。

エクセルの標準偏差関数

エクセルには標準偏差を計算する関数がいくつか用意されています。

  • STDEV.P関数:母集団全体の標準偏差を計算(母標準偏差)
  • STDEV.S関数:標本データから標準偏差を計算(標本標準偏差)
  • STDEV関数:古いバージョンで使われる関数(STDEV.Sと同じ)

通常、手元にあるデータは母集団全体ではなく標本であることが多いため、STDEV.S関数を使うのが一般的です。

基本的な使い方

例えば、A1からA5のセルに以下のデータが入っているとします。

A1: 70
A2: 80
A3: 75
A4: 85
A5: 90

標準偏差を求めるには、任意のセルに次のように入力します。

=STDEV.S(A1:A5)

これで、先ほど手計算で求めた標準偏差(約7.91、不偏標準偏差の場合)が自動的に計算されます。

株価データでの実践例

株価の日次リターンの標準偏差を計算する場合の手順は以下の通りです。

  1. 日次リターンを計算:各日の終値から前日比の変動率を求める
  2. リターンのセル範囲を選択:例えば過去20日分のリターンがB2:B21に入っている
  3. 標準偏差を計算:=STDEV.S(B2:B21)と入力

この標準偏差に√252(年間営業日数の平方根)をかければ、年率ボラティリティに換算できます。

分散も一緒に計算

分散を求めたい場合は、VAR.S関数を使います。

=VAR.S(A1:A5)

標準偏差と分散の関係を確認したい場合は、両方を計算して比較してみると理解が深まります。標準偏差の二乗が分散になっていることが確認できるはずです。

POINT

実際のデータ分析では、エクセルのSTDEV.S関数を使えば一瞬で標準偏差が求められます。計算原理を理解した上でツールを使うことで、より正確で効率的な分析が可能になります。

初心者が混同しやすい3つのポイント

統計学を学び始めたばかりの方が、標準偏差を理解する上でよく混乱するポイントをまとめておきます。

標準偏差と分散の違い

最も混同されやすいのが、標準偏差分散の違いです。

分散は偏差の二乗の平均なので単位が元データの二乗になります。一方、標準偏差は分散の平方根なので、元データと同じ単位で表現されます。実用的には、元データと同じ単位で扱える標準偏差の方が解釈しやすいため、よく使われます。

母標準偏差と標本標準偏差

もう一つ混乱しやすいのが、母標準偏差標本標準偏差の違いです。

  • 母標準偏差:調査対象全体のデータから計算(nで割る)
  • 標本標準偏差(不偏標準偏差):標本データから母集団を推定(n-1で割る)

実際のデータ分析では、全体のデータを集めることは困難なため、標本データから母集団を推定することがほとんどです。その場合、統計的なバイアスを補正するために、分散の計算でn-1で割る「不偏分散」を使います。エクセルのSTDEV.S関数もこの不偏標準偏差を計算しています。

標準偏差の大小の解釈

「標準偏差が大きい方が良いのか悪いのか」という疑問もよく聞かれます。

これは目的によります。投資の場合、標準偏差が大きいということは値動きが激しく、リスクが高いことを意味します。リスクを取ってリターンを狙いたい投資家には魅力的ですが、安定志向の投資家には向きません。標準偏差の大小に良し悪しはなく、自分の目的やリスク許容度に合っているかどうかが重要なのです。

標準偏差を実務で使う際の注意点

最後に、標準偏差を実際のデータ分析や投資判断で使う際の注意点をお伝えします。

正規分布の前提

68%ルールや95%ルールは、データが正規分布に従うことを前提としています。実際のデータが正規分布から大きく外れている場合、これらのルールは当てはまりません。

特に株価データには、稀に極端な値動き(ファットテール)が発生することがあり、完全な正規分布とは言えません。標準偏差を使う際は、この前提条件を理解しておく必要があります。

過去データの限界

標準偏差は過去のデータから計算されます。しかし、株式市場は常に変化しており、過去の標準偏差が将来も続く保証はありません。

例えば、コロナショックのような予期せぬイベントが起こると、それまでの標準偏差では予測できないほどの値動きが発生します。標準偏差はあくまで参考指標の一つであり、絶対的な予測ツールではないことを理解しておきましょう。

サンプル数の重要性

標準偏差を計算する際のデータ数(サンプルサイズ)も重要です。データが少なすぎると、計算された標準偏差の信頼性が低くなります。

一般的に、統計分析では最低でも30個以上のサンプルがあることが望ましいとされています。株価分析でも、できるだけ長期間のデータを使って標準偏差を計算することで、より信頼性の高い指標になります。

他の指標との併用

標準偏差は非常に有用な指標ですが、これだけで投資判断を行うのは危険です。

ファンダメンタル分析(企業の財務状況や業績)、他のテクニカル指標、市場全体の動向など、様々な情報と組み合わせて総合的に判断することが大切です。標準偏差はあくまでリスク管理のための補助ツールとして活用しましょう。

まとめ

統計学の標準偏差について、基本的な意味から計算方法、実践的な活用法まで解説してきました。最後に重要なポイントをまとめておきます。

  • 標準偏差はデータのばらつきを数値化する指標:平均値だけでは分からない、データの散らばり具合を測る統計学の基本ツールです。各データが平均値から標準的にどれくらい離れているかを表します。
  • 計算は4ステップ:①平均値を求める、②各データの偏差を計算、③偏差を二乗して平均(分散)を求める、④分散の平方根を計算、という流れで標準偏差が求められます。エクセルのSTDEV.S関数を使えば自動計算も可能です。
  • 68%ルールと95%ルールが実用的:正規分布に従うデータでは、約68%が平均±1標準偏差、約95%が平均±2標準偏差の範囲に収まります。この法則を使えば、データの位置づけや異常値の検知ができます。
  • 投資判断でのリスク管理に活用:株価のボラティリティ測定、ボリンジャーバンドなどのテクニカル指標、ポートフォリオのリスク評価など、標準偏差は投資の様々な場面で活用されています。
  • 偏差値は標準偏差の応用:学校のテストで使われる偏差値は、標準偏差を使って集団内での位置を分かりやすく示す指標です。この考え方は株式投資での割高・割安判断にも応用できます。

標準偏差を理解することで、データを「数値」だけでなく「ばらつき」の観点からも評価できるようになります。これは投資判断だけでなく、ビジネスや日常生活でのデータ分析にも幅広く役立つ知識です。ぜひ実際のデータで標準偏差を計算してみて、その有用性を体感してみてください。