統計学と確率論の違いとは?株式投資に役立つ基礎知識を初心者向けに解説

株式投資を学んでいると「統計学」や「確率論」という言葉をよく耳にしますよね。テクニカル分析の指標を理解するにも、リスク管理を考えるにも、これらの知識は欠かせません。でも、「統計学と確率論って何が違うの?」「どちらも数字を扱うけど、関係はあるの?」と疑問に思う方も多いのではないでしょうか。

実は統計学と確率論は表裏一体の関係にあり、確率論が「理論的な土台」を提供し、統計学が「現実のデータから推測する方法」を提供しています。この記事では、両者の違いと繋がりを初心者にもわかりやすく解説し、株式投資にどう役立つのかまで具体的にご紹介します。

目次

目次

  • 統計学と確率論の基本的な違い
  • 確率論とは何か?基礎概念を理解する
  • 統計学とは何か?標本から母集団を推測する方法
  • 統計学と確率論を繋ぐ処:逆向きの関係性
  • なぜ統計学は「絶対」と言わないのか
  • 株式投資における統計学と確率論の活用例
  • まとめ

統計学と確率論の基本的な違い

まず最初に、統計学確率論の根本的な違いを押さえておきましょう。この2つは密接に関係していますが、アプローチの方向性が正反対なのです。

確率論:原因から結果を予測する

確率論は、「すでにわかっている条件(原因)から、どんな結果が起こり得るか」を数学的に導き出す分野です。例えば、サイコロを振ったとき「1が出る確率は1/6」というのは、サイコロの構造(6面体で各面が等しく出る)という母集団の性質がわかっているからこそ計算できます。

つまり確率論では、母集団(全体)の情報が完全にわかっている状態で、そこから標本(個別の結果)がどうなるかを理論的に計算します。

統計学:結果から原因を推測する

一方、統計学は逆向きのアプローチです。「実際に観察できたデータ(結果)から、その背後にある全体像(原因)を推測する」のが統計学の役割です。

例えば、ある銘柄の株価を100日間観測したデータから「この銘柄の平均的なボラティリティはどれくらいか」「将来の株価変動の範囲はどの程度か」を推測するのが統計学です。統計学では、限られた標本データから母集団全体の性質を推し量ります。

両者の関係を一言で表すと

  • 確率論:母集団→標本(理論的に何が起こるか計算)
  • 統計学:標本→母集団(実際のデータから全体を推測)

この「逆向きの関係」こそが、統計学と確率論を繋ぐ最も重要なポイントです。

確率論とは何か?基礎概念を理解する

それでは、確率論についてもう少し詳しく見ていきましょう。確率論は数学の一分野であり、「偶然性」や「ランダムな現象」を厳密に扱うための理論的な枠組みです。

確率論の歴史:ギャンブルから生まれた学問

確率論の起源は、17世紀のギャンブルにあります。フランスの数学者パスカルフェルマーが、賭博師からの相談をきっかけに確率計算の理論を発展させました。その後、18世紀にはラプラスが古典的確率論を体系化し、20世紀にはコルモゴロフが公理的確率論を確立しました。

現代の確率論は、コルモゴロフの公理に基づいた厳密な数学理論として確立されており、金融工学や物理学、機械学習など幅広い分野で応用されています。

確率空間:確率論の基礎となる3つの要素

確率論では、ランダムな現象を確率空間という数学的な枠組みで表現します。確率空間は以下の3つの要素で構成されます。

  1. 標本空間(Ω):起こり得るすべての結果の集合。例えば、サイコロなら {1, 2, 3, 4, 5, 6} です。
  2. 事象(σ-加法族):標本空間の部分集合の集まり。例えば「偶数が出る」という事象は {2, 4, 6} です。
  3. 確率測度(P):各事象に対して0から1の間の数値(確率)を割り当てる関数。全事象の確率の合計は1になります。

この3つ組 (Ω, F, P) が揃うことで、確率論的な議論が可能になります。

確率変数と確率分布

確率変数とは、ランダムな結果に数値を対応させる関数のことです。例えば、サイコロの出目をそのまま数値として扱う場合、それは確率変数になります。

確率変数がどのような値をどれくらいの確率で取るかを表したものが確率分布です。株価の日次リターンは正規分布に近い形を取ることが多く、これが多くの金融モデルの基礎になっています。

期待値と分散:確率論の重要な指標

確率論では、確率変数の特性を表す指標として期待値分散がよく使われます。

期待値は、確率変数が取る値の「平均的な値」を表します。数学的には次のように定義されます。

\(E[X] = \sum_{i} x_i \cdot P(X = x_i)\)

分散は、確率変数が期待値からどれだけばらつくかを表す指標です。

\(\text{Var}(X) = E[(X – E[X])^2]\)

株式投資では、期待リターンが期待値に、リスク(ボラティリティ)が標準偏差(分散の平方根)に対応します。

統計学とは何か?標本から母集団を推測する方法

次に、統計学について詳しく見ていきましょう。統計学は、実際に観測されたデータを分析し、そこから有意義な結論を導き出す学問です。

記述統計と推測統計の違い

統計学は大きく2つに分類されます。

  • 記述統計:手元にあるデータの特徴を要約・整理する方法。平均値、中央値、標準偏差などを計算してデータの全体像を把握します。
  • 推測統計:標本データから母集団全体の性質を推測する方法。仮説検定、信頼区間、回帰分析などが含まれます。

投資判断で重要になるのは推測統計の方で、限られた過去データから将来の市場動向を予測しようとする行為そのものが推測統計の応用です。

母集団と標本の関係

統計学の核心は、母集団標本の関係にあります。

  • 母集団:調査対象の全体。例えば、ある銘柄の「過去から未来まですべての株価」が母集団です。
  • 標本:母集団から実際に観測できた一部のデータ。例えば「過去3年間の株価データ」が標本です。

現実には母集団全体を調べることは不可能(または非効率)なので、標本を使って母集団の性質を推測します。この推測が正確であるためには、標本が母集団を代表している必要があります。

サンプリングと推定の重要性

適切なサンプリング(標本抽出)が統計的推測の精度を左右します。ランダムサンプリングによって、標本が母集団の特性を偏りなく反映するようにします。

そして標本データから母集団のパラメータ(平均、分散など)を推定します。推定には点推定(1つの値で推定)と区間推定(信頼区間で推定)があります。

仮説検定:統計的に意味があるかを判断

仮説検定は、ある仮説が統計的に妥当かどうかを判断する方法です。例えば「この投資戦略は市場平均よりも優れているか」を検証する際に使います。

仮説検定では以下のステップを踏みます。

  1. 帰無仮説と対立仮説を設定:帰無仮説は「差がない」という保守的な仮説です。
  2. 有意水準を設定:一般的には5%(0.05)や1%(0.01)を使います。
  3. 検定統計量を計算:標本データから検定統計量(t値、z値など)を計算します。
  4. p値を求めて判断:p値が有意水準より小さければ帰無仮説を棄却します。

ただし、統計的に有意だからといって必ずしも実用的に重要とは限らないため、効果の大きさ(効果量)も合わせて評価することが大切です。

統計学と確率論を繋ぐ処:逆向きの関係性

ここまで統計学と確率論をそれぞれ見てきましたが、両者はどのように繋がっているのでしょうか。

確率論は統計学の理論的基盤

確率論は、統計学が使う推論の正当性を保証する理論的な土台です。統計学で用いる推定や検定の手法は、確率論の定理(大数の法則、中心極限定理など)に基づいて成り立っています。

例えば、標本平均が母平均に近づくという性質は大数の法則によって保証されており、標本平均の分布が正規分布に近づくという性質は中心極限定理によって保証されています。

統計学は確率論を現実世界に適用する

一方、統計学は確率論の理論を実際のデータ分析に応用する実践的な学問です。確率論が提供する数学的な枠組みを使って、不確実性を伴う現実の問題に対処します。

株式投資で言えば、確率論は「株価変動のモデル」を数学的に記述し、統計学は「実際の株価データからモデルのパラメータを推定し、将来を予測する」役割を担います。

双方向の流れ:母集団と標本の往復

両者の関係を図式化すると次のようになります。

  • 確率論の流れ:母集団の性質(確率分布)が既知 → 標本がどうなるか予測
  • 統計学の流れ:標本データを観測 → 母集団の性質を推測

この双方向の流れによって、理論と実践が結びつき、データに基づいた意思決定が可能になるのです。

なぜ統計学は「絶対」と言わないのか

統計学を学んでいると、「95%信頼区間」や「有意水準5%」といった表現をよく見かけます。なぜ統計学では「絶対にこうだ」と断言せず、確率的な表現を使うのでしょうか。

サンプル(標本)から全体を「推測」する宿命

統計学が絶対と言えない最大の理由は、標本しか見られないという制約にあります。

例えば、ある銘柄の将来の株価を予測したいとき、私たちが手にできるのは過去のデータだけです。未来のデータは存在しないため、過去の標本から未来の母集団を推測するしかありません。

例え話:巨大な鍋のスープの味見

これは巨大な鍋のスープの味を確かめるようなものです。鍋全体の味(母集団)を知るために、スプーン一杯(標本)を味見します。よくかき混ぜてあれば、その一杯から全体の味をかなり正確に推測できますが、100%完璧とは言えません。もしかしたら底の方だけ味が濃いかもしれないからです。

統計学はこの「スプーン一杯から全体を推測する技術」であり、推測である以上、不確実性が必ず残ります。

「偶然」の可能性を0%にできないから

統計学のもう一つの制約は、偶然の可能性を完全には排除できないという点です。

例えば、ある投資戦略が過去10年間で市場平均を上回ったとしても、それが本当にその戦略が優れているからなのか、それとも単なる偶然なのかを100%判別することはできません。

例え話:コイン投げの奇跡

公正なコイン(表裏が50%ずつ)を10回投げて、10回とも表が出る確率は約0.1%です。非常に低い確率ですが、ゼロではありません。もし実際に10回連続で表が出たとしても、「このコインは偏っている」と100%断言できるでしょうか? 理論的には、公正なコインでもこの結果が起こり得るのです。

統計学では、このような「極めて稀だが理論上は起こり得る」ケースを完全には排除できないため、「95%の確信度で」「有意水準5%で」といった確率的な表現を使います。

「100%の答え」は「役に立たない」から

実は、統計学で100%確実と言えるのは「何も言わない」場合だけです。

例え話:100%当たる天気予報

「明日の天気は、晴れか曇りか雨か雪のいずれかです」という予報は100%当たりますが、何の役にも立ちませんよね。

統計学は実用的な判断材料を提供するために、ある程度の不確実性を受け入れつつ、できるだけ精度の高い推測を目指します。「95%の確率で信頼できる」という情報の方が、「100%確実だが内容が空っぽ」よりもはるかに有用なのです。

(例外)記述統計なら100%がある

ただし例外もあります。記述統計では、観測したデータそのものについて述べるため、100%確実な記述が可能です。

例えば「過去100日間の株価データの平均は1,250円だった」というのは、そのデータセットに関する事実であり、推測ではありません。しかし「将来の平均株価も1,250円付近だろう」と言った瞬間、それは推測統計の領域に入り、不確実性が伴います。

株式投資における統計学と確率論の活用例

それでは、統計学と確率論が実際の株式投資でどのように活用されているのか、具体例を見ていきましょう。

リスクとリターンの定量化

投資の世界では、リターン(収益率)とリスク(変動幅)を数値化する際に統計学と確率論が不可欠です。

  • 期待リターン:確率論の期待値の概念を使い、将来の平均的なリターンを推定します。
  • リスク(ボラティリティ):確率論の標準偏差を使い、リターンのばらつき具合を定量化します。

過去の株価データ(標本)から、これらの値を統計的に推定し、ポートフォリオの最適化に役立てます。

正規分布と株価変動モデル

多くの金融モデルでは、株価の日次リターンが正規分布に従うと仮定します。正規分布は確率論で最も重要な分布の一つで、平均と標準偏差の2つのパラメータで特徴づけられます。

正規分布を仮定することで、「株価が一定範囲内に収まる確率は約68%」(平均±1標準偏差)といった確率的な予測が可能になります。ただし、実際の株価変動は正規分布よりも裾が厚い(極端な変動が起こりやすい)ため、この仮定には限界があることも理解しておく必要があります。

移動平均とトレンド分析

移動平均は、株価の短期的なノイズを除去し、トレンドを把握するための統計的手法です。単純移動平均(SMA)や指数移動平均(EMA)は、過去の一定期間の株価データを平均化することで、価格の方向性を視覚化します。

これは統計学の平滑化(スムージング)技術の応用であり、ランダムな変動の中から意味のあるパターンを抽出する試みです。

ボリンジャーバンドと信頼区間

ボリンジャーバンドは、移動平均線を中心に、上下に標準偏差の2倍(または1.5倍、3倍)の幅を持つバンドを描画するテクニカル指標です。

これは統計学の信頼区間の考え方を応用したもので、「株価の約95%がこのバンド内に収まる」という確率的な予測を視覚化しています。バンドを大きく外れた場合は「異常値」と判断し、反転の可能性を示唆します。

モンテカルロ・シミュレーション

モンテカルロ・シミュレーションは、確率論を使って将来の複数のシナリオをコンピュータで大量に生成し、投資成果の分布を推定する手法です。

例えば、ある投資戦略を1万回シミュレーションし、そのうち何回が目標リターンを達成するか、最悪のケースではどれくらい損失が出るかを統計的に分析します。これにより、単一の予測ではなく、起こり得る結果の範囲と確率を把握できます。

回帰分析とファクターモデル

回帰分析は、統計学の中核的な手法で、複数の変数間の関係性を数式化します。株式投資では、個別銘柄のリターンを市場全体の動きや業種要因などで説明するファクターモデルでよく使われます。

例えば、CAPM(資本資産価格モデル)では、個別株のリターンを市場リターンとの関係(ベータ値)で説明します。この係数を推定する際に、過去のデータから統計的に回帰分析を行います。

VaR(バリュー・アット・リスク)

VaRは、「一定期間内に一定の確率で発生し得る最大損失額」を示すリスク指標です。例えば「95% VaRが100万円」とは、「95%の確率で損失は100万円以内に収まる(逆に言えば5%の確率で100万円を超える損失が出る)」という意味です。

VaRの計算には、過去データから損失の確率分布を統計的に推定し、その分布の下位5%点(または1%点)を求めます。これは確率論と統計学の両方を駆使したリスク管理手法です。

まとめ

統計学と確率論は、株式投資を科学的に理解し、合理的な判断を下すための強力な道具です。この記事の要点を振り返りましょう。

  • 確率論は母集団から標本へ、統計学は標本から母集団へという逆向きの関係にあり、両者が補完し合うことで理論と実践が結びつきます。
  • 確率論は数学的な理論基盤を提供し、確率空間、確率変数、期待値、分散などの概念で偶然性を厳密に扱います。
  • 統計学は実際のデータから全体を推測する学問で、記述統計と推測統計に分かれ、仮説検定や信頼区間で不確実性を定量化します。
  • 統計学が「絶対」と言わないのは、標本から推測する宿命と、偶然を完全には排除できない性質、そして実用的な情報を提供するためです。
  • 株式投資では、リスク・リターンの定量化、テクニカル指標、シミュレーション、リスク管理など、あらゆる場面で統計学と確率論が活用されています。

統計学と確率論の基礎を理解することで、市場の不確実性と上手に付き合い、より科学的な投資判断ができるようになります。まずは身近なテクニカル指標の背後にある統計的な意味を考えてみることから始めてみてください。