投資やビジネスの世界で「データに基づいた判断」が重要視される現代。その基盤となる統計学は、実は非常に長い歴史を持つ学問です。
「統計学っていつから存在しているの?」「どのように発展してきたの?」そんな疑問をお持ちの方も多いのではないでしょうか。
統計学の歴史を知ることで、なぜ今日の統計手法が重要なのか、データ分析の本質的な意味が理解しやすくなります。この記事では、統計学の起源から現代までの発展、そして日本における統計学の導入まで、時系列に沿って初心者の方にも分かりやすく解説していきます。
目次
目次
- 統計学とは何か?基本的な定義と役割
- 統計学の起源:古代から中世までの国家統計
- 近代統計学の誕生:3つの学問の統合
- 確率論と統計学の融合:17世紀から18世紀
- 19世紀の統計革命:正規分布と最小二乗法の登場
- 20世紀の現代統計学の開発:統計的検定と実験計画法
- 日本における統計学の歴史:幕末から現代まで
- 統計学史を彩った重要な統計学者たち
- まとめ
統計学とは何か?基本的な定義と役割
統計学の歴史を学ぶ前に、まず統計学とは何かを簡単に整理しておきましょう。
統計学とは、データを収集・整理・分析し、そこから有益な情報や知見を引き出すための学問です。単にデータを集めるだけでなく、そのデータが持つ意味を正しく読み解き、将来の予測や意思決定に役立てることが目的です。
現代では、株価の分析、マーケティング戦略、医薬品の効果測定、天気予報など、あらゆる分野で統計学が活用されています。特に投資の世界では、過去の株価データから将来のトレンドを予測したり、リスクを定量化したりする際に統計学が不可欠です。
統計学の2つの柱:記述統計と推測統計
統計学は大きく分けて2つの領域があります。
- 記述統計:データを要約し、平均値や標準偏差などで特徴を記述する方法
- 推測統計:サンプルデータから全体(母集団)の性質を推測する方法
記述統計は古くから存在していましたが、推測統計が発展したのは近代以降です。この発展の過程を知ることで、統計学の本質的な価値が見えてきます。
統計学の起源:古代から中世までの国家統計
統計学の歴史は非常に古く、その起源は紀元前の古代文明にまでさかのぼります。
古代エジプトと古代ローマの人口調査
最も古い統計的な記録として知られているのが、古代エジプトのピラミッド建設に関する記録です。紀元前3000年頃には、労働力の管理や物資の配分のために、人口や資源の記録が行われていました。
また、古代ローマでは「ケンスス(Census)」と呼ばれる人口調査が定期的に実施されていました。これは市民の数や財産を把握し、税金の徴収や兵役の割り当てに利用されました。現代の「国勢調査(Census)」という言葉は、この古代ローマの制度に由来しています。
聖書に記された統計調査
旧約聖書の「民数記」には、イスラエルの民の人口調査が記されています。これも、国家運営のために人口を把握する必要性から行われたものです。
古代から中世にかけての統計は、主に国家が税収や軍事力を把握するための「国勢把握」が目的でした。この時代の統計は、まだ学問としての体系を持たず、実務的な記録にとどまっていました。
中世ヨーロッパの教区記録
中世ヨーロッパでは、教会が出生・死亡・結婚などの記録を教区ごとに管理していました。これらの記録は、後に人口動態を分析する際の重要なデータ源となりました。
17世紀になると、イギリスのジョン・グラントがロンドンの死亡記録を分析し、死亡原因や年齢別死亡率を統計的に研究しました。これは「人口統計学」の始まりとも言われています。
近代統計学の誕生:3つの学問の統合
16世紀から19世紀にかけて、ヨーロッパで近代統計学が誕生しました。この時期、3つの異なる学問的潮流が統合されることで、今日の統計学の基礎が形作られました。
統計学を形成した3つの学問
- 国勢学(Political Arithmetic):ドイツを中心に発展した、国家の実態を数値で記述する学問
- 政治算術(Political Arithmetic):イギリスで発展した、社会現象を数量的に分析する方法
- 確率論(Probability Theory):フランスを中心に発展した、偶然性や不確実性を数学的に扱う理論
これら3つの流れが19世紀に融合し、現代的な意味での統計学(Statistics)が確立されました。
「統計」という言葉の語源
「統計(Statistics)」という言葉は、ラテン語の「status(国家)」に由来します。元々は「国家に関する事実や数値」を意味していました。
18世紀のドイツでは「Statistik」という用語が使われ、これが英語の「Statistics」へと発展しました。日本語の「統計」は、明治時代にこれらの西洋の概念を翻訳する際に作られた訳語です。
ケトレーの「平均人」概念
19世紀のベルギーの統計学者アドルフ・ケトレーは、社会現象にも自然科学と同様の法則性があると考え、「平均人」という概念を提唱しました。
ケトレーは大量のデータを集めて平均値を計算し、社会の「標準的な状態」を数値で表現しようとしました。この考え方は、後の社会統計学の発展に大きな影響を与えました。
確率論と統計学の融合:17世紀から18世紀
統計学の発展において、確率論の誕生は極めて重要な転換点となりました。
パスカルとフェルマーの往復書簡
1654年、フランスの数学者ブレーズ・パスカルとピエール・ド・フェルマーが、賭博に関する問題について往復書簡を交わしました。これが確率論の誕生とされています。
彼らは「中断されたゲームの賞金をどう分配すべきか」という問題を数学的に解決しようとしました。この過程で、期待値や確率計算の基礎が確立されました。
ベルヌーイの大数の法則
17世紀後半、スイスの数学者ヤコブ・ベルヌーイは「大数の法則」を証明しました。これは、試行回数を増やせば増やすほど、実験結果の平均値が理論的な確率に近づくという法則です。
この法則によって、サンプルデータから母集団の性質を推測するという、現代統計学の根幹となる考え方が理論的に裏付けられました。
ベイズの定理の登場
18世紀のイギリスの牧師トーマス・ベイズは、「ベイズの定理」を発見しました。これは、新しい情報を得たときに、既存の推定をどのように更新すべきかを数学的に示す定理です。
ベイズの定理は後に「ベイズ統計学」という独自の統計学の流れを生み出し、現代の機械学習やAIにも広く応用されています。
19世紀の統計革命:正規分布と最小二乗法の登場
19世紀は、統計学が飛躍的に発展した時代です。この時期に、現代統計学の中核となる正規分布や最小二乗法などの概念が確立されました。
正規分布の発見
正規分布(ガウス分布)は、自然界や社会現象で最も頻繁に観察される確率分布です。測定誤差、人間の身長、試験の点数など、多くのデータが正規分布に従います。
18世紀末から19世紀初頭にかけて、カール・フリードリヒ・ガウスやピエール=シモン・ラプラスが、天文学の観測誤差を分析する過程でこの分布を数学的に定式化しました。
正規分布の発見により、データのばらつきを定量的に評価することが可能になり、統計学は大きく進歩しました。
最小二乗法の開発
最小二乗法は、データの散らばりの中から最も適切な近似曲線や直線を見つける方法です。
ガウスとフランスの数学者アドリアン=マリ・ルジャンドルが、ほぼ同時期に独立してこの方法を開発しました。最小二乗法は、以下のような手順で計算されます。
- 観測データと予測値の差(残差)を計算する
- 各残差を二乗する(負の値を消去するため)
- 二乗した残差の合計が最小になるように、近似式のパラメータを調整する
この方法は、株価予測やトレンド分析など、現代の投資分析でも頻繁に使用されています。
統計図表の発展
19世紀には、データを視覚的に表現する統計図表も発展しました。
イギリスのウィリアム・プレイフェアは、棒グラフ、折れ線グラフ、円グラフなどを考案し、統計データを直感的に理解できるようにしました。
また、フローレンス・ナイチンゲールは、クリミア戦争での死亡原因を分析し、「鶏頭図(コクスコーム図)」という独自の図表を作成しました。これにより、衛生状態の改善が死亡率低下につながることを視覚的に示し、医療改革を実現しました。
20世紀の現代統計学の開発:統計的検定と実験計画法
20世紀に入ると、統計学はさらに高度化し、推測統計学の分野が大きく発展しました。
ピアソンの相関係数とカイ二乗検定
イギリスの統計学者カール・ピアソンは、2つの変数間の関係の強さを測るピアソンの相関係数を開発しました。相関係数は-1から1の間の値を取り、1に近いほど正の相関が強く、-1に近いほど負の相関が強いことを示します。
また、ピアソンはカイ二乗検定も開発しました。これは、観測されたデータの分布が、理論的に期待される分布と一致するかどうかを検定する方法です。
フィッシャーの統計的検定理論
20世紀統計学の最大の功績者の一人が、イギリスのロナルド・フィッシャーです。
フィッシャーは、統計的仮説検定の理論を体系化しました。これは、「帰無仮説」を設定し、データがその仮説と矛盾するかどうかを有意水準とp値によって判定する方法です。
フィッシャーの統計的検定理論は、現代の科学研究やビジネス分析で広く使われており、統計学の最も重要な柱の一つとなっています。
実験計画法の確立
フィッシャーはまた、実験計画法も開発しました。これは、実験を効率的に設計し、少ないデータで正確な結論を導くための方法論です。
農業試験場での経験を基に、フィッシャーは以下のような概念を導入しました。
- ランダム化:実験条件をランダムに割り当てることでバイアスを排除
- 反復:同じ条件で複数回実験を行い、結果の信頼性を高める
- 局所管理:条件を揃えたブロック内で比較することで、外部要因の影響を減らす
これらの手法は、製薬業界の臨床試験や製造業の品質管理など、幅広い分野で活用されています。
ネイマン=ピアソンの検定理論
イェジ・ネイマンとエゴン・ピアソン(カール・ピアソンの息子)は、フィッシャーの理論をさらに発展させ、第一種の過誤(誤って帰無仮説を棄却する確率)と第二種の過誤(誤って帰無仮説を採択する確率)のバランスを考慮した検定理論を構築しました。
この理論により、統計的検定の精度と信頼性がさらに向上しました。
ベイズ統計学の復興
20世紀後半には、18世紀のベイズの定理が再評価され、ベイズ統計学が発展しました。
従来の「頻度主義統計学」が「データは無限に繰り返せる実験の結果」と考えるのに対し、ベイズ統計学は「不確実性を確率で表現し、新しい情報で更新する」というアプローチを取ります。
計算機技術の進歩により、複雑なベイズ計算が可能になり、現在では機械学習、リスク分析、金融工学などで広く使われています。
日本における統計学の歴史:幕末から現代まで
日本にも独自の統計の歴史があります。西洋からの統計学の導入と、日本独自の発展を見ていきましょう。
江戸時代の人口調査
日本でも、西洋の統計学が輸入される以前から、人口調査が行われていました。
江戸時代の8代将軍徳川吉宗(1684-1751)は、享保の改革の一環として全国的な人口調査を実施しました。これは「人別改帳」や「宗門改帳」と呼ばれ、寺院制度を利用して人口を把握する仕組みでした。
ただし、これらはあくまで実務的な記録であり、西洋の統計学のような理論的な体系は持っていませんでした。
明治維新と統計学の導入
学問としての統計学が日本に導入されたのは、幕末から明治維新にかけてです。
明治政府は、近代国家を建設するために西洋の制度や学問を積極的に取り入れました。1871年(明治4年)には、政府内に統計司(後の統計局)が設置され、本格的な統計行政が始まりました。
初代統計局長の杉亨二は「日本統計学の父」と呼ばれ、1879年に甲斐国(現在の山梨県)で日本初の近代的な人口調査を実施しました。
国勢調査の開始
1920年(大正9年)、日本で初めての国勢調査が実施されました。これは、全国民を対象とした本格的な人口統計調査で、以降10年ごと(後に5年ごと)に実施されています。
国勢調査によって得られたデータは、政策立案、経済計画、社会福祉の基礎資料として活用されています。
戦後の統計学の発展
第二次世界大戦後、日本の統計学は急速に発展しました。
1947年には統計法が制定され、統計調査の法的基盤が整備されました。また、GHQの指導のもと、統計制度が近代化されました。
経済成長に伴い、企業でも統計的品質管理(SQC)が導入され、品質管理の分野で日本は世界をリードするようになりました。デミング賞は、統計的品質管理に優れた企業や個人を表彰する賞として、国際的にも知られています。
現代日本における統計学
現代では、統計学は大学の数学科や経済学科だけでなく、医学、工学、社会学など、あらゆる分野で必修科目となっています。
また、ビッグデータやAIの時代を迎え、データサイエンスという新しい分野が注目されています。統計学はその中核をなす学問として、ますます重要性を増しています。
統計学史を彩った重要な統計学者たち
統計学の発展には、多くの優れた学者たちの貢献がありました。ここでは、特に重要な統計学者を紹介します。
カール・フリードリヒ・ガウス(1777-1855)
ドイツの数学者で、「数学の王」と呼ばれるガウスは、正規分布(ガウス分布)や最小二乗法を開発しました。天文学、測地学、物理学など、幅広い分野で業績を残しました。
アドルフ・ケトレー(1796-1874)
ベルギーの統計学者で、社会現象に統計学を適用した先駆者です。「平均人」の概念を提唱し、社会統計学の基礎を築きました。また、BMI(体格指数)の考案者としても知られています。
フローレンス・ナイチンゲール(1820-1910)
「近代看護の母」として有名なナイチンゲールは、優れた統計学者でもありました。クリミア戦争での死亡原因を統計的に分析し、衛生改革の必要性を視覚的に示しました。女性として初めて英国王立統計学会の会員になりました。
カール・ピアソン(1857-1936)
イギリスの統計学者で、相関係数やカイ二乗検定を開発しました。世界初の統計学専門の大学学科をロンドン大学に設立し、多くの統計学者を育成しました。
ロナルド・フィッシャー(1890-1962)
20世紀最大の統計学者の一人で、統計的仮説検定、実験計画法、最尤推定法など、現代統計学の中核となる理論を確立しました。遺伝学者としても優れた業績を残しました。
ウィリアム・ゴセット(1876-1937)
ギネスビール社の社員だったゴセットは、小標本での統計分析に適したt分布とt検定を開発しました。「スチューデント」というペンネームで論文を発表したため、「スチューデントのt検定」と呼ばれています。
ジョン・テューキー(1915-2000)
アメリカの統計学者で、探索的データ解析(EDA)の創始者です。箱ひげ図やステムアンドリーフプロットなどの視覚的手法を開発し、データの特徴を直感的に把握する方法を提唱しました。
杉亨二(1828-1917)
「日本統計学の父」と呼ばれる杉亨二は、明治政府で統計行政を担当し、日本初の近代的な人口調査を実施しました。統計という言葉を日本に定着させた功績も大きく評価されています。
まとめ
統計学の歴史を古代から現代まで追ってきました。最後に重要なポイントをまとめます。
- 統計学の起源は古代にさかのぼり、国家が人口や資源を把握するための実務的な記録として始まった
- 近代統計学は16世紀から19世紀にかけて、国勢学、政治算術、確率論という3つの学問が融合して誕生した
- 19世紀には正規分布や最小二乗法が開発され、データのばらつきを定量的に扱えるようになった
- 20世紀にフィッシャーらによって統計的検定や実験計画法が確立され、現代統計学の基盤が完成した
- 日本では幕末から明治維新にかけて統計学が導入され、杉亨二らの尽力により近代的な統計制度が整備された
- 現代ではビッグデータやAIの時代を迎え、統計学はデータサイエンスの中核として重要性を増している
統計学の歴史を学ぶことで、なぜ現代の統計手法が重要なのか、その本質的な意味が理解できたのではないでしょうか。投資やビジネスでデータを扱う際にも、この歴史的な背景を知っていることで、より深い洞察が得られるはずです。
統計学は今後も発展を続け、私たちの意思決定をより確かなものにしてくれるでしょう。