統計学の標本数とは？サンプルサイズとの違いや決め方を初心者向けに解説

統計学を学び始めると、「標本数」や「サンプルサイズ」といった言葉がよく出てきますよね。でも、これらの用語は似ているようで異なる意味を持ち、混同してしまうと分析結果の解釈を誤ってしまう可能性があります。

実際、アンケート調査や実験データの分析を行う際には、「どれくらいのデータを集めればいいのか？」「何回調査を繰り返せば信頼できる結果が得られるのか？」といった疑問が必ず浮かびます。標本数とサンプルサイズを正しく理解することで、データ分析の設計段階から精度の高い調査を実施できるようになります。

この記事では、統計学における標本数とサンプルサイズの違いを明確にし、それぞれの役割や決め方について、初心者の方にも分かりやすく解説していきます。具体的な計算方法や実務での活用方法まで、幅広くカバーしていきますので、ぜひ最後までお読みください。

1 目次
2 標本数とサンプルサイズの基本的な違い
3 標本数（サンプル数）とは何か
- 3.1 例1：都道府県別の男子高校生の身長調査
- 3.2 例2：マウスの投薬実験
4 サンプルサイズ（標本の大きさ）とは何か
- 4.1 例1：都道府県別の男子高校生の身長調査（続き）
- 4.2 例2：マウスの投薬実験（続き）
5 標本数とサンプルサイズを混同しやすい理由
6 サンプルサイズの決め方：許容誤差から逆算する方法
7 サンプルサイズの決め方：検出力から逆算する方法
8 実務での標本数とサンプルサイズの考え方
9 まとめ

標本数とサンプルサイズの基本的な違い
標本数（サンプル数）とは何か
サンプルサイズ（標本の大きさ）とは何か
標本数とサンプルサイズを混同しやすい理由
サンプルサイズの決め方：許容誤差から逆算する方法
サンプルサイズの決め方：検出力から逆算する方法
実務での標本数とサンプルサイズの考え方
まとめ

標本数とサンプルサイズの基本的な違い

統計学において、標本数（サンプル数）とサンプルサイズ（標本の大きさ）は、どちらもデータ収集における重要な概念ですが、意味する内容が全く異なります。

まず簡潔に整理すると、次のようになります。

標本数（サンプル数、number of samples）：標本を抽出した回数、つまり「群の数」を指します。
サンプルサイズ（標本の大きさ、sample size）：一つの標本（群）に含まれる個体の数、つまり「一つの群のサイズ」を指します。

この違いを理解するためには、具体例を使って考えるのが一番分かりやすいでしょう。次のセクションから、それぞれの用語を詳しく見ていきます。

標本数（サンプル数）とは何か

標本数とは、母集団から標本を抽出する作業を何回行ったかを表す数値です。英語では「number of samples」と表記され、別名「群数」とも呼ばれます。

例えば、次のような状況を考えてみましょう。

例1：都道府県別の男子高校生の身長調査

日本全国の47都道府県それぞれで、男子高校生の身長を測定する調査を実施したとします。このとき、各都道府県から一つずつデータを集めたとすると、標本数は47となります。

つまり、47回の標本抽出を行った、あるいは47の群（グループ）が存在する、ということです。

例2：マウスの投薬実験

新薬の効果を検証するために、次のような実験を行ったとします。

投薬群：新薬を投与したマウスのグループ
対照群：何も投与しないマウスのグループ

この場合、群は2つ存在するため、標本数は2です。各群に何匹のマウスが含まれているかは、標本数とは別の概念（サンプルサイズ）で表現されます。

標本数は、実験や調査の設計において、比較対象となる群がいくつあるのかを示す重要な指標です。

サンプルサイズ（標本の大きさ）とは何か

サンプルサイズは、一つの標本（群）に含まれる個体の数を表します。英語では「sample size」と表記され、日本語では「標本の大きさ」とも呼ばれます。

先ほどの例を使って説明すると、次のようになります。

例1：都道府県別の男子高校生の身長調査（続き）

各都道府県で100人ずつの男子高校生を測定したとします。この場合、一つの都道府県（一つの群）には100人が含まれるため、サンプルサイズは100となります。

標本数が47、サンプルサイズが100なので、調査全体で測定した人数は47 × 100 = 4,700人となります。

例2：マウスの投薬実験（続き）

投薬群に30匹、対照群に30匹のマウスを割り当てたとします。この場合、各群のサンプルサイズは30です。標本数は2（投薬群と対照群）で、各群のサンプルサイズが30、実験全体では60匹のマウスを使用したことになります。

サンプルサイズは、統計的な信頼性や検出力を決定する上で非常に重要な要素です。一般的に、サンプルサイズが大きいほど、母集団の特性をより正確に推定できるようになります。

標本数とサンプルサイズを混同しやすい理由

初心者が混同しやすいのは、どちらも「数」を扱っており、日常会話では区別せずに使われることが多いためです。例えば、「サンプル数を増やそう」という表現が、「標本数を増やす（群を増やす）」のか「サンプルサイズを増やす（各群の個体数を増やす）」のか、文脈によって異なる意味になることがあります。

統計学では、これらの用語を明確に区別して使用することが求められます。特に論文や報告書では、次のように表記することが推奨されます。

用語	英語表記	意味	記号例
標本数	number of samples	群の数	k
サンプルサイズ	sample size	一つの群の個体数	n

この区別を意識することで、データ分析の設計段階から結果の解釈まで、一貫性のある議論ができるようになります。

サンプルサイズの決め方：許容誤差から逆算する方法

実際の調査や実験では、「どれくらいのサンプルサイズが必要なのか？」という疑問が常につきまといます。サンプルサイズを決める方法には主に2つのアプローチがあり、まずは許容誤差から逆算する方法を解説します。

許容誤差とは

許容誤差（margin of error）とは、標本から得られた統計量（平均や比率など）が、真の母集団パラメータからどれくらいずれる可能性があるかを示す範囲です。

例えば、世論調査で「支持率50%、許容誤差±3%」と報道されることがありますが、これは「真の支持率は47%から53%の範囲にある可能性が高い」という意味です。

許容誤差を小さくするほど、より正確な推定が可能になりますが、その分必要なサンプルサイズは大きくなります。

信頼区間と信頼係数

許容誤差と密接に関連する概念として、信頼区間と信頼係数があります。

信頼区間：母集団パラメータが含まれると期待される範囲
信頼係数（信頼水準）：その区間が真の値を含む確率（通常は95%や99%）

95%信頼区間を使用する場合、信頼係数は0.95となり、対応する標準正規分布の値（z値）は約1.96となります。

計算式

母集団の平均値を推定する場合、必要なサンプルサイズnは次の式で求められます。

\(n = \left( \frac{z \cdot \sigma}{E} \right)^2\)

各記号の意味は次のとおりです。

n：必要なサンプルサイズ
z：信頼係数に対応する標準正規分布の値（95%信頼区間なら1.96）
σ（シグマ）：母集団の標準偏差
E：許容誤差

計算手順の例

実際にサンプルサイズを算出する手順を、ステップごとに見ていきましょう。

目標とする許容誤差を決定する：例えば、平均身長の推定で許容誤差を±2cmに設定します。
信頼水準を選択する：一般的には95%（z = 1.96）を使用します。
母集団の標準偏差を推定する：過去のデータや予備調査から標準偏差σを推定します。例えば、σ = 10cmとします。
計算式に代入する：n = (1.96 × 10 / 2)² = (9.8)² = 96.04となり、必要なサンプルサイズは約97となります。

このように、許容誤差を小さくしたり、標準偏差が大きい母集団を扱う場合は、より大きなサンプルサイズが必要になります。

母集団の標準偏差が未知の場合

実務では、母集団の標準偏差が事前に分からないことがほとんどです。この場合、次のような方法で対処します。

予備調査を実施する：小規模なパイロット調査で標準偏差を推定します。
過去のデータを参照する：類似の調査結果から標準偏差を借用します。
最大値を仮定する：比率の推定では、p = 0.5（最も分散が大きい）を仮定することで、保守的なサンプルサイズを算出できます。

サンプルサイズの決め方：検出力から逆算する方法

もう一つのアプローチは、検出力（statistical power）を基準にサンプルサイズを決定する方法です。これは特に、仮説検定を行う実験や比較研究で重要になります。

検出力とは

検出力とは、実際に効果や差が存在するときに、それを統計的に検出できる確率のことです。一般的には80%以上（0.8以上）の検出力を確保することが推奨されます。

検出力が低いと、本当は効果があるのに「効果がない」と誤って判断してしまう（第二種の過誤）リスクが高まります。

検出力に影響する要因

検出力は次の4つの要因によって決まります。

サンプルサイズ（n）：大きいほど検出力が上がる
効果量（effect size）：群間の差の大きさ。大きいほど検出しやすい
有意水準（α）：通常0.05。小さくすると検出力は下がる
データのばらつき（標準偏差）：小さいほど検出力が上がる

検出力分析によるサンプルサイズ算出

検出力分析では、目標とする検出力（例えば0.8）を達成するために必要なサンプルサイズを逆算します。

2群の平均値の差を検定する場合（t検定）の簡易的な計算式は次のとおりです。

\(n = \frac{2(z_{\alpha/2} + z_{\beta})^2 \sigma^2}{\delta^2}\)

各記号の意味は次のとおりです。

n：各群に必要なサンプルサイズ
z_α/2：有意水準αに対応するz値（両側検定、α=0.05なら1.96）
z_β：検出力1-βに対応するz値（検出力0.8ならβ=0.2、z=0.84）
σ：共通の標準偏差
δ（デルタ）：検出したい効果量（群間の平均値の差）

計算手順の例

新薬の効果を検証する実験で、必要なサンプルサイズを算出する手順を見ていきましょう。

検出したい効果量を決定する：例えば、平均で5ポイントの改善を検出したいとします（δ = 5）。
標準偏差を推定する：過去のデータからσ = 10と推定します。
有意水準と検出力を設定する：α = 0.05（z = 1.96）、検出力0.8（z = 0.84）とします。
計算式に代入する：n = 2(1.96 + 0.84)² × 10² / 5² = 2 × 7.84 × 100 / 25 = 62.72となり、各群に約63のサンプルが必要です。

検出力分析を事前に行うことで、効果を確実に検出できる実験設計が可能になり、時間とコストの無駄を防ぐことができます。

統計ソフトウェアの活用

実務では、G*PowerやRのpwrパッケージなど、専用の統計ソフトウェアを使用することで、複雑な検出力分析も簡単に実行できます。これらのツールを使えば、様々な検定方法に対応したサンプルサイズ計算が可能です。

実務での標本数とサンプルサイズの考え方

ここまで理論的な側面を中心に解説してきましたが、実際の調査や実験では、理論だけでは決められない制約も多く存在します。

予算と時間の制約

理想的には大きなサンプルサイズが望ましいですが、調査にかかる費用や時間には限りがあります。特にアンケート調査や臨床試験では、一人あたりのコストが高額になることもあります。

この場合は、次のようなバランスを考慮します。

最小限必要なサンプルサイズを確保する：統計的に意味のある結果を得るための最低ラインを守る
段階的な調査を検討する：予備調査で効果量を確認してから本調査を行う
効率的なデザインを採用する：層別サンプリングやマッチングなどの手法で効率を上げる

比較研究における標本数の考え方

複数の群を比較する研究では、標本数（群数）が増えるほど、多重比較の問題が生じます。例えば、3群以上を比較する場合は、対比較を繰り返すと有意水準の調整が必要になります。

このため、実務では次のような工夫が行われます。

事前に比較する群を絞り込む：予備的な分析や先行研究を基に、重要な比較対象を明確にする
適切な統計手法を選択する：分散分析（ANOVA）やボンフェローニ補正など、多重比較に対応した手法を使用する
階層的な分析を行う：まず全体的な差を検定し、有意であれば詳細な比較に進む

サンプルサイズが小さい場合の対処法

どうしても十分なサンプルサイズが確保できない場合もあります。この場合は、次のような対策を検討します。

ノンパラメトリック検定を使用する：正規分布を仮定しない検定方法で、小サンプルにも対応
効果量を報告する：統計的有意性だけでなく、実質的な効果の大きさを示す
信頼区間を広く取る：結果の不確実性を明示的に示す
探索的研究として位置づける：仮説生成のための予備的研究として報告する

データの質とサンプルサイズのバランス

単にサンプルサイズを大きくすればよいというわけではありません。データの質が低ければ、いくらサンプルサイズを増やしても意味のある結果は得られません。

次のような点に注意しましょう。

測定の正確性を確保する：信頼性と妥当性のある測定方法を使用する
欠損値を最小限に抑える：調査設計の段階で回答しやすい工夫をする
バイアスを排除する：無作為抽出や盲検化などの手法でバイアスを減らす
データクリーニングを徹底する：異常値や入力ミスをチェックする

継続的なモニタリングと適応的デザイン

長期間にわたる研究では、中間解析を行いながらサンプルサイズを調整する適応的デザインも検討できます。これにより、予想外の結果が出た場合でも柔軟に対応できます。

ただし、適応的デザインを採用する場合は、統計的な調整が必要になるため、専門家のアドバイスを受けることが推奨されます。

POINT

実務では理論的な計算だけでなく、予算・時間・データの質など、総合的な判断が求められます。標本数とサンプルサイズの両面から、最適な調査設計を目指しましょう。

まとめ

この記事では、統計学における標本数とサンプルサイズの違いと、それぞれの決め方について詳しく解説しました。最後に重要なポイントをまとめます。

標本数とサンプルサイズは異なる概念：標本数は群の数を、サンプルサイズは一つの群に含まれる個体数を表します。この区別を正確に理解することが、正しいデータ分析の第一歩です。
サンプルサイズは許容誤差から決められる：どれくらいの精度で推定したいかを決めれば、必要なサンプルサイズを計算できます。許容誤差を小さくするほど、より多くのデータが必要になります。
検出力分析で効果を確実に検出：実験や比較研究では、検出力を基準にサンプルサイズを決定することで、効果を見逃すリスクを減らせます。事前の設計が研究の成功を左右します。
実務では制約とのバランスが重要：理論的な計算結果だけでなく、予算・時間・データの質など、現実的な制約も考慮した総合的な判断が求められます。
データの質を最優先に：サンプルサイズを増やすことよりも、正確で信頼性の高いデータを集めることが、意味のある分析結果につながります。

統計学の基礎をしっかりと押さえることで、株式投資におけるデータ分析や、テクニカル指標の理解もより深まります。標本数とサンプルサイズの考え方は、様々な場面で応用できる重要な概念ですので、ぜひ実践で活用してみてください。

目次

標本数とサンプルサイズの基本的な違い

標本数（サンプル数）とは何か

例1：都道府県別の男子高校生の身長調査

例2：マウスの投薬実験

サンプルサイズ（標本の大きさ）とは何か

例1：都道府県別の男子高校生の身長調査（続き）

例2：マウスの投薬実験（続き）

標本数とサンプルサイズを混同しやすい理由

サンプルサイズの決め方：許容誤差から逆算する方法

許容誤差とは

信頼区間と信頼係数

計算式

計算手順の例

母集団の標準偏差が未知の場合

サンプルサイズの決め方：検出力から逆算する方法

検出力とは

検出力に影響する要因

検出力分析によるサンプルサイズ算出

計算手順の例

統計ソフトウェアの活用

実務での標本数とサンプルサイズの考え方

予算と時間の制約

比較研究における標本数の考え方

サンプルサイズが小さい場合の対処法

データの質とサンプルサイズのバランス

継続的なモニタリングと適応的デザイン

まとめ