データを学ぶ 統計検定

【統計検定 3級】母集団からの標本抽出について解説します

分析時にうまく標本を抽出できているかわからない。

自分の実験計画に自信がない。

このようなお悩みにお答えします。

ahilog

このシリーズでは、今注目されている「統計検定」に準拠しながら解説していきます!

今回の記事の内容は以下の通りです。

統計検定3級の入門の内容なので、ひとつずつ說明していきますね。

この記事の内容

  • 母集団と標本の違いを理解する
  • 標本抽出の方法と特徴を理解する

母集団と標本の違い

母集団について

母集団とは、そのサンプルの全数のことを指します。

母集団全てに調査をかけて、評価することが出来たなら、一番正確な結果が得られます。

しかし、現実では全数に対して調査をすることは出来ません。

ahilog

日本人の統計である「国勢調査」ですら、日本人全てに調査しているわけではありません。

事実上、全員を捕まえるのは不可能なんですね。

そのため、母集団の中から一部のサンプルを取り出して実験をすることになります。

この母集団の一部のことを「標本」といいます。

標本については、今から說明しますね。

標本について

標本は、母集団から抽出された一部の集団のことを指します。

データ分析を正しく行うためには、正しく標本を作ることが大前提です。

ahilog

日本人の生態について調査をしようとしたとします。

調査に協力してくれる標本が男性だけだったら、結果が日本を象徴しているとは言えませんよね。

この場合なら、日本人口の男女比に合わせて標本(調査モニター)を集めます。

世の中のほとんどすべての実験において、すべてのデータを網羅することは不可能です。

そのため、いかに母集団とズレのない標本を作るかが腕の見せどころです。

母集団から標本を抽出する方法

標本抽出の方法は大きく5つあります。

標本抽出の方法

  • 単純無作為抽出法:母集団から完全にランダムに抽出
  • 系統抽出法:母集団に属する個体に番号をつけて等間隔で抽出
  • 層化無作為抽出法:母集団を属性ごとに分けて、それぞれから無作為に抽出
  • 多段抽出法:母集団から段階に分けて調査範囲を特定し、標本を抽出
  • クラスター抽出法:特定の条件を満たす集団全数を抽出

言葉でみると小難しいのですよね。

ひとつずつ具体例も交えながら見ていきましょう。

単純無作為抽出法

単純無作為抽出法は、一番シンプルな方法です。

母集団全数から完全にランダムに標本を抽出します。

ただし、母集団すべてを把握できていることが大前提なので、実施難度は高めです。

ahilog

ランダムに抽出することが正しくない場合もあります。

ランダムにやりすぎると、個体の少ないマイノリティを拾いきれないかもしれません。

系統抽出法

系統抽出法は、単純無作為抽出法を簡単にしたものです。

個体それぞれにナンバリングして、均等な間隔で抽出していきます。

ahilog

3の倍数でアホになる芸人がいましたね。

あれと同じように、均等な間隔でアホになる代わりに個体を抽出するイメージです。

層化無作為抽出法

層化無作為抽出法は、無作為抽出する前にグループに分けます。

特定のグループごとに分けて、その比率が母集団に揃うように無作為抽出をします。

ahilog

アンケート調査などを実施する時によく使います。

アンケートモニターを性年代別にグループ化し、日本全体の構成比になるように抽出します。

この方法だと、狙った構成比率で標本をつくることができるので、

母集団の性質に近い標本を得ることができます。

多段抽出法

多段抽出法は、母集団が大きすぎる調査の場合によく使われます。

国勢調査などはこの多段抽出法を使っています。

調査対象の都道府県・市区町村を決めてから、その地域の国民に調査します。

ahilog

日本人全員の名簿からランダム調査すると、管理するのも大変ですからね。

特定の市区町村に絞ったほうが、役所主導でオペレーションもうまくいくのかなと思います。

この方法は巨大な調査を実施する時に効果的です。

ただし、細かく階層を作りすぎると、母集団からずれてしまうので注意が必要です。

ahilog

日本全体の調査結果のはずが、京都府のど田舎の標本しか集まらなかったら、おかしくなりますよね。

※筆者は京都のど田舎出身です。

クラスター抽出法

クラスター抽出法は、母集団を細かく分割し、いくつかのクラスターにわけます。

その選ばれたクラスターの全数を抽出して調査をする方法です。

ahilog

飛行機の顧客満足度を調査する場合はこれにあたります。

飛行機全便から特定の便を抽出し、乗客全員に評価してもらうんです。

この方法はマーケティングでよく使われる方法です。

多段抽出法と同じく、細かくしすぎると母集団から離れていくので注意しましょう。

まとめ:母集団と標本の違いについて

いかがでしたでしょうか。

本記事では、実験を始める前に重要な「母集団」と「標本」の違いについてまとめました。

そして、標本抽出の方法についても說明しました。

標本抽出は、皆様ビジネスで無意識にやっていることだと思います。

ahilog

標本抽出を意識して、使っている分析ツールの結果をみると新しい発見があるかも!

統計学は数学もたくさん出てくるので、ぱっと見難しく感じるかもしれません。

しかし、ちゃんと知っておくと説得力が上がるので、ぜひ本記事も参考に勉強してみてくださいね。

  • この記事を書いた人

yutasukun

京都橘高校からの史上初東大受験・現役合格を成し遂げ 「リアルドラゴン桜」として横断幕が出たことアリ。 そんな過去の栄光も虚しく10年が経過。 今はデータアナリストとして汐留の広告代理店で バリバリはたらく毎日。

-データを学ぶ, 統計検定

© 2021 ahilog Powered by AFFINGER5