データを学ぶ 統計検定

【統計検定 3級】データの種類の違いを解説します【質的・量的データ / 尺度】

データ分析の勉強を始めたいけど、何から始めたら良いか分からない。データの種類もさっぱりわからない・・

このようなお悩みにお答えします。

ahilog

このシリーズでは、今注目されている「統計検定」に準拠しながら解説していきます!

今回の記事の内容は以下の通りです。

統計検定3級の入門の内容なので、ひとつずつ說明していきますね。

この記事の内容

  • データの種類(質的 / 量的 / 尺度)の違いを知る
  • データの種類ごとに使い分けられるようになる

データには種類がある

世の中には色々なデータがありますよね。

僕の自己紹介を書いてみますが、この中にもたくさんのデータが隠れています。

僕の自己紹介

  • 年齢:28歳
  • 性別:男性
  • 血液型:A型
  • 好きな食べ物:ラーメン

これら僕の個人情報(データ)にはそれぞれ種類があって、使い分けないといけません。

仕事などで人の作ったグラフをみて、おかしいなと思ったことありませんか?

グラフや表にしたときに「違和感」がある場合は、大抵このデータの種類の使い分けが出来ていません。

ahilog

取引先から変なツッコミを食らってからでは遅いですよね。
この記事でひとつずつ見ていきましょう。

データのタイプには、質的データと量的データがあります。

そして、データの「物差し」にあたる「尺度」というものがそれぞれに存在します。

ahilog

特に尺度はわかりにくい概念なので、具体例を使って說明しますね。

これらについて詳しく解説していきます。

データの種類:質的と量的の違い

質的データについて

質的データとは、性別や血液型・人の感想のような、数字で表せないものを指します。

ahilog

数字で表されないものが
質的データと覚えちゃって大丈夫です。

質的データには大きく2種類の尺度があり、それぞれ名義尺度・順序尺度と呼ばれます。

この違いについては、具体例をもとにひとつずつ見ていきましょう。

名義尺度 = ただのラベル

名義尺度は「性別」「血液型」のように大小関係がない、ただのカテゴリーのことです。

データの中では一番情報量が少ないです。

ahilog

血液型がA型 という情報から言えることって、なにもないですよね。

順序尺度 = 高低くらいはわかるもの

順序尺度は、アンケートデータがイメージしやすいと思います。

とある美容院のアンケート

Q. スタイリストの腕前はいかがでしたか?

  • とても良かった
  • 良かった
  • どちらともいえない
  • 悪かった
  • とても悪かった

この場合、「良かった」「悪かった」は質的な情報ですが、名義尺度と違って「差」にも意味がありますよね。

良かった と どちらともいえない なら「良かった」のほうがいい結果とわかります。

しかし、その「差」の量を表現できないことが順序尺度の特徴です。

ahilog

2.良かった と 4.悪かったの差がどれくらいなのかって、人それぞれですよね笑

量的データについて

量的データとは、年齢や身長、体温などといった数字で表せるもののことを言います。

ahilog

みなさんが数字で表現している情報は、だいたい量的データと思っておけばいいです。

質的データと比べると、情報量がとても多く、色々なことを読み取ることができます。

量的データは尺度の違いが難しいので、ゆっくりみていきましょう。

間隔尺度 = 差はわかるが「何倍」といえないもの

間隔尺度は気温や体温が一番イメージ付きやすいです。

間隔尺度は以下の特徴を持っています。

  • データの間隔が等間隔である
  • 0が基準ではなく、ひとつの状態でしかない
ahilog

体温が20℃→40℃に上がったときに、熱が倍になったという表現はおかしいですよね。

差には意味があるが、倍率に意味がない情報を間隔尺度といいます。

比例尺度 = 差もわかるうえに「何倍」も表現できるもの

比例尺度は一番情報量が多く、年齢や身長・体重などが該当します。

比例尺度は以下の性質を持っています。

  • データの間隔が等間隔である
  • 0が基準となっている
ahilog

年齢は0歳を基準に計算しますよね。だから20歳と40歳では倍の人生を生きていると言えます。

差に加えて、倍率で表現することができる尺度を間隔尺度といいます。

まとめ:データの種類の違いについて

いかがでしたでしょうか。

本記事では、一番初めに知っておくべきデータの種類の違いについて解説しました。

まとめるとこんな感じです。

データの種類の違いに合わせて、正しくグラフや表を作ると発見が生まれますよ。

ひとつずつモノにしていきましょう!

  • この記事を書いた人

yutasukun

京都橘高校からの史上初東大受験・現役合格を成し遂げ 「リアルドラゴン桜」として横断幕が出たことアリ。 そんな過去の栄光も虚しく10年が経過。 今はデータアナリストとして汐留の広告代理店で バリバリはたらく毎日。

-データを学ぶ, 統計検定

© 2021 ahilog Powered by AFFINGER5