「記述統計」と「推測統計」

今日は、割とベーシックな用語整理ということで。

「統計」の二大分類、「記述統計」と「推測統計」について書きたいと思います。


「統計」というととっつきにくいと感じられる方も多いかと思います。
今日は、「記述統計」と「推測統計」という対になる重要用語2つについて、なるべく直感的な説明をしたいと思っています。

「記述統計」と「推測統計」とは、「統計」なるものに対して行われる、最初の分類です。


◯記述統計 - 全体を「要約」する

全体を「要約」するのが記述統計です。

データの概要や特性をまとめるための手法です。
「概要」や「特性」の例としては、たとえばデータ全体から得られる「平均」、「中央値」、「標準偏差」、「最大値」、「最小値」など、具体的な数値を求めます。
あるいは、度数分布表を作ったり、これに基づいてヒストグラムを作成したりします。このような表やグラフも、データの「概要」や「特性」を把握するために作られます。

代表例は、アマゾンでの書評の平均点など。

以前に紹介した厚生労働省の発表した「所得の分布状況」などもそうです。
年収階級ごとにヒストグラムを表示し、また、平均値、中央値なども示しています。
https://www.mhlw.go.jp/toukei/saikin/hw/k-tyosa/k-tyosa09/2-2.html


◯推測統計 - 一部から全体を「推測」する

一部から全体を「推測」するのが推測統計です。

サンプルデータを基にして、母集団の特性や未来の出来事を予測する手法です。信頼区間や仮説検定などの方法を用いて、データに基づく予測や推論を行います。

代表例は、国勢調査の速報値とか、選挙速報とかですね。
選挙速報では、全選挙権者の一部からのヒアリングで得られた結果を元にして当選者を予測します。

ほか、たとえば通信会社がマーケティング戦略を考えるときなど、推測統計を使います。
全利用者の利用状況ではなく、一部の利用者の利用状況だけからでも、ある程度のマーケティング戦略は立てられます。


統計は、日常生活のあらゆるところでみかけられます。
また、様々な形で活用されています。

一方で、その扱いにも注意すべきということは前にも書いたとおりです。
たとえば、記述統計は便利ですが、全体像を正しくイメージできる力がないと、本質を見誤る危険があります。

参考: 「要約」とはすなわち「ミスリードの起点」
https://forum.pc5bai.com/tips/longshot/14ab0c3b-05a6-4308-9b87-cfc629749f5f/
  • あなたが最近見かけた「統計」としてどんなものがありますか。
    あるいは、目の前に、なんらかの「統計」が示されていますか。

    それは、「記述統計」でしょうか。それとも「推測統計」でしょうか。
関連記事・関連コンテンツ
統計の学習の第一歩として、以下の本はおすすめです。
文系の方でも読める平易な文章で、イロハから統計について語られています。僕の先生の書かれた本です。
https://www.amazon.co.jp/dp/4484062313/

古いですが、その分、アマゾン等で中古で安く購入できます。

コメントをするにはログインしてください

パソコン仕事5倍速!通信は、エクセルのテクニックから、仕事術、心理学、キャリアアップのヒントまで、主に事務職のビジネスパーソンのためのパソコン仕事高速化ノウハウをお伝えるメールマガジンです。
登録は、以下のフォームから可能です。

メールマガジン登録はこちら