いつもお世話になっております。
麻雀部部長の榛澤です。
前回の記事では触れていませんでしたがぼくの名前は珍しい字となっています。
読み方はわかりますか?
そうです、タイトルからわかるとおりそれです。
では今回も統計学のお話をしていきたいと思います。
統計学は大きく分類すると「記述統計学」と「推測統計学」の2つに分類することができます。
■記述統計学
記述統計とは、収集したデータの分布を明らかにする事により、データの示す傾向や性質を要約することです。データを収集してもそこから情報を読み取らなければ意味はありません。特に膨大な量のデータになれば読みやすい形にまとめて要約する必要があります。
そこで発達したのが記述統計学であり、統計学の歴史において最も初期に発達したのがこの記述統計学になります。記述統計ではデータを質的に捉えるのではなく量的に捉えて集団の性質を記述していくのが特徴です。
具体的にどのようなものか、以下の50人の最高血圧値を見ていきましょう。
このままではデータの特徴をすぐに把握できません。そこでヒストグラムでデータを整形してみましょう。
これで分布がなんとなくわかりましたね。他にも平均や分散、最小値、最大値を出すことも記述統計です。
Excelでデータを表にしたりすることは日頃からあると思います。このように実は無意識に皆さんも記述統計を使っていたのです。
■推測統計学
推測統計とは、記述統計によって要約されたデータから母集団全体の特徴や性質を推測することです。
20世紀に統計学は記述統計から推測統計の時代に移りました。一般的に統計学の分析と呼ばれているような手法はこの推測統計学のことを指します。
観察された集団のみを扱う記述統計に対し、観察された集団を母集団から抽出した標本とみなすのが推測統計の特徴です。今後説明していく検定や多変量解析がそれにあたります。
さて、あまり聞きなれない言葉が先ほどから出てきていますね。まずは量的データと質的データの説明をしていきましょう。
量的データとは数値で推し量ることができて数字の大小で優劣を決められるデータ(テストの点数やIQなど)で、
質的データとは分類や種類を区別するためだけのデータ(性別や血液型など)です。
サンプルデータが量的なのか質的なのかで検定内容や解析手法が別れてくるため、ここは重要なポイントです。
それでは物足りない感じもしますが今回はこの辺でまた失礼します。
次回は代表値と呼ばれる要約する統計量を説明し、平均や分散などに触れていきたいと思います。記述統計学ですね!
もっと応用的なことを早く学びたい気持ちもわかりますが、基礎的なことをしっかり理解することが重要なのです。決して小出しにしているわけではないのです。
では次回もいつになるかわかりませんが宜しくお願いします。