代表値と呼ばれる値のお話 ~10倍返しの統計学 その3~

いつもお世話になっております。
麻雀部部長の榛澤です。

先週から続けて今週も私の記事でいかせていただきます。

前回は記述統計学と推測統計学について簡単に紹介しました。今回は記述統計である代表値(要約統計量)について説明していきます。
代表値とは変数分布を要約する統計量であり、具体的にいえば「平均値」「最大値」「最小値」「中央値」「階級値」「最頻値」などが挙げられます。
それぞれの値の正確な意味を知ることは重要ですので今回はこれらの値について話していきたいと思います。


■平均値・最大値・最小値
平均値は平均して得られた数値、最大値は最も大きい値、最小値は最も小さい値です。
はい、そのままですね。下記のサンプルでそれぞれの値を見ていきましょう。

サンプルA:100, 200, 300, 400

平均値は250、最大値は400、最小値は100になります。
何の問題もないですね。では次いきましょう。


■中央値
中央値とはデータを大きさの順に並べたときに中央にあたる値です。

サンプルB:200, 300, 500, 600, 700
中央値は500になります。

では下記のサンプルの場合、中央値はどうなるでしょう?
サンプルC:200, 300, 500, 700

データの総数が偶数個のときは中央2つのデータの平均値が中央値になります。
よってサンプルCの中央値は400になります。


階級値
階級値とはデータを度数分布(ヒストグラム)でみたときの各階級の中央値です。

 度数分布表A
WS000368
上記の50~60点の階級値は55、80~90点の階級値は85となります。
さらに各階級に属する個数のことを度数といい、上の表でいうと階級値55の度数は8になります。

最頻値
最頻値とは度数の最も多い階級に対する階級値です。
先ほどの度数分布表Aでいうと最頻値は75になります。


では今回もこれぐらいで失礼しようかと思います。用語の説明ばかりで物足りないですね。
ですが正しい語句を理解することは今後生きてきます。
次回は分散のお話をします。ではまたいつか会う日まで。