この記事では中央値について優しく図解し、平均値との違いや代表値についても説明します。
中央値と平均値の違い
まずは簡単にこの5人グループの”身長”で考えてみましょう。
この5人の平均身長はこの様になります。
これに対して中央値はこの様になります。
比べて見ると平均値の方が上になりますね。これは大きなカバさんが”外れ値”として平均を押し上げているからです。
この様に離れた(飛び抜けた)数値がある場合は平均値と中央値の値が大きく違うことがあるぞ。なので外れ値を取ってしまうという方法もあるんじゃ
cor博士
代表値とは?
突然ですが「この5人グループの身長を、おおまかでいいので一つの数値で表してほしい!」という無茶なお題が出たとしましょう。このお題に対して「グループ全体を大まかに言い表せそう」な数値を代表値として使います。
代表値は決まった数値や計算式のことではなく、自分自身で「これが代表値としてふさわしそうだ」と決めるものなんじゃ。
cor博士
代表値は多くの場合で平均値が使われますが、年収データなどの上方に振れているデータでは中央値を使うこともあります。
このようなヒストグラムの時じゃな。こういったしっぽの様に伸びているグラフをロングテールと読んだりするぞ。
cor博士
平均値は全員の年収の合計を人数で割ったものになるので、例えば年収100万円の人が10人、年収1億円の人が1人だとしても、平均年収は1,000万円となります。
これに比べて中央値は100万円になりますので、このグループを”大まかに言い表せそう”な代表値としては中央値を使うのがよいでしょう。
コメントを残す