備忘録

【平均値と中央値の違い】それぞれの意味や特徴や使い分け方法を簡単解説

平均値と中央値の違いとは

データの指標等でよく表記されるものに【中央値・平均値】という数値があります。

 

平均値についてはなんとなく聞いたことがあると思いますが、中央値に関しては聞いたことはあっても意味は分からないという人も多いのではないでしょうか。

 

様々な統計データを見たり扱ったりするにあたって、知っておいた方がいい言葉なのは間違いないので、これらの数値について解説していきます。

 

平均値だけではなく中央値の意味を知っておくことで、多方面から統計データを見ることができるようになります。

 

平均値の意味や特徴とは

【平均値】は、観測値の総和を用いるので全ての値が反映されます。

 

どれか1つの数値が変化するだけでも平均値は変化するので、平均値はデータの総合的な変化を比較する時に使うべき数値です。

 

1つの数値に影響されるので、その1つの数値で平均値が大きく変化します。

 

たとえば、5人の平均年収データを出す場合を想定して平均値を計算してみましょう。

 

平均値で計算

年収

  • Aさん:年収300万円
  • Bさん:年収350万円
  • Cさん:年収400万円
  • Dさん:年収450万円
  • Eさん:年収1億円

 

この5人の平均値は、年収が非常に高いEさんによって跳ね上がってしまいます。

 

平均値

  • Eさん無し:約400万円
  • Eさん有り:約2,000万円

 

Eさん無しだと平均値が約400万円に対して、この5人の年収の平均値は約2,000円ということになり、年収の現実・実態を表せているとは言い難い数値になってしまいます。

 

A~Dさんにしてみれば『俺、2,000万円も貰ってねーよ』と言いたくなるほど有り得ない数値になるので、この場合は平均値を求めるのは適切ではありません。

 

中央値の意味や特徴とは

【中央値】は、データを小さい順または大きい順に並べた時に中央に位置する値が反映されます。

 

どれかの数値が他の数値と比べて大きく外れていたとしても、順番に並べた数値の中央の数値が反映されるので、現実離れした数値になりにくい特徴があります。

 

ですが、多数決で多いほうが勝つ理論に近いものがあり、少数派の数値がかき消されてしまうというデメリットがあります。

 

たとえば、6人の中央年収データを出す場合を想定して中央値を計算してみましょう。

 

中央値で計算

年収

  • Aさん:年収300万円
  • Bさん:年収350万円
  • Cさん:年収400万円
  • Dさん:年収450万円
  • Eさん:年収1億円

 

この6人の年収の中央値はEさんの数値が全く反映されなくなります。

 

中央値

  • 中央値:400万円

 

平均値と中央値は一致しない

これまでの計算方法で分かる通り、平均値と中央値は一致しません。

 

それぞれに特徴があり、状況に応じて使い分ける必要があります。

 

データの総合的な変化を比較したい場合は平均値で求めて、どれかの数値が他の数値と比べて大きく外れる場合は中央値で求めることでつじつまが合います。

 

平均値と中央値は一致しないことを理解した上で、それぞれのデータをチェックすると見方が変化すると思います。

 

平均値と中央値の使い分け

 

それぞれの数値を適切に求めるためには、平均値と中央値を使い分ける必要があります。

 

使い方

  • 年収:中央値が適切か
  • 貯金:中央値が適切か
  • 身長:平均値が適切か
  • 体重:平均値が適切か
  • テストの点数:平均値が適切か

 

平均値は極端な数値があった場合でも考慮してしまうので、大きすぎる数値や小さすぎる数値の影響を大きく受けてしまいます。

 

中央値は大きすぎる数値や小さすぎる数値が含まれていたとしてもほとんど影響を受けませんが、吐出した数値は無視されてしまいます。

 

平均値と中央値の使い分け方法は、平均値と中央値の両方のデータを出してみたうえで、現実や実態と大きくずれていなければ平均値を使うのが適切だと思われます。

 

中央値と平均値の違いまとめ

平均値は、観測値の総和を用いるので全ての値が反映されます。

 

データの総合的な変化を比較する時に効果的ですが、異常な数値が入り込むと現実離れした数値になってしまうデメリットあり。

 

中央値は、データを小さい順または大きい順に並べた時に中央に位置する値が反映されます。

 

どれかの数値が他の数値と比べて大きく外れていたとしても影響を受けない反面、少数派の数値が無かったことになってしまうデメリットあり。

 

平均値と中央値にはそれぞれメリット・デメリットがあり、扱うデータの種類によって使い分ける必要があります。

 

研究のデータを解析する時や発表された統計データをチェックする時には、平均値と中央値の特徴をよく理解したうえで目を通すことをおすすめします。

-備忘録