SSブログ

営収の平均値・中央値・最頻値

 今回は「営収の平均値・中央値・最頻値」を書こうと思います。

 業界の新聞などの売り上げのデータにはよく平均値が使われています。例えば営収とか営業回数等ほとんど全てが平均値を用いています。平均値の特徴は「すべてのデータからの影響を考慮した値になる」事です。平均値の弱点は「大きく離れた値が含まれていると、その影響を大きく受けてしまう」事です。例えば年収が200万円、300万円、400万円、500万円、3,000万円の人がいたとすると、算術的平均年収は880万円になります。

 これを見ても分かる通り、外れ値が有るとその値の影響を大きく受けてしまいまいます。前記の例で言うと3,000万円が外れ値となります。考えても上記の例で平均年収の880万円は3,000万円の人の影響を受けて、多の人の年収を押し上げる結果になっています。

 「中央値」は、平均値と違い外れ値の影響をほとんど受けない為、「普通のデータ」の値を知りたい時は平均よりも中央値の方が適しています。中央値は、データを小さい順に並べたときにちょうど中央に位置する値のことですが、データの数が偶数個の場合は、中央に位置する2つの値の算術平均をとります。データが奇数個の場合は真ん中のデータになります。

 弱点は、上記の例では中央値が400万円ですが、翌年度に中央に位置した値を取る為、平均値が減少していても中央に位置する値が増加していた時は、平均値が減少しているのに中央値は増加している事になります。よって中央値はデータの比較にはあまり向いていないと考えられます。

 最後に「最頻値」は、データの中で最も頻繁に出現する値のことを言います。これは「最も頻繁に出現する値」のみを反映するため、他の値から大きく離れた外れ値の影響を受けないという強みがあります。弱点は、データの数が少ないと「3回しか出現していない値」が最頻値になるなどして、「本当にそのデータ集団を代表しているか?」と疑問に思うような値が最頻値になったりして、複数の値が最頻値になる可能性がある点です。エクセルではMODE関数で求められます。

 データの比較には向きませんが平均と大きくかけ離れた営収、例えば8万円とか1万円とかの外れ値を考慮しない「中央値」で前の自分の会社のデータを見てみてみようと思います。データ数は49人で平均値は35,397円です。中央値は(49+1)/2=25なので25番目の営収の乗務員は・・・36,820円デス。因みデータの個数が偶数の場合は、n/2とn/2+1の算術的平均になるので、{n/2+(n/2+1)}/2になります。

 今回の外れ値は、大きい方で70,000円、少ない方で9,000円でした。中央値は平均とそんなに変わらなく、平均値より1,423円上がっています。
 
 結局、平均値で考えても変わらない様です。因みに最頻値はエクセルに49個のデータを入力するのが面倒で・・・・やっていませんwwww

 久々の数字遊びの様でした。草

nice!(2)  コメント(0) 
共通テーマ:求人・転職

nice! 2

コメント 0

コメントを書く

お名前:
URL:
コメント:
画像認証:
下の画像に表示されている文字を入力してください。

Facebook コメント