第8回


1.度数分布表とヒストグラム(復習)

 第4回で英語の試験結果の度数分布表とヒストグラムを作成した。

英語の試験結果の度数分布表


ヒストグラム



2.度数分布表とヒストグラムの見方(復習)

(1)度数分布表

  • 「データ区間」は、階級の上限値を示している。
  • 「頻度」は、「度数」のことで、その階級に属しているデータの数を示している。
  • 「累積%」は、「累積相対度数」とよばれ、各階級の度数が度数の合計に占める割合である「相対度数」を、はじめの階級からその階級までたしたものである。

(2)ヒストグラム

  • ヒストグラムは、度数(頻度)を棒グラフにしたものである。全体の分布の様子がわかる。エクセルでは、累積相対度数を右目盛りの折れ線グラフで示している。
  • 度数分布表とヒストグラムは、データの全体的な分布の様子をみるための重要な分析方法の一つである。

3.相対度数

 各階級の度数が度数全体(すなわちデータ数)に占める割合を、各階級の相対度数という。


相対度数=その階級の度数÷度数の合計

 英語の得点の度数分布表から、各階級の相対度数を求める手順は以下の通り。


(1)B67に度数の合計を求める。
→B67に、=SUM(B60:B66)と入力する。

(2)最初の階級(得点が10点から19点)の相対度数を求める。
→D60に=B60/B$67と入力する。

(3)D60をコピーし、D66まで貼り付ける。



 相対度数は、各階級に含まれるデータの数が、データ全体の何パーセントにあたるかを示している。上の例では、たとえば上から3番目の階級(得点が30点から39点)に、17.5%(0.175)のデータが含まれていることを示している。



4.分布曲線

 英語の試験結果のヒストグラムは、データが40人分だったので、階級の幅をあまり細かくできなく、したがってでこぼこしていた。もしデータの数がもっと多くて、階級の幅を小さくできれば、やがてヒストグラムは、下の図のようになめらかな曲線を描くようになるだろう。
 このように、集団のデータの分布の様子をなめらかな曲線で表したものを分布曲線という。




5.累積相対度数とシェア

 累積相対度数は、ある階級までに含まれるデータのシェアを示している。上の図では2番目の階級までに全体の0.15(=0.05+0.1)、すなわち15%のデータが含まれている。これは分布曲線になっても同じことである。
 次に説明する正規分布では、平均から1標準偏差ごとにその割合が決まっている。この性質を使うことにより、統計学では様々な分析をおこなうことができる。

6.正規分布

 様々な分布曲線の中で、曲線のちょうど真ん中が平均値で最もグラフが高くなり、そこから離れるに従って左右対称に低くなっていくものを、正規分布曲線という。
(参考)正規分布の書き方
 (1)A4からA14に図のように数値を入力する。

 (2)B1に平均、B2に標準偏差を図のように入力する。
  (図は平均50、標準偏差10の場合の例)

 (3)B4に次のように入力する。
    =NORMDIST($A4,B$1,B$2,FALSE)



(4)B4をコピーし、B14までに貼り付ける。
(5)A4からB14まで範囲指定し、グラフウィザードで「散布図」の「データポイントを平滑線でつないだマーカーなし」を選ぶ。



(6)平均値が50、標準偏差が10の正規分布曲線が描ける。




7.正規分布の性質

(1)平均を中心に常に左右対称。
(2)グラフは平均で最も高くなり、左右に広がるにつれて低くなる。
(3)グラフは、標準偏差が大きいほど扁平になり、小さいほど尖(とが)る。
(4)平均から標準偏差の何倍離れると全体の何パーセントのデータが含まれるかが決まっている。
(例)平均から左右に1.96×標準偏差ずつ離れるとその中に全体の95%のデータが含まれる。
(参考)標準偏差を変えた正規分布の書き方
 (1)B1からB14をコピーし、上の図のようC1とD1に貼り付ける。

 (2)C2を20に、D2を5に変える。

 (3)A4からD14を範囲指定し、グラフウィザードで「散布図」の「データポイントを平滑線でつないだマーカーなし」を選ぶ。

8.標準正規分布

基準化すると、どのような正規分布も平均が0、標準偏差が1の標準正規分布になる。
基準値=(データ−平均値)÷標準偏差
で、正規分布のデータを基準化し、標準正規分布曲線を書いてみる。

 (1)まずD2からD12に、Xの基準値を計算する。
 (2)計算した基準値から、E14に平均値、E15に標準偏差を計算する。
 (3)E2に
   =NORMDIST(D2,D$14,D$15,FALSE)
   と入力する。
 (4)E2をコピーし、E12までに貼り付ける。



 (5)D2からE12を範囲指定し、グラフウィザードで「散布図」の「データポイントを平滑線でつないだマーカーなし」を選ぶ。

 平均値=0、標準偏差=1の標準正規分布曲線が書ける。






統計学へ