statistics/심리통계학의 기초

표준정규분포와 t분포의 차이

반찬이 2008. 7. 15. 09:24

표준정규분포는 모든 측정치를 표준점수로 계산하여 평균 ‘0’이고 표준편차 ‘1’을 가진 정규분포로 변화시킨 분포곡선으로, 각 측정치에 대한 Z 점수는 편차점수(각 측정치와 평균간의 차이)를 표준편차(편차들의 평균)로 나눈 값이다. 즉, 원점수 분포의 값과 관계없이 미리 결정된 모평균과 표준편차값을 갖는 변형된 점수로 구성되어 있는 분포이다. 이 분포는 평균과 표준편차가 상이한 분포를 동일선상에서 비교하기 위해 사용된다. Z점수를 통해 분포내의 상대적 위치를 알 수 있으며, Z점수의 부호는(+,-) 점수가 평균 이상일지(+), 이하일지(-) 알려주고, 수치는 X와 μ사이의 표준편차의 수를 세어서 평균으로부터의 간격을 명시한 것이다. 표집의 원점수는 분포내의 위치에 관해 많은 정보를 주지 못하므로, 점수의 위치를 알기 위해서는 평균과 표준편차를 알아야 한다. Z점수는 분포내에서 한 점수의 위치를 명확하게 지정해주는 단일값으로, 일반적으로 평균을 0, 표준편차를 1로 나타낸 것이다. 즉 원점수의 분포를 Z점수의 분포로 변형시킨 것이 Z분포인데, 전집의 평균과 표준오차를 알 때는 Z분포가 그대로 적용된다.

 

→그러나 대부분의 상황에서는 모집단의 평균이나 표준편차를 알기가 힘들며, 표본의 평균과 표준오차를 가지고 모집단을 추정하기 때문에 이 때에는 Z분포가 아닌 T분포를 이용하게 된다. T 분포에서는 모집단의 표준오차를 구하기 위한 모표준편차 대신에 표본표준편차를 이용하여 추정표준오차를 구한다. T분포가 이렇게 Z분포에서 수정된 것이기는 하지만 두 개의 분포가 가까워지는 경우도 있는데, 이는 표본의 사례수가 엄청나게 많이 모집단에 가깝기 때문이다.

 

t 분포는 일반적으로 정상분포가 아니다. t 분포는 t통계치가 z점수의 근사값인 것과 마찬가지로 정상분포의 어림치로, t 분포가 얼마나 정상분포에 가까운지는 자유도에 의해 결정된다. t 분포는 꼭지가 하나며 좌우대칭이고, 종모양의 분포로서 정상분포와 거의 같으나, 다른 점은 분포의 양 끝이 약간 치켜올라간 반면에 표본의 중앙부는 정상분포보다 남작한 모양의 분포를 이룬다는 것이다. 일 반적으로 표본크기가 크면 클수록 자유도 또한 커질 것이다. t 분포는 정상분포에 훨씬 가까울 것이다.

 

→이 두 분포의 차이점은 첫째, t 분포는 정상분포보다 중앙이 비교적 평평하고 양 극단이 완만한 분포를 이룬다. 둘째, t 분포는 자유도에 따라 그 분포의 양상이 결정된다. 셋째, t 분포의 표준편차는 1보다 크다. 실제 t 분포의 표준편차는 자유도가 작으면 작을수록 그변산도는 커지는 반면에, 자유도가 커지면 t 분포의 표준편차는 단위 정상분포의 표준편차 1에 접근하게 된다. 반면에, 유사점으로는 평균이 ‘o'이고 좌우대칭이며 꼭지가 하나라는 점이다.