statistics/심리통계학의 기초

표준오차(standard error)를 유도하는 과정

반찬이 2008. 7. 15. 09:03

우리가 실험할 때 모집단 전체를 대상으로 할 수 있다면, 굳이 sampling할 필요가 없다. 그러나, 모집단의 크기가 너무 커서 전체를 실험하는 것이 불가능하거나 비실용적일 때 모집단 내에서 무선표집을 통해 sampling을 하게 된다. 이것이 추리통계에서 사용되는 방법이다. 그렇지만, 이렇게 표집된 표본의 평균(X)과 모집단의 평균(μ)사이에는 error의 가능성이 있고, 이를 표본오차sampling error라고 한다.

 

우리는 모평균(μ)을 대부분 알지 못하기 때문에, sampling error를 추정하고, 표본이 모집단을 어느 정도 잘 대표하고 있는지를 알아보기 위해서 표준오차(standard error)라는 개념을 사용한다. 표준오차를 구할 때는 일단 모집단이 정상분포곡선을 가지고 있다고 가정한 후, 그 모집단에서 sampling을 한번만 하지 않고 여러 번 한다. sampling을 여러 번 하는 이유는 여러번 하면 할수록 표본평균분포의 평균이 모집단의 평균에 가까워지기 때문이다. 이렇게 여러 번 sampling된 표본들의 각각의 평균의 분포를 표본평균분포라고 하는데, 이 분포의 표준편차를 표준오차라고 한다. 즉, 모평균(μ)와 표본 평균 사이에 평균적으로 얼마나 많은 오차를 내는가를 알려주는 것이다. 이렇게 해서 얻은 표준오차값이 작다면, 이는 모집단을 잘 대표할 수 있다고 말할 수 있다.

표준오차(σ )는 모집단의 표준편차가 클수록 커지고 사례수가 많을수록 작아진다.