statistics/심리통계학의 기초

한 sample이 한 population을 얼마나 잘 대표?

반찬이 2008. 7. 15. 08:52

한 sample이 한 population을 얼마나 잘 대표하고 있는지 적절한 통계치를 근거로 설명하라. 

 

μ를 알지 못함에도 불구하고 sample의 M으로부터 μ를 어떻게 추론할 수 있는가? sample의 M과 μ사이에는 error의 가능성이 존재함을 참고하여 그 과정을 설명하시오.

 

 

 

표준오차의 개념을 물어본 것. 샘플을 구해야겠고, 이 샘플에 대한 표준편차와 평균은 구해진다. 그런데, 표준편차는 모집단과 일치하지 않으나, 평균은 일치할 수도 있다. 그래서, 여기서는 샘플의 표준편차에 대해서 이야기하고자 하는 것은 아니다. 샘플의 평균은 모집단을 얼마나 잘 대표해주는가? μ와 X(bar)가 같으면, 샘플이 모집단을 잘 대표해주는 것이고, 같지 않으면 잘 대표해주지 않는다. 평균만 가지고서 얼마나 잘 대표해주는지를 알 수 있는가? 모른다. 전집에 대한 정보가 없기 때문에 샘플을 알 수가 없다. 전집의 평균도 모르는데, 어떻게 같은지 알 수 있겠는가? 그러나, μ와 X(bar)가 같은 경우는 거의 드물다. 거의 가까울 수는 있어도. 그래서, 내가 구한 샘플의 평균은 아주 모집단과 똑같으면 에러가 0이지만, 그렇지 않을 때에는 에러가 0이 아닌 상태로 존재한다. 그래서, 샘플의 평균과 전집의 평균에는 항상 에러가 있게 마련이다. 그럼, 그 에러가 작으면 잘 대표해주는 것이고, 크면 잘 대표해주지 못한 것이라고 볼 수 있는데, 에러가 큰지 작은지 어떻게 알 수 있는가? 그래서, 이 샘플을 뽑을 때, 어떤 방법으로 뽑았는가?에 따라서 달라질 수 있다. 샘플을 여러 차례 (random을 가정하고) 뽑는다고 하면, 그 샘플들의 평균들을 하나의 점수로 놓고, 분포를 그려보면, 그 샘플의 평균은 이론적으로 모집단과 같은 것이다. 이런 차원에서 샘플의 대표성을 확인해 볼 수 있다. 이 샘플을 어떻게 구했는가?하는 방법을 언급해준다. 그와 유사한 방법으로 샘플을 계속 이론적으로 구했다. 그리고, 그 샘플을 이론적으로 구해 그 샘플의 평균을 분포로 그려보면 거기에 평균이 나오면, 모집단의 평균이라 할 수 있고, 샘플들의 평균들의 분포에서 표준편차가 나오는데, 그것을 보고, 표준오차라고 한다. 표준오차라고 한다면, 모집단의 평균과의 거리이다.