statistics/심리통계학의 기초

population SD vs sample s

반찬이 2008. 7. 15. 08:49

앞의 문제는 score가 공통 키워드라고 한다면, 여기서는 표준편차라고 하는 것이 공통 키워드라 할 수 있다. 5.0 받은 사람도 많이 있다. 공통적인 것인 표준편차를 설명하려면 먼저 무엇을 설명해야 하는가? SD를 보려면, 분포를 보려고 하는 것이고, 분포 중에서 얼마나 떨어져 있는가를 보려고 하는데, 그것은 variation을 보려고 하는 것. 그런데, 하나는 population의 variation이고, 하나는 sample의 variation이다. 그러면, population의 variation과 sample의 variation이 어떤 관계가 있느냐? 이걸 설명하면 된다.

이것을 구하는 공식을 가지고도 설명할 수 있지만, 공식을 몰라도 설명할 수 있다. 공식만을 놓고 이야기하는 것도 좋은 답은 아니다. 전집의 분포 모양과 샘플의 분포 모양을 보면 어떤가? 둘 다 정상분포 곡선으로 가정할 수 있다. 더불어서 평균도 같다고 가정해 볼 수 있다. 그러면, variation은 전집에서 커진다. 샘플을 가지고서 전집을 유추하는 것이다. 평균은 같을 수 있지만, 샘플이 작을수록 전집과 variation은 차이를 보인다. 그래서, 유추할 때, 오류와 차이를 좁혀줄 수 있는 점에서 샘플에서의 공식은 전집의 공식과는 차이를 보여서 샘플의 공식에서 값이 더 많이 나오도록 만들어 놓았다. 공식을 토대로 서로의 분모 차이를 설명해 주면 좋다. 이런 식으로 이야기하면 된다.