1. 검정력(power)의 크기에 영향을 미치는 요인들은 무엇인가?
통계적 검정력이란 실제로 영가설이 틀릴 때 검정이 영가설을 기각하는 확률이다. 이는 바로 1- 인데, 를 계산할 수 없으므로 1- 또한 알 수 없다. 하지만 1- 라는 확률을 증가시키는 방법은 가능한데, 그것은 첫째, 유의수준 를 증가시키는 것이다. 를 증가시키면 가 작아지기 때문에 검정력 1- 는 높아진다. 그러나 검정력을 높게 하기 위해서, 모두를 높일 수는 없다. 따라서 를 줄이기 위해서는 를 높이기 보다는 표본의 크기를 크게 하거나 연구조건을 통제하여 분산을 줄이는 방식을 택한다. 둘째, 표본의 크기를 증가시키는 것이다. 표본의 크기가 n이 크면 표준오차가 작아지고 표준오차가 작아지면 귀무가설이 참일 때의 표본분포와 대립가설이 참일 때의 표본분포의 겹치는 부분이 작아져서 오류가 작아지므로 통계적 검정력 1- 가 높아진다. 셋째, 위의 요인들이 동일한 조건일 때 귀무가설에서 참이라고 가정한 평균인 0과 대립가설에서의 실제평균인 a 간의의 차이가 클수록 검정력은 커진다. 넷째, 모집단의 분산이 영향을 미친다. X(바)의 표준오차에서 표본의 크기 n을 고정하고 모집단의 표준오차를 작게 하여도 X바의 표준오차 역시 작아지므로 오차가 작아져서 검정력이 커진다. 다섯째, 같은 수준의 를 사용한다고 하더라도 단측검정이냐 양측검정이냐에 따라 검정력에 차이가 있다. 만일 대립가설의 실제 평균이 단측검정의 기각영역과 같은 방향에 있다면 양측검정보다는 단측검정일 때의 가 크기 때문에 가 작아져 검정력이 높아진다. 그러나 대립가설의 실제 평균이 단측검정의 기각역과 반대방향에 있다면 단측검정의 검정력은 낮아진다.
2. 공식은 각각 무슨 목적으로 사용되는가?
3. z-score의 이점을 설명하고, IQ점수가 만들어지는 과정을 정리하시오.
표준화 점수(z-score)란 그 분포의 평균과 표준편차에 대한 점수의 값을 나타낸 수이다. 표준화 점수는 평균을 , 임의의 점수를 X, 표준편차를 라고 했을 때 모집단의 경우에는 Z=X- / 로, 표본의 경우에는 Z=X-X/ 로 구할 수 있다. 표준화 점수의 이점으로는 분포의 모양이나 점수의 상대적 위치는 바뀌지 않고 평균과 표준편차만 바뀐다. 따라서 서로 다른 평균과 표준편차를 가진 검사점수를 비교하는데 특히 유용하다. 이는 표준점수로 변환할 경우 중앙 경향치와 분산만을 바꾸기 때문이며, 수학적으로 조작될 수 있다는 이점을 지닌다.
IQ점수의 경우에는 표준화된 점수에 상수를 더하거나 곱해서 원하는 평균과 표준편차를 가진 분포로 바꾼 것으로 즉 Z'=로 변환시킨 것이다. IQ 점수는 평균을 100으로 표준편차가 15를 갖도록 표준점수를 z 15+100으로 바꾼 것이다.
4. 수학능력 시험 점수(X)의 분포가 평균 250점을 중심으로 25점의 표준편차를 보였다. ㄱ) 점수를 표준화하고, ㄴ) 이 점수를 평균이 100이고, 표준편차가 15가 되도록 변환하고, ㄷ) 표준화 점수의 이점을 기술하시오.
ㄱ) z=(X-250)/25 ㄴ) z 15+100
ㄷ) 표준화 점수의 이점: 평균과 표준편차를 기준으로 하여 비교가능한 단일점수로 raw score를 변환시키면 상이한 척도의 점수들 간에 의미있는 비교를 할 수 있다.
5. 추리통계에서 TypeⅠ error와 Type Ⅱ error를 설명하라.
TypeⅠ error는 영가설이 참인데 기각하는 오류를 말하고 , TypeⅡ error는 영가설이 거짓인데 기각하지 못하는 경우를 말한다. Type Ⅰ error를 줄이면, Type Ⅱ error가 커지고, 반대로 Type Ⅱ error를 줄이면, Type Ⅰ error가 커진다. Type Ⅰ error와 Type Ⅱ error를 될 수 있는한 모두 줄이는 것이 좋지만 그 균형점은 대체로 가 .05수준일 때이다. 이외에 다른 방법으로서 표준편차를 줄이기 위해 표본의 크기를 증가시키는 방법이 있다. Type Ⅰ error를 범했을 때가 Type Ⅱ error를 범했을 때보다 더 큰 손실이 발생한다.
6. 작년에 두 차례에 걸친 대입 수학능력 시험이 실시된 후, 제도의 취지를 위해서 표준점수(standard score)를 사용하자는 제안이 있었다. 이 경우에, 표준점수를 사용하는 이점과 그 절차를 설명하시오.(95년)
표준화 점수란 그 분포의 평균과 표준편차에 대한 점수의 값을 나타낸 수이다. 표준화 점수는 평균을 , 임의의 점수를 X, 표준편차를 라고 했을 때 모집단의 경우에는 Z=X- / 로, 표본의 경우에는 Z=X-X/ 로 구할 수 있다. 표준화 점수의 이점으로는 분포의 모양이나 점수의 상대적 위치는 바뀌지 않고 평균과 표준편차만 바뀐다. 따라서 서로 다른 평균과 표준편차를 가진 검사점수를 비교하는데 특히 유용하다. 이는 표준점수로 변환할 경우 중앙 경향치와 분산만을 바꾸기 때문이며, 수학적으로 조작될 수 있다는 이점을 지닌다.
7. 다음 진술은 참인가? 혹은 거짓인가? 그 이유는?
"두 변인 X, Y 사이의 선형상관계수(product-moment correlation coefficient)와 선형회귀계수(linear regression coefficient)는 동일하다"(93)
8. "central limit theorem은 자료가 정상 전집으로부터의 표집일 때만, 모수(parameters)에 관한 추정을 가능케 한다" 이 말은 참인가 거짓인가? 그리고 그 이유를 설명하라.(90)
9. Mann-Whiteney u 검증의 통계적 가설, 가정, 및 이론적 근거를 설명하시오.(89)
Mann-Whiteney u 검증에서는 두 모집분포가 같은가에 대한 가설을 검증한다. 가령 통계적 가설의 예는 다음과 같다.
H0: 실험집단과 통제집단의 모집분포는 같다.
H1: 실험집단과 통제집단의 모집분포는 다르다.
이 때 모집은 연속적이며, 무선표집은 각 모집에서 추출되었다고 가정한다. Mann-Whiteney u 검증은 가정이 적기 때문에 독립표본에 대한 2-표본 t검증에 assumption freer alternative로서 쓰인다. 통계적 추론이 모집의 parameter 중 하나와 관련된 가설을 검증하는 것이 아니면 nonparametric하고, 그것이 표집된 모집단의 정확한 형태에 대한 가정을 하지 않으면, distribution free하다고 말할 수 있는데, 이 두 가지 경우에 assumption freer test라고 한다.
10. Z, t, F 분포를 비교하시오.(88)
Z분포는 모집의 표준편차를 알 때 사용하고, n이 충분히 크면 normality assumption이 불필요하며, constant에 대한 random variable의 비율이다. 이에 반해 t분포는 모집의 표준편차를 모를 때 사용하고, 정규성에 대한 가정이 반드시 필요하며 random variable에 대한 random variable의 비율이다. Z분포와 t분포는 자유도가 무한히 크면 평균 0, 변량 1, 모양이 대칭적이고 unimodal하다는 점에서 서로 같다. 그러나 자유도가 무한대보다 작으면 t분포는 더 platykurtic하고 변량이 더 크다.
F분포는 t분포처럼 자유도에 따라 모양이 달라지는 a family of distribution으로서, 정적으로 skewed되어 있지만 자유도가 커지면 정규분포 모양에 가까워진다. z분포와 t분포에서는 모든 실수를 값으로 가지지만 F분포에서는 음이 아닌 수의 비율이므로 항상 0이상의 값이다.
11. F검증의 논리를 설명하라.(87)
F검증은 두 모집의 변량이 서로 다른가를 알려고 할 때 사용된다.
F검증을 쓰는데 관련된 가정은 X1과 X2의 모집분포가 서로 독립적이고 정규적이며, X들의 두 집합이 모집에서의 무선표본이며, 모집변량은 서로 같은데 이것은 실험자가 기각하고자 하는 바이다. F검증은 t검증과 달리 정규성 가정을 벗어나면 robust하지 않은데 이 가정이 충족되지 않으면 type Ⅰ error를 할 확률이 미리 정한 값과 다르게 될 수 있다. F값이 F의 상위 critical value보다 크면(또는 하위 critical value보다 작으면) 영가설을 기각한다.
12. 변량분석의 가정들을 논의하라(86)
F무선변인과 관련된 가정들과 ANOVA선형모델 방정식과 관련된 가정들이 있다. F무선변인과 관련된 가정들은 모든 ANOVA디자인에 적용되고, 선형모델 방정식과 관련된 가정들은 각 ANOVA 디자인마다 다르다. F가정은 관찰들이 정규모집에서 추출되고, 관찰들은 무선표본이거나 처치수준이 각 실험단위들에 무선적으로 할당된다. F ratio의 분자와 분모는 독립적이다. F ratio의 분자와 분모는 같은 모집변량 2에 대한 추정치이다. ANOVA선형모델 방정식과 관련된 가정들 중 각 디자인들이 공통적으로 가지는 가정은 첫째, 모델방정식은 점수에 영향을 미치는 모든 원천들을 반영한다. 둘째, 실험은 관심이 있는 모든 처치 수준을 다 포함한다. 셋째, 오차효과는 모든 다른 오차효과와 독립적이고 각 모집 내에서 정규적으로 분포하며, 평균은 0이고 분산은 2이다.
'statistics > 심리통계학의 기초' 카테고리의 다른 글
ABC vs D // AD vs BC // A vs B (0) | 2008.07.15 |
---|---|
Xi = µ + A(treatment) + B(treatment) + e (0) | 2008.07.15 |
심리통계 문제 모음 (0) | 2008.02.03 |
두 평균의 차의 표집오차 (0) | 2008.02.03 |
변량분석(F-검증)의 논리 (0) | 2008.02.03 |