1) 두 평균의 차의 표준편차
표준편차 : 평균과 평균적으로 떨어져 있는 거리를 측정하는 값
2) 예언의 표준오차(추정의 표준오차)
예측된 값에 대한 실제 값의 변산도 측정치. 모든 점수들의 평균치로부터 측정되는 것이 아니라 회귀선(추정된 평균치들로 그려지는 선)으로부터 나온 측정치. 해당 예측값들에 대해 얻어진 점수 분포의 표준편차이다.
3) 측정의 표준오차
한 사람의 학생에게 동일한 검사를 반복하여 실시할 때 그 점수에 따르는 변량이 측정의 표준오차이다. 이 측정의 표준오차에 의해 학생의 점수가 일정의 신뢰구간내에 들어가는 것이 추정되어 신뢰도가 얻어진다.
4) 표집오차(sampling error)와 비표집오차 (non-sampling error)
표집오차(표본오차) : 모집단의 일부만을 뽑아 표본 조사를 하기 때문에 생기는 오차로, 모집단에서 추출한 표본이 모집단의 특성과 일치하지 않아서 생기는 차이를 말한다. 일반적으로 표본의 크기가 클수록, 표본의 분산이 작을수록, 신뢰구간이 좁을수록 표집오차는 작아진다.
비표집오차 : 표본추출이외의 과정에서 나타나는 오차로 표집오차를 제외한 모든 오차를 의미한다.
5) 신뢰구간 설정방법이 갖는 장점
신뢰구간 (Confidence Interval : CI), 신뢰수준(Confidence Level : CL)
신뢰구간이라는 것은 말 그대로 믿을 수 있는 구간을 의미한다. 보통 모수중에서도 모평균을 알고자 할 때 자주 쓰인다.
예를 들어 대한민국 20대 남자의 평균키를 알고 싶다고 가정했을 경우, 우리가 궁극적으로 알고 싶은 것은 우리나라의 모든 20대 남자들의 키를 조사한 다음 그 값들을 평균한 값, 즉 모평균을 알고 싶을 것입니다.
그러나, 현실적으로 모집단 전체에 대해 조사를 못하고 표본을 가지고 조사합니다. 그러므로 우리가 얻을 수 있는 값은 표본의 평균이기 때문에 모평균과 차이가 발생됩니다. 그래서 나온 것이 구간추정이고, 이것의 핵심이 바로 신뢰구간입니다.
위와 같이 해서 만약 얻어진 값이 70cm ~ 300cm 라는 구간이라면 이 구간안에는 아마 대한민국의 20대 남자들이 포함이 될 것입니다. 즉, 키가 3 m 를 넘는 남자도 없고 70 cm 보다 작은 사람도 없겠죠. 그래서 이 구간은 100% 신뢰구간이 됩니다. 즉, 이 구간안에는 모집단의 모평균이 100 % 들어있게 되는 것이죠.
여기서 중요한 것은 구간안에 모수(모평균)가 포함되어 있을 확률을 의미합니다.
그럼 95% 신뢰구간은 결국 그 구간안에 모수가 포함되어 있을 확률이 0.95인 95%가 될 것입니다. 좀더 정확한 개념으로 말하면 우리는 하나의 표본의 구해서 어떤 신뢰구간을 구할 것입니다. 그 구간은 a1 ~ b1 이라고 하면 이 구간안에 모수가 포함이 되어 있을 수도 있고 포함이 되지 않을 수도 있습니다. 마찬가지 방법으로 똑같은 모집단에서 같은 방법으로 또다른 표본을 추출하고 그 표본에서도 어떤 신뢰구간을 구합니다. 그 구간을 a2 ~ b2 라고 하면 역시 이 구간에도 모수가 포함이 될 수도 아닐 수도 있습니다.
위와 같은 방법으로 100 개의 표본을 뽑는다면 각 표본마다 구간이 나올 것입니다.
a1 ~ b1
a2 ~ b2
a3 ~ b3
: :
: :
a100 ~ b100
위와 같이 구간이 100 개가 나오고 이 구간들은 서로 다를 것입니다. 또한 그 구간안에 모수가 포함될 수도 아닐 수도 있습니다. 여기에서 최소한 모수가 포함된 구간이 95개 있을 경우에 이 구간을 95% 신뢰구간이라고 합니다. 좀더 정확히 말하면 신뢰수준이 95%인 신뢰구간이다라고 말합니다.
그러므로, 신뢰구간과 신뢰수준은 서로 비슷한 용어이면서 공생하는 개념입니다. 신뢰수준은 믿을 수 있는 정도를 의미하고 신뢰구간은 신뢰수준에 바탕을 둔 어떤 모수의 믿을 수 있는 구간을 의미하는 것입니다.
6) 공변량
공변량이라는 변수는 독립변수라기 보다는 하나의 개념으로서 여러 변수들이 공통적으로 함께 공유하고 있는 변량을 뜻한다.
어떤 연구를 하고자 할 때의 주요 목적은 연구하고자 하는 독립변수들이 종속변수에 얼마나 영향을 주는지 알고자 하는 것이다. 그러나, 잡음인자가 있을 경우에는 독립변수의 순수한 영향력을 검출해 낼 수 없으므로, 실험적 방법과 통계적인 방법으로 잡음인자를 통제할 수 있다.
그중에서 통계적 방법을 이용한 잡음 인자를 통제하는 방법중의 하나가 바로 공변량이다.
공변량은 종속변수에 대하여 독립변수와 기타 잡음인자들이 공유하는 변량을 의미한다.
공변량분석은 독립변수 이외의 잠음인자들이 종속변수에 영향을 미치는 것을 통제함으로써 독립변수 자체의 순수한 영향을 측정하는데 목적이 있다.
이와 같이 실험결과의 독립변수 이외에 종속변수에 영향을 줄 수 있는 잡음인자를 연구자가 통제하고자 하는 변수을 공변량 (covariate) 이라고 한다.
만약 공변량이 종속변수에 영향을 주지 않는다면, 이것은 통계적으로 통제할 필요가 없으며, 이 경우에는 공변량을 분석 모형에서 제거한다고 해도 결과에 변함이 거의 없다. 그러나, 종속변수에 영향을 준다면-실험 집단들 사이에 종속변수 값의 차이가 있고, 공변량이 실험 후 비교하고자 하는 종속변수와 어떠한 관계가 있을 경우- 공변량은 통계적으로 통제를 해야 한다.
통계적으로 통제를 하는 공분산분석의 경우 공변량을 통제함으로서 종속변수에 주는 영향력을 제거할 수 있으며, 궁극적으로는 독립변수가 종속변수에 주는 영향을 좀더 명확하게 규명하고 검출해 낼 수 있게된다.
7) 오차(모집단)와 잔차(표본)
8) 유의수준 (significance level)
귀무가설이 참인데도 불구하고 대립가설을 잘못 선택할 확률의 최대값. 즉, 제1종 오류의 최대값을 유의수준이라고 하며 보통 α (alpha) 라고 부른다. 일반적으로 alpha 는 0.05를 주로 사용하며 경우에 따라 0.1, 0.01, 0.001 을 사용하기도 한다. 통계프로그램을 이용할 경우에는 유의확률인 P 값과 유의수준 α (alpha)를 서로 비교하여 P 값이 α 보다 크면 귀무가설 H0를 선택하며, 작거나 같을 경우 대립가설 H1을 선택한다
9) 회귀분석 B와 beta
B : 비표준화 회귀계수
beta : 표준화 회귀계수입니다.
회귀분석에서 가장 핵심적인 위치을 차지하고 있는 것이 바로 이 회귀계수입니다. 회귀분석은 중,고등학교 시설 1차 선형 함수인
y = ax + b
라는 식을 배웠을 것입니다. 이때 a 는 기울기이고, b 는 절편인데, 이 2개의 값을 회귀계수라고 하며, 특히 a 에 해당하는 기울기가 회귀분석에서는 핵심이며, 통계학에서는 B 로 표시를 합니다.
이 B 값은 부호의 의미가 중요하며,
+ ==> 독립변수 x 가 커지면, 종속변수 y 가 커진다
- ==> 독립변수 x 가 커지면, 종속변수 y 가 작아진다
라는 것을 의미합니다.
그런데, 이 회귀계수 B 값은 data의 단위와 밀접한 관계가 있습니다. 만약 x 의 단위가 굉장히 크다라고 한다면 B 값은 상대적으로 아주 작아지게 됩니다. 그러므로 B 값의 크기는 사실 중요하지 않습니다.
만약 2개의 변수가 있는데, 한 변수(x1)의 회귀계수는 3.38 이고, 다른 변수(x2)의 회귀계수는 2.36 인 경우를 살펴보면 x1 의 회귀계수가 더 크기 때문에 x2 보다 더 높은 영향을 줄것이다라고 생각을 하게 됩니다. 하지만 그렇지가 않습니다.
만약 x2 라는 변수 값을 10으로 나누어서 다시 회귀분석을 하게 되면 x2 의 회귀계수는 23.6 이 나옵니다. 즉, B 값은 data의 단위와 관계가 있다는 말이 되는 것이죠.
그래서, 나온 개념이 beta 입니다. 이 값은 회귀계수인 B 값의 단위를 통일시킨 것입니다. 즉, 단위를 통일시킨 표준화된 값이기 때문에 서로 비교를 할 수 있다는 장점이 생깁니다. 그래서, beta 값이 더 크면 영향력이 더 크다라고 생각해도 무방합니다.
10) 자유도(df, degree of freedom)
정보의 개수, 사례수라고 생각하면 되는데, 주어진 조건 아래에서 자유롭게 변화할 수 잇는 점수나 변인의 수를 말한다. 5명 학생에게 자신이 좋아하는 한 명을 선택하라고 하면, 선택 대상은 자신을 제외한 4명이며, 이때 자유도는 4이다. 주사위를 던질 때 나올 수 있는 값의 자유도도 6이다.
'statistics > 심리통계학의 기초' 카테고리의 다른 글
설문조사(질문지법)의 난점 (0) | 2008.02.03 |
---|---|
상관계수의 의미와 한계점 (0) | 2008.02.03 |
설계의 타당도와 측정의 타당도 (0) | 2008.02.03 |
신뢰도와 타당도의 관계에 대해 서술 (0) | 2008.02.03 |
구인타당도(구성타당도, construct validity) (0) | 2008.02.03 |