statistics/심리통계학의 기초

변량분석(ANOVA)의 세 가지 통계적 가정

반찬이 2008. 2. 3. 22:13

분산분석모형의 기본가정은

1) 각 요인 수준에 대응하는 모집단은 동일한 분산을 가진다. (등분산)

2) 각 요인 수준에 대응하는 모집단은 정규분포이다.

3) 각 요인 수준에 대한 관찰치들은 임의로 얻어지는 것이며 서로 독립적이다.

(󰁾� 회귀분석에는 여기에 하나 더 들어가서 선형성의 가정이 추가된다.)

 

변량분석의 기본가정 (☆☆☆☆☆)

① J개의 실험조건을 나타내는 각각의 전집은 정상분포를 이룬다고 가정을 할 수 있어야 한다. (단, 그렇지 못할 경우에는 n>20은 되어야 함) 보통 N이 30이상이면 정상분포를 이룬다고 볼 수 있다.

② J개의 모든 전집의 변량은 동일하다는 가정을 할 수 있어야 한다.

(단, 집단간의 사례수가 같을 경우에는 상관이 없음) 등분산, 동일산 분산.

③ 모든 전집은 무선적이고 상호독립적이어야 한다.

④ 변량분석은 직선적이며 수리적 모형에서 출발한다.

즉, 한 피험자의 점수 X는 전체 평균과 실험 효과 및 오차점수의 상호독립적인 직선적 합으로 이루어져 있다고 가정한다.

⑤ F값이 1.00보다 작게 나오는 경우에는 실험설계와 통제에 어떠한 문제가 개입되어 있을 가능성을 시사한다고 보아야 한다.

 

또는,

① J개의 수준을 나타내는 각각의 모집단은 정상분포를 이루고 있어야 한다.

② 표본들이 속한 각 모집단의 변량이 같아야 하는 즉, 동변량성이어야 하는데 이는 각 집단이 동일한 사례수를 갖도록 함으로써 가능해진다.

③ 모든 표집은 무선적이고 상호독립적이어야 한다. 만약 이 가정을 위반하면 앞의 두 가정보다도 변량분석에 있어 심각한 오류가 생기게 된다.

 

분산분석은 둘 또는 셋 이상의 집단간의 평균차이를 검증하는 데 사용되며 모든 처리의 평균들이 같은가를 살펴보고 같으면 연구는 끝나지만, 같지 않은 경우 사후처치를 통하여 그 차이가 얼마이고 그것이 의미하는 바가 무엇인가를 규명한다.

분산분석의 상호작용효과는 이원분산분석에서만 나타난다.

 

# 일원분산분석과 이원분산분석의 차이

일원분산분석은 예를 들어 기계 1,2,3에 따른 생산량의 차이...

(생산량의 차이는 기계 종류에 의한 한가지 효과만 검증함.)

이원분산분석은 기계 1,2,3에 작업경력 1,2,3년에 따른 생산량의 차이...

(생산량의 차이에는 기계와 작업경력 두가지가 영향을 미침)

이원분산분석을 함으로 인해 더 많은 정보량을 제공하고 검정력도 좋아진다.

 

 

# 주효과와 상호작용효과

이원분산에서 두 개 독립변수 중에 어느 변수에 영향이 있는지를 보는 것이다.

이원분산분석은 두 변수 영향을 동시에 알아볼 수 있고, 두 개의 주효과간의 상호작용효과를 알아볼 수 있다는 장점이 있다.

두 변수의 효과를 알아보기 위해 일원분산을 두 번 시행해도 상호작용효과는 알 수 없다.

한 독립변수가 다른 독립변수의 수준에 따라 달리 작용할 때, 상호작용의 효과가 있는 것을 알 수 있는데, 상호작용 효과가 있을 때, 한 독립변수의 수준에 따라 다른 변수의 평균값의 차의 부호가 다르다. 즉, 그래프로 그렸을 때, 상호작용이 있으면 두 선의 방향이 서로 다르거나 어긋나게 (교차되어서) 그려진다. 예를 들어, 남여의 교육수준에 따른 결혼만족도를 측정할 때, 남자는 교육수준이 높아질수록 결혼만족도가 증가하나, 여자는 교육수준이 높아질수록 결혼만족도가 낮아지는 그런 경우를 예로 들 수 있다.