statistics/심리통계학의 기초

ABC vs D // AD vs BC // A vs B

반찬이 2008. 7. 15. 07:59

문제) ABC vs D

          AD vs BC

            A vs B

 

예를 들어, 일원 변량분석에서 변인 A, B, C, D가 있다면, 이것의 가설은 다음과 같다.

H0 : A=B=C=D 이 말은 변인 A, B, C, D가 서로 차이가 없다라는 말이다.

H1 : H0 is not true. H0는 사실과 다르다.

H1을 다른 식으로 표현하자면, 몇 개가 나올 수 있다.

A=B=C≠D, A=B≠C=D, A≠B=C=D, A≠B≠C=D, A=B≠C≠D, A≠B=C≠D 적어도 한 개는 서로 다르다.

여기에 대한 통계적 검증을 하는데, H0이 기각되면, 모집단의 평균이 서로 차이가 난다라고 말할 수 있다. 이 때, H0에 대한 검증을 단 한번만 적용하여 가설을 검증하기 때문에 over all F test or omnibus F test라고 한다. 그런데, H0가 기각되면, 어떤 실험조건들이 통계적으로 유의미한 차이를 가지는지, 평균들 사이에 어떤 특정한 양상이 존재하는지를 파악해야 하는 경우가 있다. 즉, 유의미한 차이를 보이기는 하긴 하는데, main effect가 나오기는 했는데, 뭐가 더 높게 나온 건지, 뭐가 더 낮게 나온건지 알 수가 없다. 세부적인 것을 알 수가 없다. 이 세부적인 파악을 위해 여러 번의 비교를 수행하는 것을 다중비교(multiple comparison)이라고 한다. 다중비교에는 사전비교와 사후비교가 있다.

다중비교를 하기 위해서는 집단이 A, B, C, D이라면, 서로 어떤 집단끼리 차이가 있는지를 살펴보기 위해서 서로 대비를 해 봐야 하는데, 변인이 4개일 경우 대비contrast가 모두 25개이다. 그러나, 이 모든 것을 다해 볼 필요는 없다. 그 중에서 몇 개만 뽑아서 해 보면 전체적인 윤곽을 알게 된다. 그럼 몇 개를 뽑으면 되는가? 그 원칙은 1) 집단의 개수 - 1만큼 뽑으면 되고, 2) 뽑는 것이 아무거나 뽑으면 안되고 서로 중복이 되면 안된다. 그래서, contrast가 서로 중복되지 않는다는 의미에서 orthogonal comparison(직교비교)이라고 하는데, 이는 서로 independent이다, not correlate 하다는 말이다. 뽑아놓은 대비에 가중치를 줄 수 있는데, 가중치(weight, 상수co-efficient)의 합이 0이 된다면, 직교적인 것으로 본다. (∑C1jC2j=0) 즉, 사전비교를 하기 위해서 서로 관련이 없는 것들을 뽑아야 하는데, 그러한 것을 뽑기 위해 하는 것이 바로 orthogonal comparison(직교비교)인 것이다.

[어떻게 하면, 서로 관련이 없음을 어떻게 증명할 것인가? 그것은 아무런 집단이나 비교하는 것이 아니라 계수들 간의 관련성으로 알아보는 것이다. 직교비교는 사후비교에서는 아무 의미가 없고, 사전검사와 관련된다. 사후비교에서는 검증방법이 25개 다 비교해 봐서 의미있는 것을 뽑아내야하기 때문에 직교비교는 필요없다. 그래서, 여기서는 관련이 있을 때 비교하는 것이다. 어떻게 뽑아내면, 이 뽑아낸 것이 서로 관련이 없다라는 것을 어떻게 알 수 있는 것인가? 계수간의 비교로 이 세 개가 직교한 것인가를 보게 된다.]

위의 문제에서 가중치를 둔다면,

 

 

 

A

B

C

D

1)

ABC vs D

1

1

1

-3

2)

AD vs BC

1

-1

-1

1

3)

A vs B

1

-1

0

0

비교를 하면,

1) - 2) 1+(-1)+(-1)+(-3) = -4

2) - 3) 1+1+0+0 = 2

1) - 3) 1+(-1)+0+0 = 0

따라서, 독립변인의 수준이 4개로 나뉘었을 때, 위의 경우는 orthogonal하다고 말할 수 없다. 세 개가 전부 0이 나와야 하는데, 그렇지 못하기 때문에 orthogonal하지 못하고, 뭔가 관련성이 있다라는 뜻이다.

 

위의 문제는 사전비교에서 나왔는데, 3개의 contrast로 25개의 윤곽을 전부 파악할 수 있는가? 없는가?를 알아보기 위한 것이다. 사후비교는 직교대비가 필요없고, 가능한 모든 것을 다 비교하는 것이다.

 

또 다른 문제

 

 

A

B

C

D

1)

A vs BCD

-3

1

1

1

2)

BC vs D

0

1

1

-2

3)

B vs C

0

1

-1

0

 

비교를 하면,

1) - 2) 0+1+1-2 = 0

2) - 3) 0+1-1+0 = 0

1) - 3) 0+1-1+0 = 0

 

 

수업시간에 제시한 모범답안)

한 변인의 수준이 4개일때, contrast 수는 전부 25개가 나온다. 이것을 전부 사전에 보지 않고, 3개만 보면 전체적인 윤곽을 볼 수 있다. 그런데, 이 세 가지가 orthogonal 해야 한다. 이것을 보기 위해서 ∑C1jC2j=0공식을 이용한다.

사전에 25개의 상황을 살펴보기 위해서 직교적인 contrast를 뽑아내는 것이다. 그것인가 아닌가를 보는 것이다.