admission/스크랩자료

[스크랩] 신뢰도, 분산분석, ttest, 회귀분석, 비모수통계...

반찬이 2006. 5. 9. 23:54

신뢰성이란비교가능한독립된측정방법에의해대상을측정하는경우결과가비슷하게나타나야한다는것을의미한다. 즉하나의변수를측정하기위해 3개의문항으로질문하였을때그세문항의결과가비슷해야한다는것이다. 신뢰도를검증하기위해서는척도가등간척도나비율척도, 이항척도이어야한다. 일반적으로신뢰도검증을하기위한문항으로는등간척도를주로쓰고있다.

척도 정의 사례
명목척도 특성을 분류하거나 확인할 목적으로 숫자를 부여하여 측정하는 방법 당신의 성별은 무엇입니까?  ①여 ②남
서열척도 속성간의 순서관계를 밝혀주는 측정방법 귀하의 세제구입시 가장 중요하게 여기는 것의 순서를 기입해 주십시오
①가격( ) ②세척력( ) ③향기 ( ) ④비공해성(인체무해, 환경오염 무해) ( )
등간척도 속성에 대한 순위를 부여하되 순위 사이의 간격이 동일한 측정방법 평소에 환경문제를 심각하다고 느끼십니까?
①전혀 그렇지않다②별로 그렇지않다③그저 그렇다④대체로 그렇다⑤매우 그렇다

비율척도 측정값 사이의 비율계산이 가능한 척도. >귀하의 나이는 몇 세입니까? (  )세

< 분석기법 >

 1) FACTOR ANALYSIS : 요인분석. 문항들간의 상관관계를 이용하여 서로 유사한 문항들끼리 묶어 주는 방법(측정도구의 타당성 검증).

 2) RELIABILITY ANALYSIS : 신뢰도 분석. 요인분석에서 1개의 대표요인으로 묶일 수 있는 문항들, 혹은 연구자가 임의로 지정한 문항들간의 신뢰도를 측정하기 위해 신뢰계수로서 나타내는 분석기법.

 빈도분석이란 변수값들이 이루는 분포의 특성을 알아보는데 이용된다. 분포의 특성은 평균값, 중앙값, 최빈값으로 나타내어지며, 빈도수, 비율, 표준편차, 분산등으로 표본의 분포를 알 수 있다.

<표 1 > 조사대상자의 일반적 특성

변  인 범   주 빈   도 백 분 율(%)
성  별 118 57.3
88 42.7
연  령 20대 80 38.8
30대 70 34.0
40대 12 5.8
50대 44 21.4


 분산분석이란 2집단이상(독립변수)의 종속변수에 대한 평균값의 차이를 검증하는 데 이용되는 방법으로 2집단의 차이를 보고자 할 때는 T-TEST를 이용하여 t값으로 나타내고, 3집단(독립변수)이상의 차이를 보고자 할 때는 ANOVA를 이용한 F검증을 하게 된다.

<표 2> 분산분석의 사례

 분석기법   사 례
T-TEST  남녀(독립변수)간의 직무만족도(종속변수:등간척도 이상)의 차이, 남녀간의 백화점세일기간 중 구매 의욕의 차이 등
ANOVA  도시 규모(대,중,소)에 따른 임금수준의 차이, 도시규모에 따른 직무만족의 차이

<표 3> 사회인구학적 배경에 따른 직무만족도의 차이

  변인범주 평균 표준편차 t값 또는 F값
성   별    남 3.99   .56 6.35**
   여 2.98   .76
도시규모  대도시 2.15   .53 5.25*
 중도시 4.01   .88
 소도시 3.21   .79


명목자료를 이용하여 두 변수간의 상호관련성을 알아 보고자 할 때 이용되는 기법으로 통계량으로는 χ2로 나타난다.

사례 : 도시크기(대,중,소)와 도시특성(상업도시,공업도시)간의 관련성 검증.

<표 4> 도시크기와 특성간의 관계

크기/특성 공업도시 상업도시 합계
대도시 5 5 10
중도시 7 3 10
소도시 3 7 10
합  계 15 15 30
 χ2= 3.20      Sig.= .20

 상관관계란 변수들간의 관련성을 분석하기 위한 방법으로 하나의 변수가 다른 변수와 어느 정도 밀접한 관련성을 갖고 변화하는가를 알아보기 위해 이용된다. 이 기법을 이용하기 위해서는 두 변수가 등간척도와 비율척도로 측정되어야 한다.

사례 :도시인구와 대기오염도간의 상관관계, 나이와 몸무게와의 상관관계 등

<표 5>도시크기와 대기오염간의 상관관계 * p<.05  ***p<.001

구분 대기오염도
도시인구 .5986***
도용인구 .1012
소득 .4225*

회귀분석이란 변수들간의 상호관계를 분석하고 특정변수(독립변수)의 변화로부터 다른 변수(종속변수)의 변화를 예측하기 위하여 사용된다. 종속변수에 영향을 미치는 변수를 규명하고 이들 변수들에 의해서 하나의 선형방정식을 도출하는데 이 회귀식이 종속변수를 어느 정도 예측해 줄 수 있으며 회귀식에 포함된 독립변수들 중에서 어느 변수가 가장 예측력이 높은지도 검증하게 된다. 다시 말해서, 회귀분석은 변수들간의 상호관련성을 분석하는 데 있어서 독립변수와 종속변수의 관련성의 강도와 독립변수의 값의 변화에 따른 종속변수의 값의 변화의 예측에 초점을 두게 된다.

사례 :직무만족에 영향을 미치는 요인 분석    - 종속변수(직무만족), 독립변수(직무자체, 급여, 승진, 복지시설 )

<표 6> 직무만족도에 미치는 영향

구  분 회귀계수 T T의 유의도 R2
직무자체 .1018 .6512 2325     .63***
급  여 .2390 6.029 .0000
승  진 .3101 6.211 .0000
복지시설 .1283 .3011 .1241
상  수 6.3201 2.895 .0076

p<.001    회귀식: 직무만족도= 상수 + β1·직무자체  + β2·급여 + β3·승진 + β4·복지시설                  ·β1:.0  β2:.2390 β3:.3101 β4:0

실전 논문통계 예제

...중략

Ⅱ. 조사연구

 1. 자료수집의 방법

① 면접법

전문가의 의견을 수집하거나 경험자의 경험담이 필요한 경우, 또는 심리학적으로 보다 상세한 자료가 요구되는 경우에 사용된다. 이 방법은 시간과 비용이 많이 들고 면접 전문가를 구하는 것이 어려운 점이 단점이다.

② 관찰법

연구자가 상황을 통제하거나 또는 자연스러운 상태에서 발생하는 상황들을 직접 관찰하고 그 변화의 정도를 기록하는 방식

③ 설문지법

사회과학 연구에서 가장 많이 사용되는 방법으로서 시간과 경비가 절감되는 장점이 있는 반면 설문개발의 기술적인 부분과 상당수준의 전문지식이 필요하다는 어려움이 있다.
설문지 작성시 유의할 점 몇 가지를 살펴보면 설문문항은 20∼30개 정도로 하고 구체적인 낱말사용과 응답방식이 연구목적과 사용할 분석방법과 조화를 이루어야 한다는 점, 그리고 대조적인 설문문항은 거리를 두어서 배치할 것과 기존 연구에서 사용한 설문을 응용하여 작성해도 좋다. 마지막으로 설문의 내용이 응답자와 조화를 이루어야 한다.

 2. 변수(변인, variable)

(1) 변수의 개념
  연구의 대상이 되고 있는 일련의 개체(분석되는 단위)가 어떤 속성에 있어서 서로 구별될 수 있을 때 이러한 속성들을 변수라고 한다. 예를 들어 개인의 경우 성별, 연령, 학력, 종교, 생활수준 등과 같은 조건들이 개인을 구별해 주는 속성이 되는 것이다.  3. 가설설정과 검정

(1) 가설의 의미
  가설이란 실증적인 증명에 앞서 세우는 잠정적인 진술이며 나중에 논리적으로 검정될 수 있는 명제로 연구결과에 따라 기각이나 수정될 수 있다.   

 ① 귀무가설(영가설)   통계량의 차이는 단지 우연의 법칙에서 나온 표본추출오차로 생긴 정도로 통계치가 제공하는 확률의 측면에서 평가하는 것, 즉 두 변수간의 관계가 없다 또는 차이가 없다는 부정적 형태로 진술하는 가설 (예, Ho : A 정당을 지지하는 유권자의 평균나이는 35세이다. 또는 Ho : μ = 35)

 ② 연구가설      통계량의 차이는 표본이 대표하는 모집단의 모수와 유의한 차이가 있다는 진술로 변수간의 관계나 차이를 긍정적인 형태로 진술하는 가설이다. 논리적 대안으로서 검정하고자 하는 현상에 관한 예측이며 대립가설, 대체가설 이라고도 한다. (예, H₁: μ ≠ 35)

 (2) 가설검정 절차

  가설검정이란 가설을 채택 또는 기각하는 절차를 말한다. 가설검정 절차는 다섯가지로 나눌 수 있다.

 ① 귀무가설(영가설)과 연구가설의 설정

   일반적으로 현재까지 주장되어 온 것을 귀무가설로 정하고, 기존 상태로부터 새로운 변화 또는 효과가 존재한다는 주장을 연구가설로 정한다. 여기서 가설의 채택 또는 기각 대상은 귀무가설이다.

 ② 유의도 수준(sig, signigicant level)과 임계치의 결정      유의도 수준은α 또는 P(probability : 확률)로 표시한다. 유의수준 α와 가설을 채택하거나 기각시키는 판단기준인 임계치를 정한다.   유의도 수준은 보통 α=0.10 또는 p<0.10, α=0.05 또는 p<0.05, α=0.01 또는 p<0.01, α=0.001 또는 p<0.001로 나타낸다. 예를 들어 α=0.05 수준에서 p<0.05로 표기할 수 있는데 이것은 계산된 확률수준이 0.05보다 작으면 귀무가설(영가설)을 기각시킨다는 의미이다. 이때 통계적으로 유의하다라고 해석하고 만일 P<0.01이면 매우 유의하다라고 한다.

※   * P<.05
      ** P<.01
    *** P<.001
     따라서 p<.05 수준이면 통계적으로 유의적인 차이를 보인다는 의미이고,
p>.05 수준이면 통계적으로 유의적인 차이를 보이지 않았다고 말한다.

 ③ 귀무가설의 채택영역과 기각영역 설정
 ④ 통계량의 계산
 ⑤ 통계량과 임계치의 비교 및 결론

 Ⅲ. 통계 분석방법

 1. 빈도분석(Frequency Analysis)

  빈도분석은  설문조사 결과에 대한 중요한 기초정보를 가장 간편하게 알려주는 분석 방법이다. 빈도분석은 한 변수내의 각 범주들에 속해 있는 사례(응답자수)들이 얼마인지를 알려주는 것(빈도)이며, 이들 각 사례수들이 전체 응답자 중에 차지하고 있는 비율(%)을 동시에 보여 준다.
 빈도분석은 원자료의 내용들이 빈도분포표 상에서 어떠한 분포적 특성을 가지고 있는지를 파악하는데 이용되고 있다. 이들 분포들의 특성을 나타내는 통계량들은 첫째, 빈도, 상대적 백분율, 누적빈도와 같은 빈도분포표로 구성되어 있고 둘째, 최빈값(mode), 중앙값(median), 산술평균(mean)과 같은 중심화경향과 관련된 분포의 형태를 나타내는 것으로 구성되어 있으며 셋째, 범위, 평균편차, 분산, 표준편차 등으로 이들은 데이터가 흩어진 정도를 나타내고 있다.
  이러한 값들은 통계패키지에 의해 쉽게 계산될 수 있다. 또한 이같은 특성치들을 하나의 막대그래프(bar chart)나 히스토그램(histogram)으로 도식화하여 나타내기도 한다.

   <표> 1달에 비디오방 가는 횟수

빈도(명) 백분율(%)
없다 681 90.8
한 달에 1회 45 6.0
한 달에 2∼3회 16 2.1
1주일에 1-2회 2 .3
무응답 6 .8
Total 750 100.0

<표 >한 달에 비디오방 가는 횟수에 대한 물음에서는 없다가 90.8%로 가장 많았고 한 달에 1회 6.0%, 한 달에 2∼3회 2.1%, 1주일에 1-2회가 3% 순으로 나타났다.

2. 기술통계분석(Descriptive Statistics)

빈도분석과 비슷하지만 기술 통계분석의 경우 등간변수와 비율변수와 같은 연속적 데이터를 분석할 때 주로 사용하고 필요한 통계량만을 지정하여 보다 간단하게 자료의 분포를 살펴볼 수 있다. 특히 OPTION을 이용하여 표준화된 변수를 얻을 수 있다.

기술통계분석 결과의 해석>

N Minimum Maximum Mean Std. Deviation
V01 20 22 35 28.35 4.36
V02 20 2 14 6.85 3.63
Valid N 20

㉠ N : 응답자수 ㉡ Minimum : 최소값 ㉢ Maximum : 최대값 ㉣ Mean : 평균 ㉤ Std. Deviation : 표준편차
  여기에서 표준편차는 개별값들이 평균으로부터 떨어져 있는 정도를 알려주기 때문에 평균과 표준편차는 같이 제시되는 것이 원칙이다.

 3. 교차분석(Crosstabulation Analysis)

  수집된 자료를 어떤 분류기준(주로 명목변수)에 따라 두 개의 변수를 동시에 교차(cross)하는 교차표를 만들어 각각에 해당하는 빈도와 비율의 경우의 수까지 모두 구할 수 있는 분석방법이다. 주의할 것은 교차분석에서는 두 변수(예를 들어 성별, 학력)중 어느 한 쪽이라도 무응답인 경우는 제외되기 때문에 응답자가 줄어들 수도 있다.  

<표> 놀이활동에 대한 정보를 얻는 경로

학교 친구,선후배 TV, 라디오 PC통신 인터넷 서클활동 기타 Total

(p)

학교구분 인문계 21 94 37 28 2 182 13.851* (.017)
11.5% 51.6% 20.3% 15.4% 1.1% 100.0%
실업계 15 142 27 39 3 7 233
6.4% 60.9% 11.6% 16.7% 1.3% 3.0% 100.0%
Total 36 236 64 67 3 9 415
8.7% 56.9% 15.4% 16.1% .7% 2.2% 100.0%
학년 1학년 16 60 19 30 1 2 128 11.841* (.037)
12.5% 46.9% 14.8% 23.4% .8% 1.6% 100.0%
2학년 20 164 44 35 2 7 272
7.4% 60.3% 16.2% 12.9% .7% 2.6% 100.0%
Total 36 224 63 65 3 9 400
9.0% 56.0% 15.8% 16.3% .8% 2.3% 100.0%

<표> 고양시 학생들에게 놀이활동에 대한 정보를 얻는 경로에 관해서 물어 본 결과 인문계학생은 친구나 선후배가 51.6%로 가장 많았고 그 다음으로 TV, 라디오, 각종잡지가 20.3%순으로 의견을 보인 반면 실업계 학생은 친구나 선후배가 60.9%로 가장 많았고 그 다음으로는 PC통신 및 인터넷이 16.7%로 나타났다. 이는 통계적으로도 유의수준 p<.05 수준에서 유의적인 차이를 보였다.  

 3. 복수응답분석(Multiple Resoponse)

  복수응답이란 2개 또는 몇 개가 우선 순위 없이 응답항목의 숫자가 확정되어 있는 경우를 말한다. 복수응답을 분석하는 방법으로는 하나의 변수를 선택된 변수값만 코딩·입력하는 방법(범주형)과 선택·비선택(Yes, No 양분형)으로 코딩 입력하는 경우가 있다.  복수응답의 경우 각 응답의 전체 구성비가 응답자의 수에 가중이 되므로 각 성별 전체 선호도의 합계가 100.0%가 아니라 그 이상이 된다.

<표 > 학부모회의 법제화 - 복수응답

학교급별 total
중학교 고등학교 n %
n % n %
상호 정보교환과 협조 25 48.1% 34 60.7% 59 54.6%
교육청 건의사항 협의 30 57.7% 31 55.4% 61 56.5%
운영위원 역할강화 방안 18 34.6% 21 37.5% 39 36.1%
운영위원 연수 및 발전방안 연구 17 32.7% 17 30.4% 34 31.5%
total 52 100.0% 56 100.0% 108 100.0%

  <표 > 학부모회의 법제화에 대해 학교급별에 대해 살펴보면 전체적으로 볼 때 교육청 건의사항 협의가 56.5%, 상호 정보교환과 협조가 54.6%, 운영위원 역할강화 방안이 36.1%, 운영위원 연수 및 발전방안 연구가 31.5%로 나타났다. 이를 학교급별로 살펴보면 중학교의 경우 교육청 건의사항 협의가 57.7%, 상호 정보교환과 협조가 48.1%, 운영위원 역할강화방안이 34.6%, 운영위원 연수 및 발전방안 연구가 32.7%로 나타났으며 고등학교의 경우  상호정보교환과 협조는 60.7%, 교육청 건의사항 협의는 55.4%, 운영위원 역할강화 방안이 37.5%, 운영위원 연수 및 발전방안 연구가 30.4%로 나타났다.

 4. 신뢰도와 타당도 분석

 (1) 신뢰도 분석(Reliability Analysis)
신뢰도란 동일한 대상, 특성 또는 구성을 비교가능하고 독자적인 측정으로 나타난 결과들이 어느 정도 유사한 가를 나타내는 것으로 의존가능성, 안전성, 일관성, 예측가능성, 정확성 등의 동의어로 사용된다. 즉, 신뢰성이란 동일한 개념에 대하여 측정을 되풀이했을 때 동일한 측정값을 얻을 가능성을 말한다.
신뢰도 분석은 측정하고자 하는 개념이 조사대상자로부터 정확하고 일관되게 측정되었는지 또는 설문에 응답하는 사람이 정확하고 일관되게 측정에 응하였는가를 분석할 때 사용하는 것이다.
신뢰성의 측정방법은 동일한 측정도구를 동일한 대상에 시간을 달리하여 적용결과를 비교하는 검증-재검증, 항목분할 측정치의 상관도, 내적일관성 등이 있다.
  신뢰성 분석은 측정도구의 신뢰성(reliability)을 확인하기 위한 분석방법으로서  가장 널리 사용되는 신뢰도 계수는 Cronbach's alpha로 신뢰도 계수 alpha(α)는 검사의 내적 일관성(internal consistency)을 나타내는 값으로서 한 검사 내에서의 변수들간의 평균상관관계에 근거해 검사문항들이 동질적인 요소로 구성되어 있는지를 알아보고자 하는 것이다.
신뢰성분석은 일반적으로 Cronbach's alpha와 같은 신뢰성 척도를 사용하며, alpha는 테스트의 내적 일관성(internal consistency), 즉 검사 문항이 동질적인 요소로 구성되어 있는지를 알아보는데 그 초점을 두고 있다. 일반적으로 신뢰성 척도인 Cronbach's alpha의 값이 .60 이상이면 신뢰성이 있다고 보며 전체 항목을 하나의 척도로 종합하여 분석할 수도 있다. 일반적으로 사회과학에서 0.6이상이면 비교적 신뢰성이 높다고 한다.
  신뢰도 분석에서 α계수란 하나의 개념에 대하여 여러 개의 항목으로 구성된 척도를 이용할 경우에 해당문항을 가지고 가능한 모든 분산신뢰도를 구하고 이들의 평균치를 산출한 것이다.  (여기서 분산신뢰도란 예를 들어 직무만족도에 대해서 여러 개의 항목으로 측정하는 경우 무작위로 측정항목을 두 집단으로 나누고 이들 측정치간의 상관관계를 분석하여 신뢰도를 측정하는 방법이다)

<표> 상황적 보상 하위변인의 신뢰도 분석

구 분 M (평균) SD (표준편차) 계수
상황적 보상 나의 상관은 나의 근무노력에 대한 보상으로 나에게 많은 도움을 준다 3.9756 1.0688 .7922
나의 상관은 목표 달성에 책임을 지고 있는 담당자와 구체적인 측면에 대하여 자주 의논한다 3.9018 1.0375
나의 상관은 성과 목표가 달성되었을 때 부하가 받게 될 것이라고 생각되는 이익이나 보상을 분명하게 제시해 준다 3.5389 1.2051
내가 상관의 기대에 부응했을 때 상사는 만족감을 표현한다 3.9485 .9510

 (2) 타당도 분석
  타당도(Validity)는 측정하고자 하는 개념이나 속성을 정확히 측정하였는가를 나타내는 개념이다.   측정도구의 타당성을 검증하기 위해서는 요인분석(Factor Analysis)을 이용하는데 이는 측정변수들 사이에 구성적 타당성 즉, 수렴적 타당성(convergent validity)과 차별적 타당성(discriminant validity)을 제시해 줄 수 있기 때문이다.
요인분석이란 여러 변인간의 상호관계로부터 공통변량을 구하고, 측정치의 중복성을 찾아내어 몇 개의 기본적인 변인 즉, 몇 개의 변인군을 추출하는데 사용되는 기법이다. 즉 요인분석에는 표본의 수가 50개 이상이어야 한다. 본 연구는 표본수가 491개이므로 이 요건을 충분히 충족시킨다고 볼 수 있다.
요인추출시 준거기준은 고유값(eigenvalue)이 1.0이상인 요인에 한하며 부하량이 0.3이하 인 항복들은 의미가 없으므로 제거하였다. 주의할 것은 신뢰도가 높아진다고 해서 타당도가 높아지는 것은 아니다.  그러나 타당도가 높아지면 신뢰도가 높아지게 된다.  

4. 타당성 분석
타당성이란 측정도구가 측정하고자 하는 것을 정확히 측정할 수 있는 정도를 의미하며, 내용타당성(content validity), 기준관련타당성(criterion- related validity) 및 구성타당성(construct validity)의 세가지 유형이 있다. 내용타당성은 측정항목들이 측정하고 있는 변수의 모든 내용을 포함하고 있는 정도로서 수량화하기 어렵기 때문에 연구자가 주관적으로 판단하여야 하는 단점이 있다. 내용타당성은 연구자가 측정항목이 측정하고 있는 변수의 모든 측면을 얼마나 잘 포함되도록 만들었는가에 따라 연구의 내용이 달라질 수 있으며, 본 연구에서는 문헌연구와 인터넷쇼핑몰에 관심이 높은 소비자의 의견을 수렴하여 개발되었기 때문에 내용타당성이 있는 것으로 판단한다. 기준관련타당성은 측정도구가 다른 관련기준의 측정치와 관련된 정도를 의미하며, 본 연구에서는 품질경영의 품질요인과 이용만족도와 관련된 검정에서 평가될 것이다. 마지막으로 구성타당성은 측정척도가 원래 측정하려고 의도한 이론적 구성이나 특징을 측정한 정도를 의미한다. 이것을 검정하는 통계적 방법으로는 일반적으로 요인분석(factor analysis)을 실시하며, 본 연구는 요인분석대상 항목수에 대해 4∼5배 이상의 표본수를 확보하였기 때문에 구성타당성을 검정하기 위해 <표 4-10>과 같이 요인분석을 실시하였다.

이용과정의 품질요인에 대한 요인분석

. 요 인(관심영역)
신뢰성 신속성 보장성 다양성 정보성
지불수단의 안전 .839 .131 .350 .140 -5.483E-02
판매자의 신뢰(결제에서) .839 6.098E-02 .120 .223 3.341E-02
환불과 반품의 안전 .823 1.453E-02 .107 .234 8.739E-02
개인정보 제공의 안전 .821 8.772E-02 1.208E-02 2.877E-02 2.023E-02
인증마크의 획득여부 .816 .141 .380 .168 -6.159E-02
시스템의 안전 및 편리 .669 7.796E-02 .173 .106 .191
전자우편, 전화로 연락 8.600E-02 .902 6.433E-02 .122 3.030E-02
고객대응 능력 4.569E-02 .886 .120 7.919E-02 4.169E-02
주문의 입력 및 취소의 편리 .122 .867 1.816E-02 6.260E-03 .182
배달과정에서 정확 .122 .867 1.816E-02 6.260E-03 .182
쇼핑시간의 단축 3.415E-02 .753 6.432E-02 .146 4.025E-02
할인율의 정보 .104 5.151E-02 .848 -6.761E-03 .343
상품 및 서비스 가격 .324 .204 .843 .190 2.543E-03
미끼상품 등으로 방문유도 .372 .201 .830 .187 3.594E-02
구매실적에 따른 보상 .165 -.147 .814 .283 -.256
품질과 A/S의 보장 -8.700E-02 -6.388E-02 -.671 .224 .405
상품 및 서비스의 체계적 분류 .205 .144 .134 .826 -3.906E-02
일반적 상품 및 서비스의 제공 4.276E-02 .124 3.235E-02 .821 3.426E-02
상품 및 서비스 검색의 편리 .128 .240 .189 .783 .165
새로운 상품 및 서비스의 개발 .261 6.614E-02 .241 .768 .210
다양한 상품 및 서비스를 제공 .227 -.143 -.157 .511 .102
상품 및 서비스의 정보 1.642E-02 -2.452E-02 -.173 .232 .813
개별적으로 정보를 교환 -7.866E-02 .303 9.666E-02 .136 .805
부가정보 및 서비스의 제공 .311 .316 1.683E-02 -.104 .803
고객정보의 활용 .465 1.020E-02 -1.959E-02 .385 .473
요인수 아이겐값 전체분산(%) 1 4.331 72.183 1 3.814 76.281 1 3.602 72.030 1 3.153 63.055 1 2.502 62.543
요인추출방법 : 주성분 분석(Principal Component Analysis) 회전방법 : Kaiser 정규화가 있는 베리맥스(Varimax with Kaiser Normalization) a : 7번 반복계산해서 요인회전이 수렴되었슴(Rotation converged in 7 iterations)

5. t 검증(t-test)    t-검정이란 두 모집단의 평균의 차이 유무를 판단하는 통계적 검정방법으로, "두 모집단의 평균간의 차이는 없다."라는 귀무가설과 "두 모집단의 평균간에 차이가 있다."라는 대립가설중에 하나를 선택하는 통계적 검정방법이다. 모든 통계적 검정방법과 마찬가지로, t-검정은 귀무가설이 옳다는 가정 하에 두 모집단으로부터 추출된 표본들로부터 계산된 검정통계량(t값)에 근거하여 귀무가설을 부정할 수 있는 상당한 근거를 보이면 귀무가설을 기각하고, 그렇지 않은 경우에는 귀무가설을 받아들이게 된다.   좀 더 통계적인 표현으로 검정절차를 묘사하면, 귀무가설하에서 두 집단의 표본평균(sample mean)간의 차이는 표본오차(sampling error)에서 기인한 것이라고 간주한다. 즉, 두 표본평균간의 차이가 표본을 잘못 추출한 데서 비롯된 것이라고 가정한다. 그런 후 t-검정통계량(t-값)을 계산하여 두 표본평균간의 차이가 귀무가설하에 있을 확률, 즉 표본오차로 인해 차이가 발생할 확률(유의확률: p-value)을 계산한다. 만약 계산된 확률이 귀무가설을 기각하기로 설정한 유의수준(1% 혹은 5%)과 같거나 작다면 귀무가설을 기각하고 대립가설을 채택하게 된다.   t-검정은 두 모집단의 독립여부에 따라 독립표본 t-test와 대응2표본 t-검정(paired-sample t-test)으로 나눌 수 있다.
 (1) 독립표본의 t 검증(Independent Samples t-test)
  독립된 두 개의 전체 표본 평균간의 차이를 검증하는 방법으로 두 집단간의 평균의 차이가 통계적으로 유의미한지를 파악할 때 사용하고 독립변수는 두 개의 집단이어야 한다.   

<표 > 성별에 따른 공감 구성요소별 차이 검증
구분 성별 평균 (Mean) 표준편차 (Std. Deviation) t Sig.
감정재인 남자 15.3333 3.5707 -2.753* .013
여자 20.0000 3.9243
조망취하기 남자 30.2222 3.8006 .733 .473
여자 29.0909 3.1130
상상하기 남자 32.4444 3.2830 -.587 .565
여자 33.3636 3.6407
인지적요소 남자 77.4444 4.4190 -1.640 .118
여자 81.8182 6.9111
공감적관심 남자 15.6667 1.4142 1.208 .243
여자 14.5455 2.4643
공감정서 남자 54.6667 7.0711 -.392 .700
여자 55.9091 7.0350
공감적각성 남자 14.1111 .7817 .830 .418
여자 13.7273 1.1909
정서적요소 남자 84.4444 7.3333 .072 .943
여자 84.1818 8.6697
                                                         *p<.05

잠정재인의 경우 남자의 경우 평균 15.33점, 여자 20.0점으로 여자의 경우가 높게 나타났고 유의수준 p<.05 수준에서 유의적인 차이를 보임을 알 수 있다. 조망취하기의 경우 남자 30.2, 여자 29.0점으로 남자가 높게 나타났지만 유의수준 p>.05 수준에서 유의적인 차이를 보이지 않았다.  상상하기의 경우 남자 32.4점, 여자 33.4점으로 여자 조금 높게 나타났지만 유의수준 p>.05 수준에서 유의적인 차이를 보이지 않았다.  인지적 요소의 경우는 남자 77.4점, 여자 81.8점으로 여자가 높았고, 공감적 관심의 경우는 남자 15.7점, 여자 14.5점으로 남자가 높았으며,  공감정서의 경우도 남자 54.7점, 여자 55.9점으로 여자가 높았고, 공감적 각성의 경우 남자 14.1점, 여자 13.7점으로 남자가 높았고 마직막으로 정서적 요소의 경우는 남자 84.4점, 여자 84.2점으로 남자가 높게 나타났지만 유의수준 p>.05수준에서 유의적인 차이를 보이지 않았다.

 (2) 대응비교 t 검증(Paired Samples t-test)
  동일한 표본에서 두 변수의 개별 평균의 차이를 비교할 경우, 흔히 사전, 사후검사의 평균 차이를 검증할 때 사용하는 방법
  예를 들어 사물놀이 프로그램을 투입 받은 실험집단과 프로그램을 투입하지 않은 통제집단간에 차이가 있는지를 알아보기 위해 t-검증을 살펴보면 아래와 같다.

<표 > 또래관계의 사전검사결과

 

구분 응답자 평균(M) 표준편차 (SD) t(p)
실험집단 20 8.5000 1.5728 .609 (.546)
통제집단 20 8.2000 1.5424
평균값의 차이 .30

  <표 > 또래관계의 사전검사결과에 대해서 살펴보면 실험집단이 8.50점, 통제집단은 8.20점으로 나타났지만 통계적으로 유의미한 차이를 보이지 않았다(p>.05) 따라서 또래관계에 있어서도 두 집단은 서로 동질집단이라고 해석할 수 있다.

<표 > 또래관계의 사후검사결과

구분 응답자 평균(M) 표준편차 (SD) t(p)
실험집단 20 9.3500 .6708 4.313 (.000)***
통제집단 20 7.7500 1.5174
평균값의 차이 1.6
                                                 ***p<.001

  <표 > 또래관계의 사후검사결과에 대해서 살펴보면 실험집단이 9.35점, 통제집단은 7.75점으로 나타나 사물놀이를 통해 실험집단의 아동들의 또래관계 점수가 높게 나타났고 통계적으로도 유의미한 차이를 보였다(p<.001).
6. 일원 변량 분석(One Way ANOVA, F 검증, 분산분석)
  변량분석은 한 요인(변수)내에 있는 두 독립표본(개별집단) 이상의 종속변수의 평균차이가 유의미한지를 비교할 때 사용한다.   일원분산분석(One-way ANOVA)은 단일요인변수(독립변수)에 의해 종속변수에 대한 평균치의 차이를 검정하는데 이용한다. 범주들 간의 경향을 검정할 수 있고 비교(contrasts)를 정의할 수도 있으며, 그리고 범위검정의 다양성을 이용할 수도 있다. 일원분산분석을 위한 최소한의 조건은 종속변수(등간척도)가 하나이어야 하며 정수값을 갖는 요인변수가 하나이어야 하고 요인변수가 정의되어야 한다.     

<표 > 연령에 따른  실험 사후 집단간 분산분석(어머니)

평균(Mean) 표준편차 (Std.Deviation) F Sig.
결과예측 저연령 1.0000 .0000 1.500 .274
중연령 1.2000 .4472
고연령 1.6000 .5477
Total 1.3333 .4924
대안 저연령 1.0000 .0000 1.538 .262
중연령 1.4000 .5477
고연령 1.8000 .8367
Total 1.4615 .6602
원인적사고 저연령 1.0000 .0000

-

-

중연령 1.0000 .0000
고연령 1.0000 .0000
Total 1.0000 .0000

  어머니의 경우 결과예측에서 고연령이 가장 높게 나타났으며, 저연령이 가장 낮은 평균값을 보였으나 통계적으로 유의적인 차이를 보이지는 않았다. 대안의 경우에도 고연령이 가장 높게 나타났으며, 저연령이 가장 낮은 평균값을 보였으나 통계적으로 유의적인 차이를 보이지는 않았다. 원인적 사고의 경우에는 세집단이 동일한 평균값을 보였다. 교사의 경우를 살펴보면 결과예측의 경우 고연령이 가장 높게 나타났으며, 중연령, 저연령순으로 나타났지만 유의수준 p<.05 수준에서 유의적인 차이는 보이지 않았다.   대안의 경우에도 고연령, 중연령, 저연령순으로 나타났지만 통계적으로 유의한 차이는 보이지 않았다. 원인적사고의 경우 고연령이 가장 높고 저연령과 중연령이 동일한 평균값을 보였으나 유의한 차이는 보이지 않았다.

7. 이원분산분석(다변량 분석, Two-way ANOVA)      두 개 이상의 독립변수를 이용하여 여러 집단들이 차이를 보이는가를 분석하는 방법 (예를 들어 성별과 학력별로 동시에 평균 연령의 차이가 있는지 알아 볼 경우)   이 경우 두 독립변수가 서로 영향을 미치는 상호작용도 같이 분석해 낼 수 있어 일원변량분석 보다 다양하고 정확한 분석을 할 수 있다.
8. 공변량 분석    사전효과를 통제하면서 순수한 실험효과만을 측정하고자 할 때에 유용하게 이용할 수 있는 통계방법    예를 들어 ca점수와 IQ점수를 통제하여 성별에 따라 자아개념 차이를 살펴보기 위해 공변량 분석(Ancova)을 알아보면 다음과 같다.

<표 > 성별 자아개념 점수 차이에 대한 공변량 분석

Sum of Squares df Mean Square F p.
공변인 (Combined) 149.692 2 74.846 4.012 .027
ca구분 47.819 1 47.819 2.563 .118
지능구분 146.188 1 146.188 2.835 .123
주효과 성별 9.834 1 9.834 .527 .473
잔차 671.658 36 18.657
전체 836.975 39 21.461

  <표 >에서 제시된 바와 같이 통제변인인 ca와 지능은 자아개념에 대해 유의한 차이가 없었으며 성별로도 자아개념에 대한 차이는 없었다(p>.05).

9. 상관분석(Correlation Analysis)
  상관관계(Correlation)분석이란 연구하고자 하는 변수들간의 관련성을 분석하기 위해 사용하는 분석 방법으로서, 하나의 변수가 다른 변수와 관련성이 있는지, 있다면 어느 정도의 관련성이 있는지를 알아보기 위한  분석기법이다.  변수들간의 관련성은 위해 상관계수인 피어슨(Pearson) R계수를 이용해 관련성의 유무와 정도를 파악한다.   변수들간의 상관관계분석은 연구의 이론적 체계에 도입된 변수들간의 관계를 개관할 수 있고, 설정된 가설의 검증관계를 예측할 수 있는 선행자료가 된다는 점에서 중요하게 다루어진다.   상관관계의 종류에는 그 분류에 따라 Y와 X간의 상관관계를 나타내는 단순상관관계(Simple Correlation), 둘 또는 그 이상의 변수들이 어느 한 변수와 갖는 관계의 정도를 파악하기 위한 다중상관관계(Multiple Correlation), 두 변수의 관계의 정도를 파악하고자 하는데 제3의 변수가 이 둘 변수 모두에 영향을 미치고 있을 때 이를 통제한 다음 분석하는 편상관관계(Partial Corelation), 제3의 변수가 어느 한 변수에만 영향 미치는 경우 이를 통제한 후 분석하는 부분상관관계(Semipartial Correlation)가 있다(여기서는 많이 사용하는 단순상관관계분석과 다중상관관계 분석만을 다룬다). 상관관계분석에서 보편적으로 자주 이용되는 척도가 피어슨 상관계수(Pearson correlation coefficient : r)이다. 상관계수 r은 -1에서 +1까지의 값을 가진다. 즉 측정된 자료가 좌표상에 정(positive, +)의 기울기를 갖는 직선에 가깝다면 그때의 상관계수는 정(+)이고, 음(negative, -)의 기울기를 갖는 직선에 가깝다면 음(-)의 상관계수를 갖는다. 그리고 이러한 선형적인 상관관계를 갖지 않는 경우 상관관계는 0에 가까워진다. 예를 들어 공감구성요소별 능력의 각 변인들간의 상호상관도를 알아보면 아래와 같다.


<표> 공감구성요소별 능력의 각 변인들간의 상호상관도

구분 인지적요소 정서적요소
인지적요소 감정 재인 조망 취하기 상상 하기 정서적요소 공감적관심 공감 정서 공감적각성
인지적요소 1.000
감정재인 .514** 1.000
조망취하기 .443 -.184 1.000
상상하기 .585*** -.018 .003 1.000
정서적요소 .465** .159 .333 .338 1.000
공감적관심 .298 .018 .196 .125 .344 1.000
공감정서 .393 .177 .281 .308 .952*** .061 1.000
공감적각성 .331 -.002 .277 .269 .599*** .200 .477** 1.000
                                                 **p<.01 ***p<.001
<표 > 인지적요소와 인지적요소의 하위변인인 감정재인과의 상관계수값은 r=.514(p<.01), 조망취하기(r=.443), 상상하기(r=.585, p<.001)로 나타나 감정재인과 상상하기의 경우 유의적인 상관관계를 보임을 알 수 있으나 조망취하기의 경우 인지적요소에 유의적인 상관을 보이지 않음을 알 수 있다. 정서적요소의 경우 인지적 요소와 r=.465(p<.01)로 유의적인 상관을 보였지만 나머지 하위변인과는 유의적인 상관을 보이지 않음을 알 수 있다.
반면, 정서적요소와 정서적 요소의 하위변인인 공감적 관심과의 상관계수값은 r=.344, 공감정서(r=.952, p<.001), 공감적각성(r=.599, p<.001)로 나타나 공감정서와 공감적 각성의 경우 정서적 요소와 유의적인 정적(+)상관관계를 보임을 알 수 있으나 공감적관심의 경우 정서적 요소에 유의적인 상관을 보이지 않음을 알수 있다. 인지적 요소의 경우 정서적 요소와 r=.465(p<.01)로 유의적인 상관을 보였지만 나머지 하위변인과는 유의적인 상관을 보이지 않음을 알 수 있다.
※ 상관관계 해석에 대한 기준에 대한 설명은 아래와 같다.
        1.00  : 완전한 상관관계
  0.90 - 0.99
  0.70 - 0.90 : 높은 상관관계
  0.40 - 0.70 : 중간정도의 상관관계
  0.20 - 0.40 : 낮은 상관관계
  0.10 - 0.20 : 극히 낮은 상관관계
10. 회귀분석(Regression)
  한 변수가 다른 변수들과 어떠한 관계가 있는지(영향을 미치는지, 인과관계가 있는지 등)를 분석하기 위하여 사용되는 방법으로 한 변수의 값을 가지고 다른 변수의 값을 예언해 주는 방법  (1) 단순회귀분석
  독립변수와 종속변수가 각각 하나일 경우 독립변수가 종속변수에 미치는 영향, 또는 어떤 관계가 있는지, 인과가 있는지 등을 분석하고자 할 경우에 사용하는 분석방법
 (2) 중다회귀분석
  여러 독립변수가 동시에 한 종속변수에 미치는 영향을 분석할 때 사용하는 방법
<표 > 거래적·변혁적 리더쉽이 동기부여 효과에 미치는 영향
종속 변수 독립 변수 기울기(B) 표준오차 (Std. Error) 표준화된B값(Beta) t(p) F R Square
동기부여 (Constant) -5.408E-02 .120 -.450 (.653) 333.165 *** (.000) .776
상황보상 .134 .044 .124 3.041** (.002)
예외관리 -7.551E-02 .031 -.056 -2.456* (.014)
카리스마 .436 .056 .346 7.841*** (.000)
지적자극 .183 .043 .145 4.269*** (.000)
개별관심 .347 .044 .346 7.851*** (.000)

본 회귀선은 전체의 77.6%를 설명(R2)하고 있으며 변량분석 모델 검증(F비)을 보면 알 수 있듯이 유의미한 것(p<.001)으로 나타났다. 또한 '카리스마'와 '지적자극', '개별관심'은 p<.001에서 '상황보상'은 p<.01, '예외관리'는 p<.05에서 유의한 영향력을 가지며 이들 변수(예외관리는 不의 영향력)들은 동기부여에 正의 영향력을 미치는 것으로 나타났다.
11. 비모수 통계 분석
  비모수 통계학은 모집단의 특성분포에 대한 어떤 가정을 하지 않은 상태에서 모집단의 특성을 추정하는 분석방법으로 선형성, 정규분포성 등의 조건이 없어도 되며 가설 검증력이 모수적 추리통계에 비해서 정밀하지 못하다.
  이 분석 방법은 자료를 명목척도나 순위척도로 측정하는 경우와 표본의 크기가 매우 작은 경우(예, 희귀한 질병이나 예비연구 자료를 수집할 경우)에 유용한 방법이고 모수적 방법에 대한 적용이 용이하고, 이해가 쉬우므로 신속한 검정을 할 수 있다.
  비모수 통계 분석방법의 종류에는 적합도 검정, 무작위성 검정, 변수간 분포의 동질성 검정, 집단간 분포의 동질성 검정, 변수간의 상관관계분석이 있다.
 (1) 적합도 검정
     모집단이 일정한 확률분포형태를 갖는다고 가정할 경우 표본에서 얻어진 분포가 모집단에서 가정하고 있는 분포에 적합한지를 검정하는 방법 ex. 단일표본 카이스퀘어(χ²)검정, 단일표본 콜모고로프-스미르노프 검정, 이항분포 검정
 ① 단일표본 카이스퀘어(χ²)검정
     한 표본의 값의 실제빈도와 기대빈도가 일치하는지를 검정할 때 이용하는 방법
 <예제> 멘델의 유전법칙에 의하면 4가지 완두콩 모양이 나타날 비율은 9:3:3:1이라고 한다. 다음과 같은 완두콩 수확을 얻었다고 할 때, 완두콩 모양의 비율이 멘델의 유전법칙과 일치한다고 볼 수 있을까?
완두콩 모양 1 2 3 3
수확량 170 60 80 30
    귀무가설(영가설) : 멘델의 유전법칙과 일치한다
    연구가설 : 멘델의 유전법칙과 일치하지 않는다.
    ⇒ 확률값 p<.05이면 귀무가설을 채택한다.
 ② 단일표본 콜모고로프-스미르노프 검정
     주어진 어떤 표본분포가 이론적으로 기대되는 분포(이항분포, 정규분포)와 일치하는지의 여부를 검정할 때 이용하는 방법으로 자료가 적어도 순위자료 이상이어야 하며 연속적 분포를 가정할 수 있어야 한다.
  이 경우는 주어진 자료의 평균과 표준편차를 사용하여 정규분포 여부를 검정하게 된다.
 <예제> 통계학 수강생 10명의 점수이다. 통계학 점수가 정규분포를 이루는지를 검정하라.
학생 1 2 3 4 5 6 7 8 9 10
점수 50 65 85 90 78 80 75 84 60 55
    귀무가설(영가설) : 이 자료는 정규분포를 이룬다
    연구가설 : 이 자료는 정규분포를 이루지 않는다
    ⇒ 확률값 p>.05이면 귀무가설을 채택한다.
 ③ 이항분포 검정
     이항변수의 각 관찰치가 기대빈도와 일치하는지 또는 특정값이 나타날 기대확률과 실제로 나타난 확률이 일치하는지를 검정할 때 이용하는 방법이다. 예를 들어 주사위를 던져서 1이 나올 확률이나 동전의 앞뒷면이 평평한 정도를 검정하기 위하여 앞면이 나올 확률이 1/2이 되는지의 여부를 검정하고자 할 때 이용된다.
 <예제> 동전을 반복해서 1000번 던졌는데 앞면이 570번, 뒷면이 430번 나왔다. 이 동전을 던졌을 때 앞면이 나올 확률이 ½ 이라고 볼 수 있는가?
 귀무가설(영가설) : 확률이 ½ 이다  연구가설 : 확률이 ½이 아니다
 ⇒ 확률값 p>.05이면 귀무가설을 채택하고 p<.05이면 귀무가설을 기각한다.
 (2) 무작위성 검정(Runs Test)
     일련의 관찰치(사건)가 무작위적(random)으로 발생한 것인지 아니면 어떠한 규칙성, 즉 앞서 일어난 사건이 뒤에 일어날 사건에 영향을 미치는 것인지를 검정하는 방법  ex. 連(Run, 연속)의 검정
 ① 연의 검정(Runs Test)
     일련의 연속적인 관찰치가 무작위적으로 나타난 것인지, 아니면 앞에서 나타난 관찰치가 뒤에 나타나는 관찰치에 어떤 영향을 미치는가를 검정하는 이용하는 방법이다. 여기서 연(run)이란 두 종류의 부호가 어떤 순서를 가지고 배열되었을 때 동일한 부호로 이루어진 부분을 뜻하며, 이 연의 수에 근거를 두고 무작위성을 검정하게 된다.  연의 수가 매우 많거나 매우 적으면 관찰치간의 연관성이 있다고 판단하게 되는 것이다. 연의 계산기준으로는 median, mean, mode 등을 사용한다.
 <예제> 학생들의 통계학 점수의 일부분이다. 이 자료가 무작위로 추출되었는지에 대해 검정하라.

 귀무가설(영가설) : 표본은 무작위로 추출되었다  연구가설 : 표본은 무작위로 추출되지 않는다
 ⇒ 확률값 p>.05이면 귀무가설을 채택한다
 (3) 변수간 분포의 동질성 검정
  두 개 변수 또는 3개 이상의 변수값들이 이루는 확률분포가 동일한지를 검정하는 방법으로 이때에 확률분포는 정규분포와 같은 특정한 분포를 가정하지는 않는다.   ex. 부호검정, 윌콕슨 검정, 맥네마르 검정, 프리드맨 검정, 켄달 검정, 코큐란 큐 검정
 ① 부호검정(Sign Test)
  n개의 짝지워진 표본간에 분포의 차이가 있는가를 검정할 때 이용하고 두 표본에 관한 t검정이나 윌콕슨의 검정 방법이 적용될 수 없는 자료에 이용될 수 있는 비모수적 방법이다. 이것은 차이의 크기는 무시하고 단지 차이의 부호만을 이용하므로 수치측정이 어려운 경우에 매우 유용하다
 <예제> 두 상표의 보리음료 맛에 대한 시음회에서 소비자들이 응답한 표이다.  두 상표의 보리음료 맛에는 차이가 있는지를 검정하라.
소비자 1 2 3 4 5 6 7 8 9 10 11
제일상표 5 1 2 4 3 4 5 3 5 4 4
두일상표 3 2 1 2 3 5 2 5 2 1 5
부호 + - + + 0 - + - + + -
     귀무가설(영가설) : 두 상표의 맛 차이는 없다
     연구가설 : 두 상표의 맛 차이는 있다
   ⇒ 확률값 p>.05이면 귀무가설을 채택한다
 ② 윌콕슨 검정(Wilcoxon Test)
     두 개의 표본이 동일한 모집단에서 추출되었는지의 여부를 검정하는 방법으로 수치측정이 가능한 경우 정보의 손실을 보완할 수 있는 방법이다.
 ③ 멕네마르 검정(McNemar Test)
     이항변수로 되어 있는 두 변수간의 분포의 차이를 검정할 때 이용되며 자료가 명목변수와 순위변수로 이루어져 있을 때 적절한 분석방법이다. (참고로, 이항변수로 되어있는 3개 이상의 변수간 비율차이 검정 ⇒ 코크란 큐 검정)
 <예제> A대학에서는 새로운 강의방법을 도입하고자 한다.
 이를 위해 새로운 강의법과 기존의 강의법을 이용하여 한 달간 각각 수업을 실시한 뒤 무작위로 추출된 10명의 학생들에게 찬성 및 반대의사를 물었다. 두 강의법에 대한 학생들의 의견이 일치하는가를 검정하라.
학생 1 2 3 4 5 6 7 8 9 10
새강의법 1 1 2 2 1 2 2 1 1 1
기존강의법 2 2 1 1 2 1 1 2 2 2
   귀무가설(영가설) : 찬반의견은 일치한다
   연구가설 : 찬반의견은 일치하지 않는다
  ⇒ 확률값 p>.05이면 귀무가설을 채택한다
 ④ 프리드맨 검정(Friedman Test)
  두 개 이상의 변수들의 각 변수들의 순위의 합을 계산하여 변수들 간의 평균순위에 차이가 있는지의 여부를 검정하는 기법으로 순위자료일 경우에도 사용할 수 있다.
 <예제> A 전화기 제조회사에서는 자사에서 생산하고 있는 무선전화기 색깔에 따른 선호도를 조사하기 위해 무작위로 추출된 10명의 고객을 대상으로 전화기 색깔에 따른 선호도 등급(1,2,3)을 매기도록 하였다.
소비자 1 2 3 4 5 6 7 8 9 10 합계
검정 2 1 2 1 2 2 1 2 1 2 16
빨강 3 2 3 3 1 3 2 1 3 3 24
파랑 1 3 1 2 3 1 3 3 2 1 20
     귀무가설(영가설) : 전화기 색깔에 대한 선호도에는 차이가 없다
     연구가설 : 전화기 색깔에 대한 선호도에는 차이가 있다
  위의 <예제>에서는 각 색깔에 대한 순위를 합하였을 때, 각 색깔별로 순위합이 차이가 난다면 순위합이 가장 높은 색상이 가장 선호되는 것이라고 볼 수 있다.
 ⇒ 확률값 p>.05이면 귀무가설을 채택한다
 ⑤ 켄달 검정(Kendall Test)
  순위자료로 측정된 두 개 이상의 변수값들이 동일한 모집단에서 추출되었는지의 여부를 검정하는 방법이다. 켄달의 일치도 계수(coefficient of concordance)를 계산하여 관찰치별로 각 변수에 대하여 부여한 순위와 일치하는지의 여부를 검정한다.
 <예제> 음악경연대회에서 최종결선에 오른 4명의 바이얼린 연주자에 대한 심사위원들의 채점순위는 다음과 같다.  
연주자 심사위원 X1 X2 X3 X4
1 2 1 3 4
2 3 1 2 4
3 4 2 1 3
4 1 3 4 2
5 1 4 3 2
6 2 1 3 4
7 1 2 4 3
   귀무가설(영가설) : 심사위원의 채점순위는 독립적이다(상호관련이 없다)
   연구가설 : 심사위원의 채점순위는 독립적이 아니다(상호관련이 있다)
  위의 <예제>에서는 최종결선에 오른 연주자와 관계자들은 심사위원들의 채점 순위에 대해 몹시 궁금해 할 것이다. 이러한 경우, 심사위원들의 채점평가가 독립적인지의 여부를 검정하기 위해 켄달검정을 이용하게 된다.
 ⇒ 확률값 p>.05이면 귀무가설을 채택한다
 ⑥ 코크란 큐 검정(Cochran Q Test)
  이항변수로 되어있는 3개 이상의 변수간 비율차이를 검정하는 방법이다. 코크란 큐 검정은 자료가 명목변수 및 순위변수로 이루어져 있을 때 적절하다.
 <예제> K화장품 회사에서는 3가지 판매전략을 구사하고 있다. 이 판매전략들의 효과에 차이가 있는지를 조사하기 위해 판매사원 13명에게 판매시 사용하고 있는 판매전략에 대해 기입하도록 하였다. (1=판매성공, 2=판매실패) 판매전략 종류에 따라 판매효과에 차이가 있는지를 검정하라.
판매사원 1 2 3 4 5 6 7 8 9 10 11 12 13
판매전략 1 1 2 1 2 2 1 2 1 2 1 1 1 2
판매전략 2 1 1 2 1 2 1 1 2 1 2 1 1 1
판매전략 3 2 2 2 1 1 1 2 2 2 1 2 1 1
  귀무가설(영가설) : 판매전략별 효과차이가 있다.
  연구가설 : 판매전략별 효과차이가 있다.
 ⇒ 확률값 p>.05이면 귀무가설을 채택한다.
 (4) 집단간 분포의 동질성 검정
     두 집단 또는 세 집단 이상의 특정 변수에 대한 확률 분포들이 동일한가를 검정하는 방법으로 순위자료를 이용한 분산분석 방법이다. ex. 맨-휘트니 검정, 두 표본 콜모고로프-스미르노프 검정, 월드-월포비치 검정, 크루수칼-윌리스 검정, 중앙값 검정
 ① 맨-휘트니 검정(Mann-Whitney Test)
  두 개의 표본이 동일한 모집단에서 추출되었는지의 여부를 검정하는 방법으로 자료가 최소한 연속적 서열척도라는 것을 가정하고 있다. 그리고 두 집단의 차이 검정에 있어서 분산의 동질성이나 정규분포를 요구하지 않으므로 일반적 조건하에서는 t-Test 만큼 통계적 검정력이 있는 방법이다.
 표본의 t-Test시, 요구되는 기본 가정이 맞지 않아서 거기에서 얻어진 결론이 오류를 범할 가능성이 상당히 클 때 이 방법은 특히 유용하다.
 이 방법에서는 입력된 자료에 순위를 매겨서 각 집단의 순위 평균을 비교하여 검정하게 되고 윌콕슨 순위합계 검정통계량이 이용되고 있다.(참고로 두 개이상의 집단의 비교 ⇒ 크루스칼-월리스 검정)
 <예제> A연구소에서 개발한 새로운 혈청이 백혈병을 억제하는 효과가 있다고 한다.
 이 약을 백혈병에 걸린 쥐 10마리 중에서 6마리(처리집단)에게는 주사하고 나머지 4마리(통제집단)에게는 주사하지 않았다.
 그 결과, 백혈병에 걸린 쥐의 수명은 다음과 같았다. 여기서, 두 집단의 쥐의 수명이 같은지 검정하라.
처리집단 2.1 5.3 1.4 4.6 0.9 3.5
통제집단 1.9 0.5 2.8 3.1
    귀무가설(영가설) : 두 집단의 평균수명은 같다.
    연구가설 : 두 집단의 평균수명은 다르다.
 ⇒ 확률값 p>.05이면 귀무가설을 채택한다.
 ② 두 표본 콜로고로프-스미르노프 검정
  두 독립된 표본이 동일한 분포를 가진 모집단에서 추출되었는지를 검정할 때 이용되는 방법으로 이 검정에서 기본가정은 자료가 적어도 순위자료이며 연속분포를 한다는 것이다.
 <분석예제> 한 연구자는 탄수화물(A)와 지방(B)이 쥐의 체중에 미치는 영향을 연구하고자 한다.
 무작위로 추출된 쥐 20마리를 10마리씩 구분한 후, 탄수화물과 지방이 든 먹이를 각각 투입하였다. 한 달이 지난 후 실험전과 실험후의 체중을 측정한 후에 그 차이를 계산한 자료는 다음과 같다.
 탄수화물과 지방이 쥐의 체중에 미치는 효과에 차이가 있는지를 검정하라.
A(=1) 1 2 3 4 4 5 5 8 9 9
B(=2) 4 6 7 7 8 8 9 10 10 11
    귀무가설(영가설) : 영양소별 효과차이는 없다.
    연구가설 : 영양소별 효과차이는 있다.
 ⇒ 확률값 p>.05이면 귀무가설을 채택한다.
 ③ 월드-월포비치 검정(Walfowitz Test)
  두 표본이 동일한 모집단으로부터 추출된 것인지를 연(Run)을 기준으로 검정하는 방법으로 두 표본의 자료를 크기대로 나열한 다음 각 자료가 속해 있었던 표본에 의해 연을 계산하고 그 연의 수를 분석하여 검정하게 된다.
 <분석예제> 다음은 학습방법 1과 학습방법 2에 의해 각각 수업을 받은 학생들의 통계학 점수이다.
 이들 두 방법으로 지도한 학생들의 성적의 확률분포가 동일한지를 검정하라.
학      생 1 2 3 4 5 6 7
학습방법 1 90 86 70 68 80
학습방법 2 79 95 80 84 75 93 58
   귀무가설(영가설) : 두 확률분포는 동일하다.
   연구가설 : 두 확률분포는 동일하지 않다.
 ⇒ 확률값 p>.05이면 귀무가설을 채택한다.
 ④ 크루스칼-월리스 검정(KRUSKAL-WALLIS TEST)
  두 개 이상의 표본이 동일한 모집단에서 추출되었는지의 여부를 검정하는 방법
 <분석예제> 4종류의 시계에 3종류(GROUP)의 각기 다른 건전지를 사용하여 그 수명을 조사하였다.
 상표에 따른 건전지의 수명에 차이가 있는지를 검정하라.
건전지 시계 1 2 3
1 60 69 72
2 64 75 78
3 65 70 78
4 55 66 68
    귀무가설(영가설) : 건전지의 평균 수명은 차이가 없다.
    연구가설 : 건전지의 평균수명은 차이가 있다.
 ⇒ 확률값 p>.05이면 귀무가설을 채택한다
 ⑤ 중앙값(MEDIAN) 검정
  두 개 이상의 표본이 동일한 모집단에서 추출되었는지의 여부를 전체 자료의 중앙값을 계산하여 그 중앙값을 중심으로 각 집단의 자료가 흩어져 있는 상태가 동일한지를 검정하는 방법이다.
 <분석예제> 다음은 A백화점에서 12일간 판매된 4종류의 넥타이 판매량 자료이다. 판매량이 같은지 여부를 검정하라.
상표 일수 1 2 3 4
1 21 31 29 12
2 35 20 42 25
3 32 45 40 21
4 28 60 33 20
5 14 33 35 24
6 47 36 42 27
7 25 31 45 10
8 38 40 29 16
9 35 43 36 21
10 12 48 32 36
11 22 32 36 31
12 41 53 23 11
   귀무가설(영가설) : 평균 판매량은 같다.
   연구가설 : 평균 판매량은 다르다
  위의 <예제>에서 상표에 관계없이 넥타이 판매량 전체자료에서의 중앙값을 구해서 만약 상표별 넥타이 판매량의 중앙값이 동일하다면 각 상표별 자료는 전체자료의 중앙값을 중심으로 흩어져 있어야 하는 것이다. 또한 어느 상품끼리 평균 판매량의 차이가 있는지를 알기 위해서는 계속적으로 두 표본끼리 짝지워서 검정해 보아야 한다.
 ⇒ 확률값 p>.05이면 귀무가설을 채택한다.
 (5) 변수간의 상관관계분석-교차분석(CROSSTABS)
     순위자료를 이용하여 변수간의 상관정도를 분석하는 방법과 명목척도로 측정된 자료를 이용하여 두 변수간의 상관정도를 분석하는 방법으로 명목자료로 된 변수간의 상호독립성을 검정함으로써 두 변수의 빈도분포상의 상관정도를 검정하게 된다. ex. 스피어맨 순위상관분석, 교차분석
 ① 교차분석
  교차분석은 자료를 어떤 범주에 따라 분류하였을 때 그 범주 사이의 상호관련성 여부를 알아볼 때(독립성 검정), 자료가 어떤 특정분포에서 나온 것인가를 알고자 할 때(적합도 검정), 두 개 이상의 다항분포가 동일한지 여부를 검정하고자 할 때 사용하는 방법이다. 교차분석에서 사용되는 χ²통계량은 기대빈도와 실제빈도간의 차이에 의해서 계산된다.
  교차분석에서 귀무가설은 독립변수와 종속변수가 상호 독립적임을 의미한다. 따라서 확률값 p<.05이면 귀무가설은 기각되고, p>.05이면 귀무가설을 채택한다.
  교차분석을 이용한 독립변수와 종속변수가 모두 서열척도 이상인 경우에 귀무가설이 기각되고 대체가설이 채택된다면 상호 비독립적 관계의 정도와 방향을 상관계수로 나타낼 수 있다.
    상관계수(= PEARSON'S R)는 척도가 비율척도 이상인 교차분석에서 변수간의 상관관계를 나타낼 때 사용하고, SPEARMAN CORRELATION은 척도가 서열척도, 등간척도 이상인 교차분석에서 변수간의 상관관계를 나타낼 때 사용한다.
  주위 할 것은 독립변수와 종속변수가 명목척도인 경우에는 이러한 상관관계에 관한 분석과 해석을 할 수 없다.
  <표> 비모수 통계분석 방법 요약
사용목적 비모수 통계분석 방법 목적이 유사한 모수 통계방법
적합도 검정 단일표본 카이스퀘어 검정 단일표본 콜모고로프-스미르노프 검정 이항분포 검정 없음 없음 없음
무작위성 검정 연의 검정 없음
두 변수의 중심값 비교 (분포의 동일성 검정) 부호 검정 윌콕슨 검정 코크란 큐 검정 Paired-Test
세변수 이상 중심값 비교 (분포의 동일성 검정) 프리드맨검정 켄달의 일치계수 코크란 큐 검정 MANOVA
두 집단간 중심값 비교 (분포의 동일성 검정) 맨-휘트니검정 두 개 표본 콜모고로프-스미르노프 검정 월드-월포비치 검정 중앙값 검정 t-Test
세집단 이상의 중심값 비교 (분포의 동일성 검정) 중앙값 검정 크루스칼-윌리스 검정 ANOVA
변수간 상관관계 분석 (변수간 독립성검정) 스피어덴 순위 상관분석 카이스퀘어분석 (교차분석) Correlation

출처 : spss/sas통계프로그램
글쓴이 : 박준수(방장) 원글보기
메모 :