t검정
t검정이란 두 집단 이하의 평균을 비교 분석하는 방법으로 종류에는 일표본 t검정(한 집단에서의 평균값 비교 = 단일 표본) , 대응 표본 t검정 (같은 집단에서의 평균값 비교) , 그리고 독립 표본 t검정(다른 집단에서의 평균값 비교)이 있다.
t검정을 하기 위해서는 몇 가지 조건이 필요시 된다.
- 종속변수가 평균값을 낼 수 있는 양적 변수여야 한다.
- 모집단의 분산, 표준편차를 알지 못할 때 사용한다.
- 모집단의 분포가 한쪽으로 치우치지 않은 정규분포여야 한다.
- 등분산 가정이 충족되어야 한다. (등분산 가정이란 자료가 퍼져있는 정도가 같은 분포 집합의 가정을 의미)
독립 표본 t검정 실습
독립표본 t검정을 위해서는 변수 보기에서 모집단과 구하고자 하는 평균의 변수를 지정한다. 그러고 나서 데이터 보기에서 설문의 결과값을 입력한다.
[ 분석 ] -> [ 평균 비교 ] -> [ 독립 표본 t검정 ]에 들어간다.
위의 창에서 보는 것처럼 검정 변수에는 평균을 나타내는 변수를 선택하고 집단 변수에는 구하고자 하는 두 개의 다른 집단 설정값을 넣어준다.
내가 알고자 하는 것이 성별에 따른 중간고사 점수의 차이라고 가정을 했을 때 검정 변수에는 중간고사의 점수를 입력하고 집단 변수에는 1,2의 값이 두 개인 집단을 입력해주면 된다. ( 앞서 변수 보기에서 성별의 변수를 입력할 때 값의 설정에 1= 남자, 2= 여자라고 설정하였다면, 결과 보기에서 더욱 쉽게 결과를 분석할 수 있다.)
이때 검정 변수를 선택한 채로 옵션을 클릭하면 신뢰구간이 나오게 되는데 모든 가설은 100%의 신뢰 치를 가질 수 없기 때문에 자신이 원하는 정도의 신뢰구간을 설정하면 된다. (보통 95%의 설정값 그대로 유지한다.)
앞선 창에서 [ 계속 ] -> [ 확인 ]을 클릭하면 위의 사진처럼 출력 결과가 생성되게 된다. 집단 통계량을 통해 남자보다 여자의 평균이 높음을 알 수 있고 성별에 따른 차이가 있는지 구체적으로 알아보기 위해 독립 표본 검정을 한 결과 통계적으로 신뢰도 95%을 기준으로 유의 확률(양측)은 0.751을 보이며 0.05 보다 크다는 것으로 보았을 때 남녀의 성별에 따른 평균 차이가 없다는 해석을 내릴 수 있다. ( 유의 확률 값이 0.05보다 크게 나타났다면 대립 가설이 기각, 귀무가설이 채택된다.이와 반대로 0.05보다 작을 경우 귀무가설이 기각되고 대립가설이 채택된다. )
< 결과 작성 시 >
- 유의 확률이 0.5보다 작을경우 *
- 유의 확률이 0.5보다 클경우
- 유의 확률이 0.1보다 작을 경우 **
- 유의확률이 0.01보다 작을경우 ***
- 유의 확률은 앞서 설정한 신뢰도 95%를 기준으로의 얼마나 차이가 나는지를 알려준다.
단일 표본 t 실습
단일표본 t검정을 하는 이유?
- 모집단의 분산을 알지 못할 때
- 모집단의 추출된 표본의 평균과 연구자가 이론적 배경이나 경험적 배경에 의해 설정한 특정한 수를 비교할 때
- 고정화된 평균값이 있는 집단과 여러 샘플링이 있는 집단을 비교하고자 할 때 (고정화된 평균값의 집단에서는 다양한 샘플링을 알 수 없다는 가정이 존재)
EX) 외국인 학생의 중간 평균점수가 45점이라고 가정을 하였을 때 우리나라 중간고사 학생 점수와 외국인 학생의 수준에 차이가 있는지에 대해 알아보고자 한다.
우선 우리나라 학생의 중간고사 점수를 변수 보기에서 지정한 후 데이터 보기에 결과값을 입력한다.
[분석] -> [평균 비교] -> [ 일표본 t검정 ]
검정 변수의 종속변수에는 양적으로 측정이 가능한 값을 넣어주고 검정 값에서는 공신력이 있는 숫자를 입력하면 된다. 앞선 예시의 설정에서 외국인 학생의 중간 점수 평균은 45점이었기에 그대로 적어준다.
독립 표본 t검정과 동일한 신뢰구간 설정
우리나라의 평균은 37점이 나왔고 외국인 학생과 비교하였을 때는 더 낮은 수준을 보인다. 이때 신뢰도 95%를 기준으로 유의 확률이 0.05보다 크기 때문에 외국인과 우리나라의 중간고사 점수의 차이가 없고 연구가설은 채택이 되지 않고 영가설은 채택되게 된다.
대응표본 t검정
대응표본 t검정을 하는 이유? 유사한 집단의 전후 차이를 알고자 할 때
EX) 설탕을 섭취하기 전후의 몸무게 차이가 있는가를 알고 싶다.
[분석] -> [평균 비교] -> [대응표본 t검정]
대응 변수 1에는 이전의 변수를 변수 2에는 이후의 변수를 입력하고 나머지 옵션은 앞서 설명했던 단일 표본과 독립 표본과 동일하게 진행한다.
대응표본 상관계수에서 유의 확률을 보았을 때 0.05보다 작으므로 유의한 관계가있음을 알수 있다. 대응표본의 검정에서는 평균이 -1.14가 나오게되었는데 섭취전-섭취후의 몸무게를 계산했기때문에 -라는 결과가 나온다. t값은 평균과 동일하게 -가 나오며 유의확률은 0.05보다 크게 나온것을 확인했을때 섭취전과 섭취후의 결과에 차이가 없다는 것을 보았을때 영가설은 채택이 되고 연구가설은 부정되게 된다.
'프로그램 툴 > SPSS 프로그램' 카테고리의 다른 글
SPSS 프로그램 텍스트 파일로 작성된 데이터 가져오기 (0) | 2021.07.10 |
---|---|
SPSS프로그램 변수 계산하기 (0) | 2021.07.09 |
SPSS프로그램 데이터 다루기 [ 다른 변수로 코딩 변경 ] (0) | 2021.07.04 |
SPSS 프로그램 기본 메뉴 알아보기 - 엑셀로 만든 데이터 여는 방법 [ 추가 엑셀파일 안 열릴 때! ] (0) | 2021.07.04 |
SPSS 프로그램 기본 메뉴 알아보기 - 변수 입력하기 [숫자, 문자 변환] (0) | 2021.07.03 |