자격증/빅데이터분석기사

[빅데이터분석기사 필기] 모수 유의성 검정 개념 및 기출문제

j9m 2022. 9. 29. 01:04
반응형

모수 유의성 검정

  • 검정 대상인 모집단의 평균 및 분산에 따라 가설의 유의성을 검정한다.
  • 모집단은 분석의 대상, 즉 관심의 대상이 되는 전체 그룹이며, 모수는 모집단을 설명하는 어떤 값이다.
  • 표본은 모집단 분석을 위해 추출한 한 집단의 관측치이며, 통계량은 모집단을 설명하는 어떤 값을 표본으로부터 구한 값이다.

 

모집단의 평균에 대한 유의성 검정

  • 모집단의 평균을 알고 있을 때 Z-검정, T-검정을 사용하여 유의성을 검정한다.

 

 Z-검정 

  • Z-검정은 귀무가설에서 검정 통계량의 분포를 정규분포로 근사할 수 있는 통계 검정이다.
  • 정규분포를 가정하며, 추출된 표본이 동일 모집단에 속하는지 가설을 검정하기 위해 사용한다.
  • 모집단 분산 σ²을 이미 알고 있을 때 분포의 평균을 테스트한다.
  • Z-검정 통계량 값이 임계치보다 크고 작음에 따라, 가설을 기각 또는 채택한다.

 

⭐ Z-검정 공식

  • x : 표본 평균
  • μ : 모평균
  • σ : 모 표준편차
  • n : 표본의 크기

 

 T-검정

  • 검정하는 통계량이 귀무가설 하에서 T-분포를 따르는 통계적 가설검정이다.
  • 두 집단 간의 평균을 비교하는 모수적 통계 방법으로서 표본이 정규성, 등분산성, 독립성 등을 만족할 경우 적용한다.
  • 모집단이 정규분포라는 정도만 알고,  σ²(모분산)을 모를 때 s²(표본분산)으로 대체하여 모평균 μ를 구할 때 사용한다.
  • 적은 표본으로도 모집단 평균을 추정하려고 정규분포 대신에 사용되는 확률분포이다.

 

 분산 분석(ANOVA)

  • 두 개 이상의 집단 간 비교를 수행하고자 할 때 집단 내의 분산, 총 평균과 각 집단의 평균 차이에 의해 생긴 집단 간 분산 비교로 얻는 F-분포를 이용하여 가설검정을 수행하는 방법이다.

 

⭐ One-way ANOVA(일원배치 분산 분석)

  • 일원배치 분산 분석은 독립변수와 종속변수가 1개이고 모집단의 분산, 표준편차를 알지 못할 때 평균을 비교하기 위해 사용하는 기법이다.

 

⭐Two-way ANOVA(이원배치 분산 분석)

  • 이원 배치 분산 분석은 종속변수가 1개, 독립변수가 2개일 때 각 독립변수의 범주에 대응하는 종속변수 간에 평균의 차이를 검정하는 방법이다.
  • 이원배치 분산 분석은 독립변수가 2개일 때, 각 독립변수의 영향이 있는가와 두 독립변수 간에 상호작용이 존재하는지를 검정할 수 있다.
  • 명목 척도 변수(독립변수)는 서로 독립적이라고 가정할 때 종속변수의 분산이 특정한 명목 척도(독립변수)의 요인에 의해 변한다고 볼 수 있다.

 

Multi-way ANOVA(다원 배치 분산 분석)

  • 다원배치 분산 분석 독립변수가 3개 이상이고 종속변수가 1개일 때 분석하는 기법이다.

 

⭐ MANOVA(다변량 분산 분석)

  • 다변량 분산 분석은 독립변수가 1개 이상이고 종속변수가 2개 이상일 때 두 집단 간 평균 차이를 검증하기 위해 사용하는 분석 기법이다.

 

모집단의 분산에 대한 유의성 검정

카이제곱 검정

  • 카이제곱 검정은 관찰된 빈도가 기대되는 빈도와 유의미하게 다른지를 검정하기 위해 사용되며 카이제곱 분포에 기초한 통계적 검정 방법이다.
  • 단일 표본의 모집단이 정규분포를 따르며 분산을 알고 있는 경우에 적용한다.
  • 두 집단 간의 동질성 검정에 활용된다.

 

 F-검정

  • F-검정은 두 표본의 분산에 대한 차이가 통계적으로 유의한가를 판별하는 검정기법이다.
  • 두 모집단 분산 간의 비율에 대한 검정이다.

다음 글 보러가기

 

[빅데이터분석기사 필기] 적합도 검정 개념 및 기출문제

적합도 검정 적합도 검정은 표본 집단의 분포가 주어딘 특정 이론을 따르고 있는지를 검정하는 기법이다. 적합도 검정은 가정된 확률이 정해진 경우와 아닌 경우로 유형을 분리할 수 있다. 적합

ohaengsa.tistory.com

 

반응형