자격증/빅데이터분석기사

[빅데이터분석기사 필기] 비모수 통계 개념 및 기출문제

j9m 2022. 9. 28. 02:19
반응형

비모수 통계란?

  • 비모수 통계는 평균이나 분산 같은 모집단의 분포에 대한 모수성을 가정하지 않고 분석하는 통계적 방법이다.
  • 데이터가 모수적 분석 방법이 가정한 특성을 만족하지 못할 때는 비모수 통계분석 방법을 사용하여야 한다.

 

비모수 통계 특징

  • 비모수 통계분석에서는 빈도, 부호, 순위 등의 통계량을 사용한다.
  • 순위와 부호에 기초한 방법 위주로 이상값으로 인한 영향이 적다.
  • 데이터가 모수적 분석 방법이 가정한 특성을 만족하지 못할 때는 비모수 통계분석 방법을 사용하여야 한다.

 

비모수 통계 장단점

  • 장점
    • 모집단의 분포에 대한 가정의 불만족으로 인한 오류의 가능성이 작다.
    • 모수적 방법에 비해 통계량의 계산이 간편하고 직관적으로 이해하기 쉽다.
    • 모집단의 분포에 무관하게 사용할 수 있다.
    • 추출된 샘플의개수가 10개 미만으로 작을 경우에도 사용할 수 있다.
    • 이상값으로 인한 영향이 적다.
  • 단점
    • 모수 통계로 검정이 가능한 데이터를 비모수 통계를 이용하면 효율성이 떨어진다.
    • 검정통계량의 신뢰성이 부족
    • 자료의 수가 많은 경우 모수적 통계에 비해 오히려 계산 절차 복잡

 

비모수 통계 검정 방법의 종류

 

비모수 통계 검정 방법

단일 표본 부호검정

  • 차이의 크기는 무시하고 차이의 부호만을 이용한 중위수의 위치에 대한 검정 방법이다.
  • 자료를 중위수와 차이의 부호인 +와 -의 부호로 전환한 다음 부호들의 수를 근거로 검정한다.
  • 자료의 분포가 연속적이고 독립적인 분포에서 나온 것이라는 가정만 필요하다.
  • ① 표본추출
  • ② 검정 통계량
  • ③ 유의수준에 대한 기각역

 

윌콕슨 부호 순위 검정

  • 윌콕슨 부호 순위 검정은 단일 표본에서 중위수에 대한 검정에 사용되며, 또한 대응되는 두 표본의 중위수의 차이 검정에도 사용된다.
  • 윌콕슨 부호 순위 검정은 일변량 검정이다.
  • 주로 30개 이하의 작은 샘플일때 사용한다.
  • 차이의 부호뿐만 아니라 차이의 상대적인 크기도 고려한 검정 방법이다.
  • 자료의 분포가 연속적이고 독립적인 분포에서 나온 것이라는 기본 가정 외에 자료의 분포에 대한 대칭성 가정이 필요하다.

 

윌콕슨 부호 순위 검정 절차

  • 가설 검정
  • 표본과 중위수 간의 차이 계산
  • R계산
  • 검정 통계량 계산
  • 유의수준 α에 대한 기각역
  • 유의사항
    • 위치 모수인 같은 데이터는 검정하기 전에 표본에서 제외시킨다.
    • 관측값이 동점인 경우 평균 순위를 사용한다.
    • 분산에도 영향을 미치므로 분산도 수정이 필요하다.

 

 윌콕슨 순위 합 검정

  • 두 표본 중위수 검정의 대표적인 비모수 검정 방법으로서 만-휘트니의 U검정과 동일하다.
  • 윌콕슨 순위 합 검정은 이변량 검정이다.
  • 주로 30개 이하의 작은 샘플일때 사용한다.
  • 두 표본의 혼합 표본에서 순위 합을 이용한 검정 방법이다.
  • 자료의 분포가 연속적이고 독립적인 분포에서 나온 것이라는 기본 가정 외에 자료의 분포에 대한 대칭성 가정이 필요하다.
  • 가설 설정 ➡️ 순위 부여 ➡️ 순위 계산 ➡️ 검정 통계량 계산 ➡️ 유의 수준 α에 대한 기각역
  • 동점의 처리 : 혼합 표본에서 동점이 있을 경우 W는 동점 간의 평균 순위를 사용한다.

 

대응 표본 검정

  • 하나의 모집단에서 두 가지 처리를 적용하여 관찰 값을 얻은 후 각 쌍의 차이를 이요하여 두 중위수의 차이를 검정하는 방법이다.
  • 대응 표본 검정에는 부호 검정과 윌콕슨 부호 순위 검정 방법을 이용한다.
  • 단일 표본에서의 부호 검정과 우리콕슨 부호 순위 검정을 대응 표본 검정 방법으로 사용할 수 있다.

 

 분산 분석 - 크루스칼 왈리스 검정

  • 세집단 이상의 분포를 비교하는 검정 방법으로 모수적 방법에서의 one-way ANOVA와 같은 목적으로 쓰인다.
  • 그룹별 평균이 아닌 중위수가 같은지를 검정한다.
  • 가설 설정 ➡️ 순위 부여 ➡️ 값 계산 ➡️ 검정 통계량 계산 ➡️ 유의 수준 α에 대한 기각역

 

 런 검정

  • 두 개의 값을 가지는 연속적인 측정값들이 어떤 패턴이나 경향이 없이 임의적으로 나타난 것인지를 검정하는 방법이다.
  • 런은 동일한 측정값들이 시작하여 끝날 때까지의 덩어리를 말한다.
  • 이분화된 자료가 아닌 경우는 이분화된 자료로 변환시켜야 한다.
  • 평균, 중위수, 최빈수 또는 사용자가 정의한 숫자 등의 기준값을 이용하여 이분화한다.
  • 가설 설정 ➡️ 검정 통계량➡️ 기각역

 

비모수 통계 기출문제

Q. 비모수 통계 분석기법인 윌콕슨 부호검정과 윌콕슨 순위 검정에 대한 설명 중 가장 옳지 않은 것은 무엇인가?

① 윌콕슨 부호순위는 일변량 검정이다.

② 윌콕슨 순위합은 이변량 검정이다.

③ 주로 30개 이하의 작은 샘플일때 사용한다.

윌콕슨 부호 순위 검정은 검정 결과가 대칭되어야 검정 가능하다.

더보기

 윌콕슨 부호 순위 검정은 검정 결과가 대칭되어야 검정 가능하다.

 

다음글 보러가기

  • 분석 모형 평가 평가지표(혼동 행렬, ROC, 이익도표)
 

[빅데이터분석기사] 분석모형평가 평가지표(혼동행렬, ROC, 이익도표) 개념 및 기출

평가지표 빅데이터 분석 모형은 분류 모형과 회귀 모형에 따라 다른 평가지표를 이용하여 평가한다. ⭐ 분석 모형 설정 이상적인 모형에서는 낮은 편향과 낮은 분산으로 설정되어야 한다. 편향

ohaengsa.tistory.com

 

반응형