궁극적으로 알고 싶은 전체 집단을 모집단이라고 하는데, 전수조사는 불가능하다.
그래서 샘플(표본)을 추출하여 모집단을 추정한다.
표본의 평균, 표준오차, 분산등을 알아내는데 이를 통계량(statistics)이라고 한다.
통계적 검정을 위해 계산된 검정통계량도 통계량의 일종이다.
모집단의 모평균, 모표준편차, 모분산은 모수(parameter)라고 한다.
모수적 방법
무작위로 복원추출된 연속형 자료는, 중심극한정리에 의해서 본래의 분포에 상관없이 평균의 분포가 정규분포를 띈다.
비교하고자 하는 집단이 모두 정규분포를 띈다면, 두 집단의 차이를 알 수 있다.
이처럼 정규성을 갖는 모수적 특징을 이용한 방법이 모수적 방법이다.
그런데. 정규분포를 가정할 수 있는 최소한의 표본크기는? 30개 이상.
비모수적 방법
관측된 수가 적거나, 정규분포를 따르지 않는다고 증명이 되었을 경우, 모수적 방법을 사용할 수 없다.
모집단의 분포에 제약(정규성)을 가하지 않는다.
- 부호검정, 런검정, 만위트니U검정, 스피어만순위상관, 윌콕슨순위합검정
* 부호검정 예시
과자봉지 평균량 200g이다. 열개 샘플(30개보다 적음!) 뽑아서 197(-3), 201(+1) 등 부호를 매긴다.
+개수와 -개수가 동일하면 가정이 맞다는 결과.
* 윌콕슨순위합검정
평균과의 차이에 대한 절대값 순서로 순위를 매긴다.
+순위합과 -순위합의 분포 확인하여 어떤 가설이 통계적으로 유의한지 확인.
* 런검정
시계열의 전체 길이에 대비한 런의 개수를 계산해서
앞부분의 관찰치가 뒤에 나타나는 관측값에 영향을 미치는 지, 랜덤이었는지 확인.
예시) 주식시작에서 A주식의 등락을 표현 : +++ ------ ++++ ---- +++ -- ++++
* 만위트니U검정
두 개의 집단의 관심 변수(종속변수)가 각각 편향되어 있을때
예시) 1번째집단:약먹음 2번째집단:플라시보 => 얼마나 빨리 회복할까.
'ADSP' 카테고리의 다른 글
ADSP_확률분포::이산형 확률변수,연속형 확률변수 (t-분포, F-분포) (0) | 2020.10.30 |
---|---|
회귀분석_통계적추론(유의수준,기각역,채택역,Pvalue,1종오류,2종오류) (1) | 2020.10.30 |
ADsP_확률변수 (0) | 2020.10.24 |
ADsP 2장요약_데이터분석기획6/6 (0) | 2020.10.24 |
ADsP 2장요약_데이터분석기획5/6 (0) | 2020.10.24 |