가설 검증과 추정
추정 (Estimation)
점 추정 (point estimation)
- 모 평균 값은 얼마 일 것이다.
- 모평균, 모분산, 모표준편차 등이 모집단의 모수중 중요한 하나의 값이 된다.
구간 추정 (interval estimation): 모평균 값은 최소 얼마내지 최대 얼마일 것이다.
모든 자료를 조사할 수 없는 경우 표본에서 얻은 결과를 이용하여 모집단을 추측.
중심 극한 정리
- 통계학을 있게한 핵심 정리
가설 검정 (Hypothesis Testing)
귀무가설 (null hypothesis, $H_0$): 통계학에서 처음부터 버릴 것을 예상하는 가설이다.
연구자가 증며하고자 하는 실험가설과 반대되는 입장, 증명되기 전까지는 효과도 없고 차이도 없다는 영가설을 귀무가설이라 한다.
흡연여부는 뇌혈관 질환의 발생에 영향을 미치지 않는다대립가설 (alternative hypothesis): 연구가설 또는 유지가설은 귀무가설에 대립하는 명제이다. 보통, 모집단에서 독립변수와 결과 변수 사이에 어떤 특정한 관련이 있다는 꼴이다.
연구자가 실험을 통해 규명하고자 하는 가설을 대립가설이라 한다.
가설 검정의 순서
검증(test)
귀무가설: $H_0$
대립가설: $H_1$
가설 설정
귀무가설 설정
- 핵심은 무조건 최대한 보수적으로 가정해야한다. 이게 틀려야 연구가설이 입증되기 떄문이다.
예: 치료법은 효과가 없다.
대립가설 설정
- 주장하는 바를 설정 한다.
예: 치료법은 효과가 있다.
유의 수준 결정 (5%, 1%)
- 실험 결과 통계적으로 유의한 결과를 얻음 ( p < 0.05)
- 유의수준 $\alpha$이 있다.
- 유의 수준이란 귀무가설($H_0$)가 참인데도 불구하고 $H_0$를 기각할 확률의 최대 허용 한계를 의미한다.
- 유의 확률은 P값이라 부른다. 주어진 데이터가 귀무가설을 기각 시키고자 할 때 필요한 최소의 유의 수준을 말한다.
- 즉 P value < $\alpha$, 이면 귀무가설을 기각 한다. 그리고 대립 가설을 채택 한다.
결과해석 불가
- 귀무가설 전제로 이런 결과가 도출될 가능성은 전체 5% 이하임.
귀무가설 기각
- 그렇다면 처음에 전제로 가정했던 귀무가설이 틀린 것임.
대립가설 채택
- 실제 효과가 있기 때문에 이 결과가 관찰 되었다.
$H_0$를 기각할 것인지 아닌지를 결정할 때, 2가지 의사결정 실수를 할 수 있다.
위와 같이 배심원이 재판을 하는 상황을 교차표(cross tabulation)를 그려서 확인해 본다.
2개의 과오가 존재하는데 여기서 알파위험이 죄 없는 사람을 감옥에 보내기 때문에 더 심각하다
이러한 이유는 $H_0$ 귀무 가설은 보수적인 결적인데 이것을 기각하게 되면 실험적인 주장 대립 가설을 채택하게 되고
이것이 잘못 될 경우 문제는 심각해 지게 된다.
- 죄없는 사람을 감옥에 보냄
- 잘못된 약 처방을 내려서 사람이 죽음
'AI > Probability & Statistics (R)' 카테고리의 다른 글
| 정규성 검정 (3) | 2016.08.20 |
|---|---|
| 비교 분석 (0) | 2016.08.03 |
| 이상치 제거 (Box-plot 해석을 통한) (0) | 2015.01.03 |
| 통계학: F-검정 (0) | 2013.08.29 |
| 회귀 분석 (1) (0) | 2013.08.29 |
