가설 검증과 추정


추정 (Estimation)

점 추정 (point estimation)
- 모 평균 값은 얼마 일 것이다.
- 모평균, 모분산, 모표준편차 등이 모집단의 모수중 중요한 하나의 값이 된다.

구간 추정 (interval estimation): 모평균 값은 최소 얼마내지 최대 얼마일 것이다.

모든 자료를 조사할 수 없는 경우 표본에서 얻은 결과를 이용하여 모집단을 추측.

중심 극한 정리

  • 통계학을 있게한 핵심 정리

가설 검정 (Hypothesis Testing)

귀무가설 (null hypothesis, $H_0$): 통계학에서 처음부터 버릴 것을 예상하는 가설이다.

연구자가 증며하고자 하는 실험가설과 반대되는 입장, 증명되기 전까지는 효과도 없고 차이도 없다는 영가설을 귀무가설이라 한다.

흡연여부는 뇌혈관 질환의 발생에 영향을 미치지 않는다

대립가설 (alternative hypothesis): 연구가설 또는 유지가설은 귀무가설에 대립하는 명제이다. 보통, 모집단에서 독립변수와 결과 변수 사이에 어떤 특정한 관련이 있다는 꼴이다.

연구자가 실험을 통해 규명하고자 하는 가설을 대립가설이라 한다.

가설 검정의 순서

검증(test)

귀무가설: $H_0$
대립가설: $H_1$

  1. 가설 설정

    • 귀무가설 설정

      • 핵심은 무조건 최대한 보수적으로 가정해야한다. 이게 틀려야 연구가설이 입증되기 떄문이다.

      예: 치료법은 효과가 없다.

    • 대립가설 설정

      • 주장하는 바를 설정 한다.

      예: 치료법은 효과가 있다.

  2. 유의 수준 결정 (5%, 1%)

    • 실험 결과 통계적으로 유의한 결과를 얻음 ( p < 0.05)
    • 유의수준 $\alpha$이 있다.
    • 유의 수준이란 귀무가설($H_0$)가 참인데도 불구하고 $H_0$를 기각할 확률의 최대 허용 한계를 의미한다.
    • 유의 확률은 P값이라 부른다. 주어진 데이터가 귀무가설을 기각 시키고자 할 때 필요한 최소의 유의 수준을 말한다.
    • 즉 P value < $\alpha$, 이면 귀무가설을 기각 한다. 그리고 대립 가설을 채택 한다.
  3. 결과해석 불가

    • 귀무가설 전제로 이런 결과가 도출될 가능성은 전체 5% 이하임.
  4. 귀무가설 기각

    • 그렇다면 처음에 전제로 가정했던 귀무가설이 틀린 것임.
  5. 대립가설 채택

    • 실제 효과가 있기 때문에 이 결과가 관찰 되었다.

$H_0$를 기각할 것인지 아닌지를 결정할 때, 2가지 의사결정 실수를 할 수 있다.

위와 같이 배심원이 재판을 하는 상황을 교차표(cross tabulation)를 그려서 확인해 본다.
2개의 과오가 존재하는데 여기서 알파위험이 죄 없는 사람을 감옥에 보내기 때문에 더 심각하다
이러한 이유는 $H_0$ 귀무 가설은 보수적인 결적인데 이것을 기각하게 되면 실험적인 주장 대립 가설을 채택하게 되고
이것이 잘못 될 경우 문제는 심각해 지게 된다.

  • 죄없는 사람을 감옥에 보냄
  • 잘못된 약 처방을 내려서 사람이 죽음


'Data Science > Probability & Statistics (R)' 카테고리의 다른 글

정규성 검정  (3) 2016.08.20
비교 분석  (0) 2016.08.03
가설 검증과 추정  (0) 2016.08.03
이상치 제거 (Box-plot 해석을 통한)  (0) 2015.01.03
통계학: F-검정  (0) 2013.08.29
회귀 분석 (1)  (0) 2013.08.29

+ Recent posts