본문 바로가기
스터디 정리

Statistics for Data Science and Business Analysis 5주차

by 고공이 2023. 11. 15.

해당 글은 유데미를 통해 정리한 글입니다.

 

 

데이터 기반 의사결정은 다음과 같은 단계를 거칩니다.

 

가설 설정 -> 검정 방법 선택 -> 검정 -> 의사 결정

 

 

Null and the alternative hypothesis

귀무가설이라고 하며,
지금까지 우리가 믿고 있었던 모든 것들을 말합니다.
대립가설이라고 하며,
보통 일반적으로 민는 것에 반해 우리가 의심을 가지고 있는 것들을 말합니다. 
대부분 연구자의 의견이 이 가설에 포함되어 있습니다.

 

 

Decisions you can take

기각역

 

검정할 때 귀무 가설을 수용하거나 귀무 가설을 기각하는 두 가지 결정을 내릴 수 있습니다.
귀무 가설을 받아들인다는 것은 그 대안이 가져온 변화나 혁신을 뒷받침할 데이터가 충분하지 않다는 것을 의미합니다.
또한, 귀무 가설을 기각한다는 것은 현재 상태가 진리를 대표하지 않는다는 통계적 증거가 충분하다는 것을 의미합니다.

Accept Reject
x% 유의 수준에서 귀무 가설을 받아들입니다
x% 유의 수준에서 A는 B와 크게 다르지 않습니다
x% 유의 수준에서 통계적 증거가 충분하지 않습니
x% 유의 수준에서 귀무 가설을 기각할 수 없습니다
x% 유의 수준에서 귀무 가설을 기각합니다
x% 유의 수준에서 A는 B와 유의적으로 다릅니다
x% 유의 수준에서 통계적 증거가 충분합니다
x% 유의 수준에서 귀무 가설이 수립한다고 말할 수 없습니다

 

 

Level of significance and types of tests

유의 수준은 0.1, 0.05, 0.01를 보통 다룹니다.

Two-sided (two-tailed) test One-sided (one-tailed) test

 

 

Type I Error and Type II Error

일반적으로 테스트를 할 때 발생할 수 있는 오류는 두 가지가 있습니다. 바로 1종 오류와 2종 오류입니다.

1종 오류: 귀무 가설이 참인데도 불구하고 표본 오차때문에 이를 채택하지 않는 오류입니다. 보통 $ \alpha $라고 표기하고 유의수준이라고 부릅니다.

2종 오류: 귀무 가설이 거짓임에도 불구하고 표본 오차때문에 이를 채택하는 오류입니다. 보통 $\beta$라고 표기합니다.

  귀무 가설이 사실 (참) 귀무 가설이 거짓 (거짓)
귀무 가설 채택 옳은 결정(1-$\alpha$) 2종 오류($\beta$)
귀무 가설 기각 1종 오류($\alpha$) 옳은 결정(1-$\beta$)

 

 

댓글