본문 바로가기
스터디 정리

Statistics for Data Science and Business Analysis 3주차

by 고공이 2023. 10. 24.

해당 글은 유데미에서 공부 내용을 토대로 정리한 글입니다 :)

 

 

Inferential statistic(통계적 추론)

: 모집단에 대해 알기 위해 통계를 이용해서 그 양상을 추측하는 과정을 말합니다.

 

Distribution

- Normal distribution(정규분포)

같은 편차를 가지고 있음에도 평균에 따라 그 분포 위치가 달라진다
같은 평균이라도 표준 편차의 크기에 따라 분포의 봉우리가 달라진다

- Standard normal distribution(표준정규분포)

: 모든 정규분포는 다음과 같은 공식으로 표준화할 수 있습니다.

 

The Central Limit Theorem(중심극한의 정리)

: 평균이 $ \mu $이고, 분산이 $ \sigma^2 $인 분포($ \overline{x_{1}}, \overline{x_{2}}, \overline{x_{3}}, ... , \overline{x_{k}} $)의 n이 충분이 클 때, 근사적으로 $ N \sim \left ( \mu ,\frac{\sigma^2}{n} \right ) $ 따르는 경향이 있습니다.

- k -> $ \infty  $ 일수록, n -> $ \infty $ 일수록 정규분포에 가까워집니다.

- 신뢰 구간을 구할 때나 가설 검정 및 회귀분석에 유용합니다.

 

신뢰 구간을 구할 때 다음과 같은 표를 참고하면 좋습니다.

여러 상황에서의 신뢰 구간을 구하는 법

 

Standard error(표준오차)

: 표준오차는 샘플의 크기가 클수록 작아집니다.

댓글