Loading [MathJax]/jax/output/CommonHTML/jax.js
본문 바로가기
스터디 정리

Statistics for Data Science and Business Analysis 3주차

by 고공이 2023. 10. 24.

해당 글은 유데미에서 공부 내용을 토대로 정리한 글입니다 :)

 

 

Inferential statistic(통계적 추론)

: 모집단에 대해 알기 위해 통계를 이용해서 그 양상을 추측하는 과정을 말합니다.

 

Distribution

- Normal distribution(정규분포)

같은 편차를 가지고 있음에도 평균에 따라 그 분포 위치가 달라진다
같은 평균이라도 표준 편차의 크기에 따라 분포의 봉우리가 달라진다

- Standard normal distribution(표준정규분포)

: 모든 정규분포는 다음과 같은 공식으로 표준화할 수 있습니다.

 

The Central Limit Theorem(중심극한의 정리)

: 평균이 μ이고, 분산이 σ2인 분포(¯x1,¯x2,¯x3,...,¯xk)의 n이 충분이 클 때, 근사적으로 N(μ,σ2n) 따르는 경향이 있습니다.

- k -> 일수록, n -> 일수록 정규분포에 가까워집니다.

- 신뢰 구간을 구할 때나 가설 검정 및 회귀분석에 유용합니다.

 

신뢰 구간을 구할 때 다음과 같은 표를 참고하면 좋습니다.

여러 상황에서의 신뢰 구간을 구하는 법

 

Standard error(표준오차)

: 표준오차는 샘플의 크기가 클수록 작아집니다.