- Statistics for Data Science and Business Analysis 5주차 해당 글은 유데미를 통해 정리한 글입니다. 데이터 기반 의사결정은 다음과 같은 단계를 거칩니다. 가설 설정 -> 검정 방법 선택 -> 검정 -> 의사 결정 Null and the alternative hypothesis 귀무가설이라고 하며, 지금까지 우리가 믿고 있었던 모든 것들을 말합니다. 대립가설이라고 하며, 보통 일반적으로 민는 것에 반해 우리가 의심을 가지고 있는 것들을 말합니다. 대부분 연구자의 의견이 이 가설에 포함되어 있습니다. Decisions you can take 검정할 때 귀무 가설을 수용하거나 귀무 가설을 기각하는 두 가지 결정을 내릴 수 있습니다. 귀무 가설을 받아들인다는 것은 그 대안이 가져온 변화나 혁신을 뒷받침할 데이터가 충분하지 않다는 것을 의미합니다. 또한, 귀무 가설을 .. 2023.11.15
- Statistics for Data Science and Business Analysis 4주차 해당 글은 유데미를 통해 공부한 내용을 정리한 글입니다 :) Confidecen intervals, Population known, z-score 신뢰구간 공식 $ \left [ \overline{x} - z_{\alpha/2}\frac{\sigma}{\sqrt{n}}, \overline{x} + z_{\alpha/2}\frac{\sigma}{\sqrt{n}} \right ] $ 예를 들어 $ \alpha $ = 0.05 일 때, 신뢰구간을 다음과 같은 그림으로 설명할 수 있습니다. Confidecen intervals, Population unknown, t-score 신뢰구간 공식 $ \left [ \overline{x} - t_{n-1,\alpha/2}\frac{s}{\sqrt{n}} , \over.. 2023.11.07
- Statistics for Data Science and Business Analysis 3주차 해당 글은 유데미에서 공부 내용을 토대로 정리한 글입니다 :) Inferential statistic(통계적 추론) : 모집단에 대해 알기 위해 통계를 이용해서 그 양상을 추측하는 과정을 말합니다. Distribution - Normal distribution(정규분포) - Standard normal distribution(표준정규분포) : 모든 정규분포는 다음과 같은 공식으로 표준화할 수 있습니다. The Central Limit Theorem(중심극한의 정리) : 평균이 $ \mu $이고, 분산이 $ \sigma^2 $인 분포($ \overline{x_{1}}, \overline{x_{2}}, \overline{x_{3}}, ... , \overline{x_{k}} $)의 n이 충분이 클 때, 근사.. 2023.10.24
- Statistics for Data Science and Business Analysis 2주차 해당 글은 유데미에서 공부 내용을 토대로 정리한 글입니다 :) Skewness(왜도) Mean > Median > Mode Mean = Median = Mode Mean < Median < Mode 데이터의 좌우 비대칭을 표현하는 척도로, 데이터가 어디에 위치해 있는지 알 수 있습니다. 정규분포처럼 좌우대칭을 이룰수록 왜도 값이 작아지고 한 쪽으로 심하게 몰릴 수록 왜도값이 증가합니다. Variance와 Standard deviation Population Variance(모분산) Sample Variance(표본분산) Population standard deviation (모집단 표준편차) Sample standard deviation (표본 표준편차) 표본분산은 n-1로 나누는이유(👈자세한 설명을 원.. 2023.10.16
- Statistics for Data Science and Business Analysis 1주차 해당 글은 유데미에서 공부 내용을 토대로 정리한 글입니다 :) Sample or population data 모수와 표본 모수: 관심의 대상이 되는 모집단의 대표값 표본: 모집단의 부분집합. 임의적이면서 대표적어야 함.(무작위성과 상징성) The fundamentals of descriptive statistics 데이터 유형 Categorical Numerical Discrete Continuous 데이터 유형은 Categorical과 Numerical로 나눌 수 있습니다. 그중 Numerical은 Discrete와 Continuous로 나뉩니다. Categorical(범주형) : 범주형 데이터는 성별, 자동차 종처럼 그룹 또는 범주를 나타냅니다. Numerical(수치형) : 수치형 데이터는 숫자를 .. 2023.10.14