본문 바로가기

분류 전체보기57

Statistics for Data Science and Business Analysis 5주차 해당 글은 유데미를 통해 정리한 글입니다. 데이터 기반 의사결정은 다음과 같은 단계를 거칩니다. 가설 설정 -> 검정 방법 선택 -> 검정 -> 의사 결정 Null and the alternative hypothesis 귀무가설이라고 하며, 지금까지 우리가 믿고 있었던 모든 것들을 말합니다. 대립가설이라고 하며, 보통 일반적으로 민는 것에 반해 우리가 의심을 가지고 있는 것들을 말합니다. 대부분 연구자의 의견이 이 가설에 포함되어 있습니다. Decisions you can take 검정할 때 귀무 가설을 수용하거나 귀무 가설을 기각하는 두 가지 결정을 내릴 수 있습니다. 귀무 가설을 받아들인다는 것은 그 대안이 가져온 변화나 혁신을 뒷받침할 데이터가 충분하지 않다는 것을 의미합니다. 또한, 귀무 가설을 .. 2023. 11. 15.
Statistics for Data Science and Business Analysis 4주차 해당 글은 유데미를 통해 공부한 내용을 정리한 글입니다 :) Confidecen intervals, Population known, z-score 신뢰구간 공식 $ \left [ \overline{x} - z_{\alpha/2}\frac{\sigma}{\sqrt{n}}, \overline{x} + z_{\alpha/2}\frac{\sigma}{\sqrt{n}} \right ] $ 예를 들어 $ \alpha $ = 0.05 일 때, 신뢰구간을 다음과 같은 그림으로 설명할 수 있습니다. Confidecen intervals, Population unknown, t-score 신뢰구간 공식 $ \left [ \overline{x} - t_{n-1,\alpha/2}\frac{s}{\sqrt{n}} , \over.. 2023. 11. 7.
Statistics for Data Science and Business Analysis 3주차 해당 글은 유데미에서 공부 내용을 토대로 정리한 글입니다 :) Inferential statistic(통계적 추론) : 모집단에 대해 알기 위해 통계를 이용해서 그 양상을 추측하는 과정을 말합니다. Distribution - Normal distribution(정규분포) - Standard normal distribution(표준정규분포) : 모든 정규분포는 다음과 같은 공식으로 표준화할 수 있습니다. The Central Limit Theorem(중심극한의 정리) : 평균이 $ \mu $이고, 분산이 $ \sigma^2 $인 분포($ \overline{x_{1}}, \overline{x_{2}}, \overline{x_{3}}, ... , \overline{x_{k}} $)의 n이 충분이 클 때, 근사.. 2023. 10. 24.
Statistics for Data Science and Business Analysis 2주차 해당 글은 유데미에서 공부 내용을 토대로 정리한 글입니다 :) Skewness(왜도) Mean > Median > Mode Mean = Median = Mode Mean < Median < Mode 데이터의 좌우 비대칭을 표현하는 척도로, 데이터가 어디에 위치해 있는지 알 수 있습니다. 정규분포처럼 좌우대칭을 이룰수록 왜도 값이 작아지고 한 쪽으로 심하게 몰릴 수록 왜도값이 증가합니다. Variance와 Standard deviation Population Variance(모분산) Sample Variance(표본분산) Population standard deviation (모집단 표준편차) Sample standard deviation (표본 표준편차) 표본분산은 n-1로 나누는이유(👈자세한 설명을 원.. 2023. 10. 16.
Statistics for Data Science and Business Analysis 1주차 해당 글은 유데미에서 공부 내용을 토대로 정리한 글입니다 :) Sample or population data 모수와 표본 모수: 관심의 대상이 되는 모집단의 대표값 표본: 모집단의 부분집합. 임의적이면서 대표적어야 함.(무작위성과 상징성) The fundamentals of descriptive statistics 데이터 유형 Categorical Numerical Discrete Continuous 데이터 유형은 Categorical과 Numerical로 나눌 수 있습니다. 그중 Numerical은 Discrete와 Continuous로 나뉩니다. Categorical(범주형) : 범주형 데이터는 성별, 자동차 종처럼 그룹 또는 범주를 나타냅니다. Numerical(수치형) : 수치형 데이터는 숫자를 .. 2023. 10. 14.
SQL 데이터 분석 캠프 실전반 후기 안녕하세요 고공입니다 :) 오늘은 SQL 데이터 분석 캠프 실전반 강의 후기를 들고 왔습니다. 과연 저는 어떤 후기를 가져왔을까요⁉️ 일단 이 강의는 무료가 아니라 유료입니다. 이 점을 감안해주시고 제 글을 읽어주시면 감사하겠습니다. 참고로 이 글은 강의를 선택한 이유, 좋았던 점, 아쉬웠던 점, 앞으로의 계획 순으로 마치겠습니다. 유료 강의였는데도 선택한 이유가 뭐였을까요. 지금부터 시작합니다. 1. 이 강의를 선택한 이유 : 첫 번째 이유는 돈이라도 내야 아까워서라도 들을 것 같아서입니다. 네. 저는 의지가 약한 동물입니다. 글또 글에서도 알 수 있듯이 저는 자본이 얽혀있어야 뭘 하든가 말든가 하죠. 그래서 저에게는 거금이었던 강의료를 주고 이 강의를 선택했습니다. 두 번째 이유는(A.K.A. 가장 .. 2023. 3. 8.