분류 전체보기58 직접 만든 사이트로 분석을 할 수 있을까-1 안녕하세요, 고공입니다.제가 분석가로서 가장 열망하는 부분은 직접 수집한 데이터로 분석을 할 수 있을까에 대한 것입니다.그래서 토이 프로젝트를 통해 진행해보기로 했습니다. 해당 프로젝트는 2년간 함께하던 스터디원과 함께 진행했고,거의 1년동안 진행한 프로젝트입니다 🤯그간의 노력을 기록해두려고 작성한 글이며,이 글을 가능하게 해준 스터디원 R님, 면정님에 대해 무한한 감사의 인사를 드립니다. 프로젝트를 시작하기에 앞서,먼저 프로젝트를 시작하기 전에 해당 플젝을 시작하게된 계기를 말씀드려야할 것 같습니다.앞서 작성했던 건 저의 개인적인 열망이었고,팀의 동기는 늘 스터디에서 하던 일상에서 시작됐습니다. 면정님의 파격적인(?) 제안에 저랑 R님도 호기심을 보이고 말았고,저희는 그만 건널 수 없는 강을 건너.. 2025. 12. 15. Statistics for Data Science and Business Analysis 5주차 해당 글은 유데미를 통해 정리한 글입니다. 데이터 기반 의사결정은 다음과 같은 단계를 거칩니다. 가설 설정 -> 검정 방법 선택 -> 검정 -> 의사 결정 Null and the alternative hypothesis 귀무가설이라고 하며, 지금까지 우리가 믿고 있었던 모든 것들을 말합니다. 대립가설이라고 하며, 보통 일반적으로 민는 것에 반해 우리가 의심을 가지고 있는 것들을 말합니다. 대부분 연구자의 의견이 이 가설에 포함되어 있습니다. Decisions you can take 검정할 때 귀무 가설을 수용하거나 귀무 가설을 기각하는 두 가지 결정을 내릴 수 있습니다. 귀무 가설을 받아들인다는 것은 그 대안이 가져온 변화나 혁신을 뒷받침할 데이터가 충분하지 않다는 것을 의미합니다. 또한, 귀무 가설을 .. 2023. 11. 15. Statistics for Data Science and Business Analysis 4주차 해당 글은 유데미를 통해 공부한 내용을 정리한 글입니다 :) Confidecen intervals, Population known, z-score 신뢰구간 공식 $ \left [ \overline{x} - z_{\alpha/2}\frac{\sigma}{\sqrt{n}}, \overline{x} + z_{\alpha/2}\frac{\sigma}{\sqrt{n}} \right ] $ 예를 들어 $ \alpha $ = 0.05 일 때, 신뢰구간을 다음과 같은 그림으로 설명할 수 있습니다. Confidecen intervals, Population unknown, t-score 신뢰구간 공식 $ \left [ \overline{x} - t_{n-1,\alpha/2}\frac{s}{\sqrt{n}} , \over.. 2023. 11. 7. Statistics for Data Science and Business Analysis 3주차 해당 글은 유데미에서 공부 내용을 토대로 정리한 글입니다 :) Inferential statistic(통계적 추론) : 모집단에 대해 알기 위해 통계를 이용해서 그 양상을 추측하는 과정을 말합니다. Distribution - Normal distribution(정규분포) - Standard normal distribution(표준정규분포) : 모든 정규분포는 다음과 같은 공식으로 표준화할 수 있습니다. The Central Limit Theorem(중심극한의 정리) : 평균이 $ \mu $이고, 분산이 $ \sigma^2 $인 분포($ \overline{x_{1}}, \overline{x_{2}}, \overline{x_{3}}, ... , \overline{x_{k}} $)의 n이 충분이 클 때, 근사.. 2023. 10. 24. Statistics for Data Science and Business Analysis 2주차 해당 글은 유데미에서 공부 내용을 토대로 정리한 글입니다 :) Skewness(왜도) Mean > Median > Mode Mean = Median = Mode Mean < Median < Mode 데이터의 좌우 비대칭을 표현하는 척도로, 데이터가 어디에 위치해 있는지 알 수 있습니다. 정규분포처럼 좌우대칭을 이룰수록 왜도 값이 작아지고 한 쪽으로 심하게 몰릴 수록 왜도값이 증가합니다. Variance와 Standard deviation Population Variance(모분산) Sample Variance(표본분산) Population standard deviation (모집단 표준편차) Sample standard deviation (표본 표준편차) 표본분산은 n-1로 나누는이유(👈자세한 설명을 원.. 2023. 10. 16. Statistics for Data Science and Business Analysis 1주차 해당 글은 유데미에서 공부 내용을 토대로 정리한 글입니다 :) Sample or population data 모수와 표본 모수: 관심의 대상이 되는 모집단의 대표값 표본: 모집단의 부분집합. 임의적이면서 대표적어야 함.(무작위성과 상징성) The fundamentals of descriptive statistics 데이터 유형 Categorical Numerical Discrete Continuous 데이터 유형은 Categorical과 Numerical로 나눌 수 있습니다. 그중 Numerical은 Discrete와 Continuous로 나뉩니다. Categorical(범주형) : 범주형 데이터는 성별, 자동차 종처럼 그룹 또는 범주를 나타냅니다. Numerical(수치형) : 수치형 데이터는 숫자를 .. 2023. 10. 14. 이전 1 2 3 4 ··· 10 다음