- 직접 만든 사이트로 분석을 할 수 있을까-1 안녕하세요, 고공입니다.제가 분석가로서 가장 열망하는 부분은 직접 수집한 데이터로 분석을 할 수 있을까에 대한 것입니다.그래서 토이 프로젝트를 통해 진행해보기로 했습니다. 해당 프로젝트는 2년간 함께하던 스터디원과 함께 진행했고,거의 1년동안 진행한 프로젝트입니다 🤯그간의 노력을 기록해두려고 작성한 글이며,이 글을 가능하게 해준 스터디원 R님, 면정님에 대해 무한한 감사의 인사를 드립니다. 프로젝트를 시작하기에 앞서,먼저 프로젝트를 시작하기 전에 해당 플젝을 시작하게된 계기를 말씀드려야할 것 같습니다.앞서 작성했던 건 저의 개인적인 열망이었고,팀의 동기는 늘 스터디에서 하던 일상에서 시작됐습니다. 면정님의 파격적인(?) 제안에 저랑 R님도 호기심을 보이고 말았고,저희는 그만 건널 수 없는 강을 건너.. 2025.12.15
- Statistics for Data Science and Business Analysis 5주차 해당 글은 유데미를 통해 정리한 글입니다. 데이터 기반 의사결정은 다음과 같은 단계를 거칩니다. 가설 설정 -> 검정 방법 선택 -> 검정 -> 의사 결정 Null and the alternative hypothesis 귀무가설이라고 하며, 지금까지 우리가 믿고 있었던 모든 것들을 말합니다. 대립가설이라고 하며, 보통 일반적으로 민는 것에 반해 우리가 의심을 가지고 있는 것들을 말합니다. 대부분 연구자의 의견이 이 가설에 포함되어 있습니다. Decisions you can take 검정할 때 귀무 가설을 수용하거나 귀무 가설을 기각하는 두 가지 결정을 내릴 수 있습니다. 귀무 가설을 받아들인다는 것은 그 대안이 가져온 변화나 혁신을 뒷받침할 데이터가 충분하지 않다는 것을 의미합니다. 또한, 귀무 가설을 .. 2023.11.15
- Statistics for Data Science and Business Analysis 4주차 해당 글은 유데미를 통해 공부한 내용을 정리한 글입니다 :) Confidecen intervals, Population known, z-score 신뢰구간 공식 $ \left [ \overline{x} - z_{\alpha/2}\frac{\sigma}{\sqrt{n}}, \overline{x} + z_{\alpha/2}\frac{\sigma}{\sqrt{n}} \right ] $ 예를 들어 $ \alpha $ = 0.05 일 때, 신뢰구간을 다음과 같은 그림으로 설명할 수 있습니다. Confidecen intervals, Population unknown, t-score 신뢰구간 공식 $ \left [ \overline{x} - t_{n-1,\alpha/2}\frac{s}{\sqrt{n}} , \over.. 2023.11.07
- Statistics for Data Science and Business Analysis 3주차 해당 글은 유데미에서 공부 내용을 토대로 정리한 글입니다 :) Inferential statistic(통계적 추론) : 모집단에 대해 알기 위해 통계를 이용해서 그 양상을 추측하는 과정을 말합니다. Distribution - Normal distribution(정규분포) - Standard normal distribution(표준정규분포) : 모든 정규분포는 다음과 같은 공식으로 표준화할 수 있습니다. The Central Limit Theorem(중심극한의 정리) : 평균이 $ \mu $이고, 분산이 $ \sigma^2 $인 분포($ \overline{x_{1}}, \overline{x_{2}}, \overline{x_{3}}, ... , \overline{x_{k}} $)의 n이 충분이 클 때, 근사.. 2023.10.24
- Statistics for Data Science and Business Analysis 2주차 해당 글은 유데미에서 공부 내용을 토대로 정리한 글입니다 :) Skewness(왜도) Mean > Median > Mode Mean = Median = Mode Mean < Median < Mode 데이터의 좌우 비대칭을 표현하는 척도로, 데이터가 어디에 위치해 있는지 알 수 있습니다. 정규분포처럼 좌우대칭을 이룰수록 왜도 값이 작아지고 한 쪽으로 심하게 몰릴 수록 왜도값이 증가합니다. Variance와 Standard deviation Population Variance(모분산) Sample Variance(표본분산) Population standard deviation (모집단 표준편차) Sample standard deviation (표본 표준편차) 표본분산은 n-1로 나누는이유(👈자세한 설명을 원.. 2023.10.16