본문 바로가기

스터디 정리23

Statistics for Data Science and Business Analysis 5주차 해당 글은 유데미를 통해 정리한 글입니다. 데이터 기반 의사결정은 다음과 같은 단계를 거칩니다. 가설 설정 -> 검정 방법 선택 -> 검정 -> 의사 결정 Null and the alternative hypothesis 귀무가설이라고 하며, 지금까지 우리가 믿고 있었던 모든 것들을 말합니다. 대립가설이라고 하며, 보통 일반적으로 민는 것에 반해 우리가 의심을 가지고 있는 것들을 말합니다. 대부분 연구자의 의견이 이 가설에 포함되어 있습니다. Decisions you can take 검정할 때 귀무 가설을 수용하거나 귀무 가설을 기각하는 두 가지 결정을 내릴 수 있습니다. 귀무 가설을 받아들인다는 것은 그 대안이 가져온 변화나 혁신을 뒷받침할 데이터가 충분하지 않다는 것을 의미합니다. 또한, 귀무 가설을 .. 2023. 11. 15.
Statistics for Data Science and Business Analysis 4주차 해당 글은 유데미를 통해 공부한 내용을 정리한 글입니다 :) Confidecen intervals, Population known, z-score 신뢰구간 공식 $ \left [ \overline{x} - z_{\alpha/2}\frac{\sigma}{\sqrt{n}}, \overline{x} + z_{\alpha/2}\frac{\sigma}{\sqrt{n}} \right ] $ 예를 들어 $ \alpha $ = 0.05 일 때, 신뢰구간을 다음과 같은 그림으로 설명할 수 있습니다. Confidecen intervals, Population unknown, t-score 신뢰구간 공식 $ \left [ \overline{x} - t_{n-1,\alpha/2}\frac{s}{\sqrt{n}} , \over.. 2023. 11. 7.
Statistics for Data Science and Business Analysis 3주차 해당 글은 유데미에서 공부 내용을 토대로 정리한 글입니다 :) Inferential statistic(통계적 추론) : 모집단에 대해 알기 위해 통계를 이용해서 그 양상을 추측하는 과정을 말합니다. Distribution - Normal distribution(정규분포) - Standard normal distribution(표준정규분포) : 모든 정규분포는 다음과 같은 공식으로 표준화할 수 있습니다. The Central Limit Theorem(중심극한의 정리) : 평균이 $ \mu $이고, 분산이 $ \sigma^2 $인 분포($ \overline{x_{1}}, \overline{x_{2}}, \overline{x_{3}}, ... , \overline{x_{k}} $)의 n이 충분이 클 때, 근사.. 2023. 10. 24.
Statistics for Data Science and Business Analysis 2주차 해당 글은 유데미에서 공부 내용을 토대로 정리한 글입니다 :) Skewness(왜도) Mean > Median > Mode Mean = Median = Mode Mean < Median < Mode 데이터의 좌우 비대칭을 표현하는 척도로, 데이터가 어디에 위치해 있는지 알 수 있습니다. 정규분포처럼 좌우대칭을 이룰수록 왜도 값이 작아지고 한 쪽으로 심하게 몰릴 수록 왜도값이 증가합니다. Variance와 Standard deviation Population Variance(모분산) Sample Variance(표본분산) Population standard deviation (모집단 표준편차) Sample standard deviation (표본 표준편차) 표본분산은 n-1로 나누는이유(👈자세한 설명을 원.. 2023. 10. 16.
Statistics for Data Science and Business Analysis 1주차 해당 글은 유데미에서 공부 내용을 토대로 정리한 글입니다 :) Sample or population data 모수와 표본 모수: 관심의 대상이 되는 모집단의 대표값 표본: 모집단의 부분집합. 임의적이면서 대표적어야 함.(무작위성과 상징성) The fundamentals of descriptive statistics 데이터 유형 Categorical Numerical Discrete Continuous 데이터 유형은 Categorical과 Numerical로 나눌 수 있습니다. 그중 Numerical은 Discrete와 Continuous로 나뉩니다. Categorical(범주형) : 범주형 데이터는 성별, 자동차 종처럼 그룹 또는 범주를 나타냅니다. Numerical(수치형) : 수치형 데이터는 숫자를 .. 2023. 10. 14.
혼자 공부하는 머신러닝+딥러닝 6주차 6주차 미션: Ch.07(07-1) 확인 문제 풀고, 풀이 과정 정리하기 & Ch.07(07-2) 확인 문제 풀고, 풀이 과정 정리하기 1. 어떤 인공 신경망의 입력 특성이 100개이고 밀집층에 있는 뉴런 개수가 10개일 때 필요한 모델 파라미터의 개수는 100 * 10 = 1000개 입니다. 2. 케라스의 Dense 클래스를 사용해 신경망의 출력층을 만들려고 합니다. 이 신경망이 이진분류 모델이라면 activatio 매개변수에는 시그모이드 함수를 사용하기 위해 sigmoid 함수를 지정하면 됩니다. 반면, 뉴런에서 출력되는 값을 확률로 바꾸려면 softmax 함수를 지정하면 됩니다. 3. 케라스 모델에서 손실 함수와 측정 지표 등을 지정하는 메서드는 compile() 입니다. 4. 정수 레이블을 타깃으.. 2023. 2. 15.