본문 바로가기

분류 전체보기57

로지스틱 회귀 해당 글은 코드잇을 통해서 공부한 내용을 정리한 글입니다. 선형 회귀를 이용해서 분류를 할 수 있긴 하지만, 선형 회귀를 예외적인 데이터에 너무 민감하게 반응한다는 단점이 있습니다. 그래서 분류를 할 때는 선형 회귀 대신 '로지스틱 회귀', 영어로는 'Logistic Regression'을 사용합니다. 1. 가설 함수 선형 회귀는 데이터에 가장 잘 맞는 일차 함수를 찾는다면 로지스틱 회귀는 데이터에 가장 잘 맞는 시그모이드 함수를 찾습니다. 2. 로그 손실 함수 로그 손실 로지스틱 회귀 손실 함수 로그 손실 공식 대입 후 아래와 같이 정리할 수 있습니다. 3. 경사 하강법 : 손실 함수를 세타에 대해 편미분하고 그 결과에 학습률 알파를 곱합니다. 그리고 그 결과를 기존 세타_0에서 빼면 됩니다. 그렇게 .. 2022. 3. 21.
다항 회귀 해당 글은 코드잇에서 공부 내용을 토대로 정리한 글입니다 :) 1. 다항회귀란? :일차 함수나 직선이 아닌 고차식(다항식이나 곡선)을 구해서 학습하는 것입니다. 영어로는 polynomial regression. 2. 단일 속성, 다중 속성 - 속성이 하나인 경우 :만약 가설 함수가 삼차항이라고 한다면 제곱한 것과 세제곱한 것을 가상 열로 추가해 다중 선형 회귀 문제로 풀면 됩니다. - 속성이 많고 다항 회귀인 경우 : 가능한 경우의 수로 가상의 열을 추가하고, 이 새로운 열들을 마치 입력 변수처럼 취급해서 다중 선형 회귀로 문제를 풀면 됩니다. 예를 들어, 가설 함수가 이차항이라면 상수항+일차항+이차항인 총 9개 항으로 다중 선형 회귀 문제로 풉니다. 3. 다항 회귀가 필요한 이유 집 값 예측을 예시로 .. 2022. 3. 17.
선형 회귀 해당 글은 코드잇에서 공부한 내용을 정리한 글입니다. 1. 선형회귀 & 용어 : 데이터를 가장 잘 대변해 주는 선을 찾아내는 방법입니다. 이 데이터에 가장 적절한 하나의 선을 찾아내는 것입니다. 이 최적선을 이용해 새로운 입력 변수에 대한 목표 변수를 예측할 수 있습니다. 위 사진처럼 집 크기가 주어졌을 때, 선형회귀식을 이용해서 집 값을 예측하는 것입니다. 2. 가설 함수 그러면 최적선을 찾아내기 위해 다양한 함수를 시도해 봐야 하는데 우리가 시도하는 이 함수 하나하나를 '가설 함수'라고 부릅니다. y=ax+b 형태로 표현됩니다. 결국 계수 a와 상수 b를 찾아내야 하는 게 우리의 목표인 셈이죠. 가설 함수 표현법 수식으로는 보통 이렇게 표현합니다. 그렇다면 저희 목표를 다시 정리하자면 가장 적절한 세.. 2022. 3. 17.
글또 6기를 마치며 안녕하세요 ;) 글또 6기 마지막 글을 쓰는 날이 오다니 감회가 새롭습니다. 사실 글또 6기 시작하며 처음 글을 쓸 때에도 내가 마지막 글을 쓸 날이 올까 반신반의했었습니다. 제가 끈기가 많이 없는 편이거든요. 솔직히 벌금 몇번 내고, 그러다가 예치금도 다 까먹을 줄 알았습니다. 그치만 2주에 1번씩 글을 쓰면서 매번 마음을 다 잡았습니다. 그럴 수 있었던 이유는 글또6기가 있었기 때문이였습니다. 제가 속해있던 데이터분석사b 그룹분들이 아주 열심히 참여해주셔서 덕분에 글 쓸 동기를 얻을 수 있었습니다. 그리고 글또 시작하게 해준 지인분도 같이 글또 6기 했었는데 그분이랑 같이 스터디 하며서 마감일을 항상 까먹지않게 알려주셨습니다. 그렇기에 제가 꾸준히 글을 쓸 수 있었습니다. 여기까지 제가 할 수 있게 .. 2022. 1. 1.
물리 삭제 vs 논리 삭제 안녕하세요, 오늘은 물리삭제와 논리삭제에 대해 간단하게 정리하려고 합니다 :) 요즘 SQL로 데이터관리를 하기 위한 여러 방법들을 배우고 있는데요, 흥미로운 주제를 발견해서 아, 이건 정리해야겠다라는 생각이 들었습니다. 그것은 바로 어떤 row를 삭제하는 방법에는 크게 2가지 방법이 있다는 사실입니다. 그 2가지 방법은 바로 '물리 삭제’와 ‘논리 삭제'입니다. 일반적으로 데이터를 삭제해야할 때 그냥 row를 바로 삭제해버리는 것을 ‘물리 삭제’라고 합니다. 반면에 ‘논리 삭제’는 삭제해야할 row를 삭제하지 않고, ‘삭제 여부’를 나타내는 별도의 컬럼을 두고, 거기에 ‘삭제되었음’을 나타내는 값을 넣는 것을 말합니다. 예를 들어, 어떤 쇼핑몰에서 각 고객의 주문 내역을 저장하고 있는 아래와 같은 ord.. 2021. 12. 18.
카디널리티와 ERM 안녕하세요, 오늘은 저번글, 모델링 기본 정리에 이어 카다널리티와 ERM에 대해 정리해보겠습니다. 해당 글은 코드잇에서 배운 내용을 토대로 정리한 글입니다. 1. 카디널리티 카디널리티는 두 entity type 사이 관계에서 한 종류의 entity가 다른 종류의 entity 몇 개에 대해서 관계를 맺을 수 있는지를 나타내는 개념입니다. 아래에서 배울 내용들에서는 두 Entity Type, A와 B가 이렇게 있다고 가정하겠습니다. 1:1 관계 첫 번째 관계는 1:1 (일대일) 관계입니다. 일대일 관계는 A entity 하나가 B entity 하나에만 연결될 수 있고, 마찬가지로 B entity 하나도 A entity 하나에만 연결될 수 있는 관계를 의미합니다. 1:N 관계 두 번째 관계는 1:N (일대다).. 2021. 12. 5.