본문 바로가기

데이터분석 공부하기18

여러가지 JOIN들 해당 글은 코드잇에서 실습한 내용을 토대로 정리한 글입니다 :) 이때까지 제가 실습하고 배웠던 JOIN은 결합연산과 집합연산에 대해 배웠습니다. 두 테이블을 가로 방향으로 합치는 결합 연산과 세로 방향으로 합치는 집합 연산입니다. 결합 연산 중에는 LEFT OUTER JOIN, RIGHT OUTER JOIN, INNER JOIN이 있고, 집합 연산 중에는 INTERSECT, MINUS, UNION, UNION ALL이 있습니다. 이중 INTERSECT와 MINUS 연산자는 제가 실습하는 환경인 MySQL에서 지원하지 않아서, 다른 조인을 통해 원하는 결과를 얻기도 했습니다. 이번 글에서는 제가 배우지 않았던 조인 종류들에 대해 간단한 정리를 해보겠습니다. 실무적인 활용도는 떨어지지만, 알아두면 좋은 내용.. 2021. 9. 12.
Primary Key의 종류 Primary Key Primary Key는 기본키라고 하며, 테이블에서 특정 row 하나를 식별하는 역할을 해줍니다. 특정 컬럼을 Primary Key로 설정하게 되면 Primary Key에 있는 같은 값이 추가되는 것을 DBMS가 자동으로 막아주기 때문에 중복을 방지하는 중요한 역할을 합니다. 그러니 Primary Key는 고유한 값을 나타내는 컬럼으로 설정해줘야 합니다. Primary Key의 종류에는 크게 두 가지로 나눌 수 있습니다. 바로 Natural Key와 Surrogate Key입니다. Natural Key - 어떤 개체가 갖고 있는 실제 속성을 나타내는 컬럼을 Primary Key로 설정할 때 이를 Natural Key라고 합니다. 예를 들어 도서관에 있는 책들을 각자 고유번호가 있죠... 2021. 8. 15.
Seaborn 시각화 본 글은 코드잇에서 공부한 토대로 정리한 글입니다. www.codeit.kr/learn/courses/data-science/1065 코딩이 처음이라면, 코드잇 월 3만원대로 Python, JavaScript, HTML/CSS, Java 등 1,600개 이상 프로그래밍 강의를 무제한 수강하세요 www.codeit.kr:443 오늘은 Seaborn 시각화 에 대해서 정리하려고 합니다. Seaborn 을 사용해서 다양한 그래프를 그릴 수 있는데 Pandas 를 사용하는 것보다 조금 더 근사한 그래프를 그릴 수 있고, 이것으로 더 좋은 인사이트를 얻을 수도 있답니다! Seaborn 은 통계를 기반으로 한 데이터 시각화입니다. 그러니깐 Seaborn 을 제대로 이해하긴 위해서는 통계를 잘 알아야겠죠! 그중에서도.. 2021. 4. 23.
시각화와 그래프 본 글은 코드잇을 수강하고 정리한 글입니다. www.codeit.kr/ 코딩이 처음이라면, 코드잇 월 3만원대로 Python, JavaScript, HTML/CSS, Java 등 1,600개 이상 프로그래밍 강의를 무제한 수강하세요 www.codeit.kr:443 토픽5 중 드디어 토픽3 입니다. 토픽3는 데이터 시각화를 주로 다루는데요 시각화는 데이터를 한 눈에 알아보기 위해서도 중요하고, 특히 마케팅 분야에서 어떠한 기획을 할 때 숫자로 나열된 데이터보다는 시각화된 그래프를 보고 더 좋은 아이디어를 낼 수 있기 때문에 굉장히 중요한 역할을 한다고 합니다. 저는 토픽3를 수강하면서 몰랐던 사실이거나 꿀팁 정도를 이번 포스트를 정리할까 합니다. (계속 수정의 수정의 수정을 할 것 같아요) 1. panda.. 2021. 4. 22.
데이터베이스와 DBMS 본 글은 코드잇 수강한 후, 개인적으로 정리한 글입니다. 참고링크: www.codeit.kr/courses/sql-database-for-developers 코딩이 처음이라면, 코드잇 월 3만원대로 Python, JavaScript, HTML/CSS, Java 등 1,600개 이상 프로그래밍 강의를 무제한 수강하세요 www.codeit.kr:443 1. 데이터베이스와 테이블 표 형태로 저장된 데이터집합을 테이블이라고 합니다. 많은 기업은 데이터베이스를 기반으로 시장과 고객들을 관리하기 위해 많은 노력을 합니다. 데이터베이스 기본구조 : 관련있는 정보를 하나의 테이블로, 여러 테이블로 방대한 데이터를 체계적으로 저장함. 그렇다면 데이터베이스에 저장된 데이터를 분석하는 방법을 알아보도록 합시다. 2. DBM.. 2021. 3. 17.
큰 DataFrame 살펴보기 본 글은 코드잇에서 공부한 것을 토대로 간단하게 정리한 것입니다. 나중에 제가 참고하려고 메모용 기록하는 것으로 글이 짧을 수 있습니다. 참고링크: https://www.codeit.kr/courses/data-science 코딩이 처음이라면, 코드잇 월 3만원대로 Python, JavaScript, HTML/CSS, Java 등 1,600개 이상 프로그래밍 강의를 무제한 수강하세요 www.codeit.kr:443 판다스에는 큰 데이터를 쉽게 파악할 수 있게 도와주는 기능들이 있습니다. df.head(3) # 위부터 3줄까지 출력 df.tail(4) # 뒤부터 3줄까지 출력 df.shape # (row, colum) 정보 확인 df.info() # 각 변수명, 몇개가 있는지, type 등 확인 df.de.. 2021. 3. 17.