[멋쟁이사자처럼 그로스마케팅 부트캠프] 17일차 회고
·
회고
상관관계한 변수의 변화가 다른 변수의 변화에 영향을 주는 관계를 상관관계라고 한다.상관관계의 정도는 상관계수로 표현되며, 가장 많이 사용되는 상관계수가 피어슨 상관계수이다. 피어슨 상관계수: 두 변수 간의 선형적인 관계의 강도와 방향을 측정하는 통계적 지표파이썬에서 상관계수 구하는 예시corr(): pandas의 DataFrame이나 Series에서 사용하는 메서드이다. 기본적으로 피어슨 상관계수를 계산한다.import pandas as pd# 데이터 로드df = pd.read_csv('1인가구관심집단.csv')# 종속변수 설정target_variable = "평일_외출이_적은_집단"# 상관계수 계산correlation_matrix = df.corr(numeric_only=True)..
[멋쟁이사자처럼 그로스마케팅 부트캠프] 16일차 회고
·
회고
회귀분석 개념통계학에서 두 개 이상의 변수 사이의 관계를 분석하고 예측 모델을 구축하는 기법이다. 주어진 데이터로부터 변수 간의 상관관계를 파악하고, 미래의 값을 예측하거나 변수들이 어떻게 상호작용 하는지 이해하는 데 사용된다.주요 구성요소요소개념예시독립 변수 (X)종속 변수에 영향을 주는 변수광고비, 운동량종속 변수 (Y)분석의 목표가 되는 변수매출, 체중회귀모델의 형태선형 또는 비선형 형태를 가지며, 최소제곱법(OLS)을 사용해 모델의 파라미터를 추정한다.최소제곱법(OLS)단순 회귀 분석에선 최소제곱법을 통해 절편과 기울기를 추정한다.각 관측치에서 예측값과 실제값 사이의 잔차의 제곱합을 최소화하는 파라미터를 찾는 방법이다. 잔차분석: 모델이 데이터의 변동성을 얼마나 잘 설명하는지, 이상치나 패턴이 존..
[멋쟁이사자처럼 그로스마케팅 부트캠프] 12일차 회고
·
회고
오늘은 어제 이어서 외부 데이터셋을 이용한 실습을 하고, 설문조사를 통한 데이터 분석을 진행했다.어제보다는 비교적 할만했고, 이해하기도 수월했던 것 같다.외부데이터셋을 이용한 실습1번 실습행정동 단위 서울 생활인구(내국인)import pandas as pddf = pd.read_csv('행정동 단위 서울 생활인구(내국인).csv')df["여자20대생활인구수"] = df["여자20세부터24세생활인구수"] + df["여자25세부터29세생활인구수"]df.groupby("행정동코드")["여자20대생활인구수"].sum().nlargest(5).apply(lambda x: f"{x:,}")apply(lambda x: f"{x:.}"): apply()함수와 람다식을 이용해 ..
[멋쟁이사자처럼 그로스마케팅 부트캠프] 9일차 회고
·
회고
오늘은 ALTER TABLE과 SQL과 Pandas의 연동에 대해 배웠고, 아쉽게도 flask로 웹을 만들어보는 건 내일로 밀렸다. 아쉽긴해도 진도가 뒤쳐지는 동기가 없도록 교수님께서 잘 대처하신것도 같고, 오히려 자습할 수 있는 시간이 생겼다는 건 좋은거 아닐까 싶다. 다들 어려움이 있어도 포기하지 않고 질문하고 해결해내는 모습들이 정말 멋지신 것 같다!ALTER TABLEALTER TABLE문은 기존 테이블의 구조를 변경하는 데 사용되며, 아래와 같은 기능을 할 수 있다.기능SQL 문열 추가ALTER TABLE 테이블명 ADD COLUMN 컬럼명 데이터타입 AFTER 기존컬럼;열 삭제ALTER TABLE 테이블명 DROP COLUMN 컬럼명;열 이름 변경ALTER TABLE 테이블명 CHANGE CO..
[Python] Pandas 정렬과 필터링, 그룹화
·
Python
오늘 멋쟁이사자처럼 그로스마케팅 부트캠프 강의를 들으며 Pandas의 정렬, 필터링, 그룹화에 대해 배웠다. Pandas에서 데이터를 원하는 형태로 가공하여 분석하기 위해 사용하는 핵심 기능이다.정렬데이터를 특정 기준에 따라 정렬하여 분석을 용이하게 한다.# 단일 컬럼 정렬sorted_df = df.sort_values(by="매출액", ascending=True)# 다중 컬럼 정렬sorted_df = df.sort_values(by=["매출액", "클릭수"], ascending=[False, True])by: 정렬 기준이 되는 컬럼ascending: True면 오름차순, False면 내림차순apply()를 이용한 최우선순위 정렬df["우선순위"] = df["이름"].apply(lambda x: 0 if..
[Python] 문자열 포맷팅 정리
·
Python
파이썬에서 데이터를 출력할 때, 원하는 형식으로 정리하는 것은 매우 중요하다.특히 숫자를 다룰 때는 소수점 자리 지정, 천 단위 콤마 추가, 정렬, 진수 변환 등 다양한 포맷팅 옵션을 활용할 수 있다.포맷팅 상세 문법 (: 뒤에 포맷 옵션)포맷팅 코드의미예시 (num = 1234.5678)결과.nf소수점 n자리{num:.2f}1234.57,천 단위 구분{num:,}1,234.56780ndn자리 숫자, 빈 곳 0 채우기{num:08.2f}01234.57왼쪽 정렬{num:1234.5678>오른쪽 정렬{num:>10}  1234.5678^가운데 정렬{num:^10}1234.5678b2진수 변환{num:b} (num=10)1010o8진수 변환{num:o} (num=10)12x16진수 변환{num:x} (num=..