데이터 불러오기
csv 불러오기 : read_csv()
import pandas as pd
df = pd.read_csv('고객데이터셋2.csv')
df
데이터 파악하기
데이터 크기 확인
df.shape
데이터 컬럼 명 확인
df.columns
데이터 인덱스 확인
df.index
데이터 정보 확인
df.info()
데이터 통계 확인
df.describe()
데이터 일부 확인하기
df.head()
// df.tail()
데이터 조작하기
고객명, 성별, 나이만 10개의 데이터 출력
df[['고객명', '성별', '나이']].head(10)
고객명 순 정렬
df.sort_values('고객명')[['고객명', '성별', '나이']].head(10)
고객명, 나이 순 정렬
df.sort_values(['고객명', '나이'], ascending = [True, False])[['고객명', '직업', '나이']].head(10)
키가 180 이상이고, 몸무게가 80 이상인 고객
df[(df['키'] >= 180) & (df['몸무게'] >= 80)]
고객명에 '김'이라는 문자가 들어가는 고객
df[df['고객명'].str.contains('김')].tail()
연령대 열 생성
df['연령대'] = df['나이'] // 10 * 10
df.head(3)
연령대 별 고객 수
df.groupby(by = ['연령대']).size()
연령 대 별 성별 별 고객 수
df.groupby(by = ['연령대', '성별']).size()
연령대 별 주사용OTT 별 고객 수
df.groupby(by = ['연령대', '주사용OTT']).size()
'Programming > Python' 카테고리의 다른 글
SQL query (0) | 2023.11.29 |
---|---|
MySQL Workbench 사용하기 (1) | 2023.11.23 |
판다스 (2) | 2023.10.11 |