본문 바로가기
Data/Data Science

[파이썬으로시작하는데이터사이언스]판다스 치트시트를 활용한 기초익히기

by mozi2 2023. 10. 9.
반응형

#부스트코스

1.판다스 import

import pandas as pd

 

2. DataFrame

df = pd.DataFrame(
{"a" : [4, 5, 6],
"b" : [7, 8, 9],
"c" : [10, 11, 12]},
index = [1, 2, 3])
df

3. Series

df["a"]

df[["a"]]

4. Subset(일부 값만 불러오기)

# Rows 기준 예시
df[df.Length > 7]


# Columns 기준 예시
df[['width', 'length', 'species']]

df["a", "b"]
# 두 개 이상의 값을 불러올 때 Series형태로 불러올 경우 키값 오류가 발생합니다.

df[["a", "b"]]
# DataFrame 형태로 불러와야 합니다.

*주의: 두 개 이상의 값을 불러 올때는 DataFrame 형태로 불러와야 합니다.

5. Summarize Data

df["a"].value_counts()

6. Reshaping

1) "a" 컬럼을 기준으로 정렬하기

df["a"].sort_values()

2) DataFrame 전체에서 "a"값을 기준으로 정렬하기

df.sort_values("a")

3) 역순으로 정렬하기

df.sort_values("a", ascending=False)

4) "c" 컬럼 drop 하기

df = df.drop(["c"], axis=1)
df

7. Group Data

1) "a" 컬럼값을 Groupby하여 "b"의 컬럼값 평균값 구하기 

df.groupby(["a"])["b"].mean()

2) pivot_table로 평균값 구하기

pd.pivot_table(df, index="a")

 "a" 컬럼에 있는 값이 4가 두 개가 있기 때문에 그 값의 평균값이 적용이 됩니다.

8. Plotting

1)꺽은선 그래프 그리기

df.plot()

2)막대그래프그리기

df.plot.bar()

3)밀도함수 그리기

df.plot.density()

728x90
반응형