반응형
#부스트코스
1.판다스 import
import pandas as pd
2. DataFrame
df = pd.DataFrame(
{"a" : [4, 5, 6],
"b" : [7, 8, 9],
"c" : [10, 11, 12]},
index = [1, 2, 3])
df
3. Series
df["a"]
df[["a"]]
4. Subset(일부 값만 불러오기)
# Rows 기준 예시
df[df.Length > 7]
# Columns 기준 예시
df[['width', 'length', 'species']]
df["a", "b"]
# 두 개 이상의 값을 불러올 때 Series형태로 불러올 경우 키값 오류가 발생합니다.
df[["a", "b"]]
# DataFrame 형태로 불러와야 합니다.
*주의: 두 개 이상의 값을 불러 올때는 DataFrame 형태로 불러와야 합니다.
5. Summarize Data
df["a"].value_counts()
6. Reshaping
1) "a" 컬럼을 기준으로 정렬하기
df["a"].sort_values()
2) DataFrame 전체에서 "a"값을 기준으로 정렬하기
df.sort_values("a")
3) 역순으로 정렬하기
df.sort_values("a", ascending=False)
4) "c" 컬럼 drop 하기
df = df.drop(["c"], axis=1)
df
7. Group Data
1) "a" 컬럼값을 Groupby하여 "b"의 컬럼값 평균값 구하기
df.groupby(["a"])["b"].mean()
2) pivot_table로 평균값 구하기
pd.pivot_table(df, index="a")
"a" 컬럼에 있는 값이 4가 두 개가 있기 때문에 그 값의 평균값이 적용이 됩니다.
8. Plotting
1)꺽은선 그래프 그리기
df.plot()
2)막대그래프그리기
df.plot.bar()
3)밀도함수 그리기
df.plot.density()
728x90
반응형
'Data > Data Science' 카테고리의 다른 글
[파이썬으로시작하는데이터사이언스]파이썬속성코스 (0) | 2023.10.09 |
---|