Pandas에서 Data 구조는 Series와 Dataframe으로 구분
① Series : 1차원 데이터 , Index와 Value로 구성
② Dataframe : 2차원 데이터, Index, Column, Value로 구성
■ Series 데이터의 CRUD (Create, Read & Update, Delete)
1. Create (pd.Series로 Series 데이터 선언)
import pandas as pd
seriesdata = pd.Series([70, 60, 90], index = ['국어', '영어', '수학'])
2. Read & Update
- Index로 Value 불러오기
seriesdata['국어']
seriesdata['영어']
- 새로운 값 할당
seriesdata['국어'] = 99
3. Delete
- del 함수 이용해서 index 기준으로 삭제하기
del.seriesdata['국어']
4. Series data type 변경
- astype 이용해서 data 타입 변경
series.astype('object')
# 'object'는 pandas에서 문자열, 복합 데이터 타입에 사용
■ Dataframe 데이터의 CRUD (Create, Read & Update, Delete)
1. Create (Column과 value 매칭해서 생성)
import pandas as pd
df = pd.DataFrame({
"미국" : [2.1, 2.2, 2.3],
"한국" : [20, 24, 21],
"중국" : [1, 2, 3],
})
import pandas as pd
df = pd.DataFrame({
"미국" : [2.1, 2.2, 2.3],
"한국" : [20, 24, 21],
"중국" : [1, 2, 3],
index = [2000, 2010, 2020] # index 와 함께 생성하기
})
2. Read & Update
- loc 함수 사용해서 row Index로 Value 찾기
df.loc[2000]
df.loc[2010]
df.loc[2020]
- iloc 함수 사용해서 row index 순서로 value 찾기
df.iloc[0] # df.loc[2000] 과 동일한 결과
df.iloc[1] # df.loc[2010] 과 동일한 결과
df.iloc[2] # df.loc[2020] 과 동일한 결과
df.iloc[0]['중국'] # index name 2000의 '중국' Column의 Value 반환
df.iloc[1]['한국'] # index name 2010의 '한국' Column의 Value 반환
df.iloc[2]['일본'] # index name 2020의 '일본' Column의 Value 반환
- 새로운 값 할당해주기
df.loc['한국'] = [200,300,400] # '한국' Column 값 변경
- index 설정, reset, 이름 바꿔주기
df.index.name = 'Year' # Index Name 'Year' 로 변경
df = df.reset_index('Year') # Index Column 이 Data Column으로 다시 reset
3. Delete
- drop 이용해서 행 삭제
df.drop([2020])
'데이터분석 > Pandas' 카테고리의 다른 글
[Pandas] 데이터 처리 연습 2 (0) | 2021.07.17 |
---|---|
[Pandas] 데이터 처리 연습 (0) | 2021.07.15 |
[Pandas] DataFrame Join (concat, merge) (0) | 2021.07.12 |
[Pandas] 데이터 처리 연습 (0) | 2021.07.12 |
[Pandas] EDA 기초 이해 (0) | 2021.07.08 |