[Pandas] 데이터프레임 인덱스 재설정

데이터프레임을 추가, 삭제하게 되면 인덱스도 재설정해줘야 하는 경우가 생긴다.

# 예를 들어 list1이라는 데이터프레임을 생성했을 경우를 보자.

list1 = pd.DataFrame([[0,1,3],[0,2,4],[0,3,3],[1,2,3], [0, 1, 3]],
                     columns=['c0','c1','c2'])   
                     
print(list1)

# 컬럼 c0, c2를 기준으로 중복값을 제거해 보겠다.

중복값 중 마지막 행만 남길 것이므로 인덱스 0, 2가 삭제될 것이다.

참고로 drop_duplicates 메서드는 중복되는 행을 제거해 준다.

- drop_duplicates('중복검사할 컬럼 list')

-. keep : 남겨둘 행 위치. 'last'는 마지막 행, 'first'는 첫째 행, False를 주면 다 삭제함.

-. inplace=True : 변경내용 원본 반영

list1.drop_duplicates(['c0', 'c2'], keep='last', inplace=True)

print(list1)

# 어지러운 인덱스를 순서대로 재설정해보자.

reset_index 메서드는 인덱스를 재설정해준다.

- reset_index()

-. drop=True : 인덱스 열을 컬럼값으로 변환하지 않고 버림

-. inplace=True : 변경내용 원본 반영

# 인덱스 재설정
result.reset_index(drop=True, inplace=True)

'Study' 카테고리의 다른 글

[MySQL] INSERT 시 ON DUPLICATE KEY UPDATE (0)	2022.07.15
[Python] Sort 리스트 정렬 (오름차순, 내림차순) (0)	2022.07.12
문자열에서 특정 문자열 삭제하는 네 가지 방법 (0)	2022.07.05
깊은 복사, 얕은 복사 (0)	2022.07.01
pyenv 이용해 가상환경 구축 (Mac) (0)	2022.06.30

포기하지 않고 꾸준하게

[Pandas] 데이터프레임 인덱스 재설정

'Study' 카테고리의 다른 글

댓글

티스토리툴바

[Pandas] 데이터프레임 인덱스 재설정

'Study' 카테고리의 다른 글

관련글

댓글

티스토리툴바