데이터프레임을 추가, 삭제하게 되면 인덱스도 재설정해줘야 하는 경우가 생긴다.
# 예를 들어 list1이라는 데이터프레임을 생성했을 경우를 보자.
list1 = pd.DataFrame([[0,1,3],[0,2,4],[0,3,3],[1,2,3], [0, 1, 3]],
columns=['c0','c1','c2'])
print(list1)
# 컬럼 c0, c2를 기준으로 중복값을 제거해 보겠다.
중복값 중 마지막 행만 남길 것이므로 인덱스 0, 2가 삭제될 것이다.
참고로 drop_duplicates 메서드는 중복되는 행을 제거해 준다.
- drop_duplicates('중복검사할 컬럼 list')
-. keep : 남겨둘 행 위치. 'last'는 마지막 행, 'first'는 첫째 행, False를 주면 다 삭제함.
-. inplace=True : 변경내용 원본 반영
list1.drop_duplicates(['c0', 'c2'], keep='last', inplace=True)
print(list1)
# 어지러운 인덱스를 순서대로 재설정해보자.
reset_index 메서드는 인덱스를 재설정해준다.
- reset_index()
-. drop=True : 인덱스 열을 컬럼값으로 변환하지 않고 버림
-. inplace=True : 변경내용 원본 반영
# 인덱스 재설정
result.reset_index(drop=True, inplace=True)
'Study' 카테고리의 다른 글
[MySQL] INSERT 시 ON DUPLICATE KEY UPDATE (0) | 2022.07.15 |
---|---|
[Python] Sort 리스트 정렬 (오름차순, 내림차순) (0) | 2022.07.12 |
문자열에서 특정 문자열 삭제하는 네 가지 방법 (0) | 2022.07.05 |
깊은 복사, 얕은 복사 (0) | 2022.07.01 |
pyenv 이용해 가상환경 구축 (Mac) (0) | 2022.06.30 |
댓글