본문 바로가기
Study

[Pandas] 데이터프레임 인덱스 재설정

by 즐거운개발 2022. 7. 7.

데이터프레임을 추가, 삭제하게 되면 인덱스도 재설정해줘야 하는 경우가 생긴다.

 

# 예를 들어 list1이라는 데이터프레임을 생성했을 경우를 보자.

 

list1 = pd.DataFrame([[0,1,3],[0,2,4],[0,3,3],[1,2,3], [0, 1, 3]],
                     columns=['c0','c1','c2'])   
                     
print(list1)

 

 

# 컬럼 c0, c2를 기준으로 중복값을 제거해 보겠다.

 

중복값 중 마지막 행만 남길 것이므로 인덱스 0, 2가 삭제될 것이다.

 

참고로 drop_duplicates 메서드는 중복되는 행을 제거해 준다.

 

- drop_duplicates('중복검사할 컬럼 list')

  -. keep : 남겨둘 행 위치. 'last'는 마지막 행, 'first'는 첫째 행, False를 주면 다 삭제함.

  -. inplace=True : 변경내용 원본 반영

 

list1.drop_duplicates(['c0', 'c2'], keep='last', inplace=True)

print(list1)

 

 

# 어지러운 인덱스를 순서대로 재설정해보자.

 

reset_index 메서드는 인덱스를 재설정해준다.

 

- reset_index()

  -. drop=True : 인덱스 열을 컬럼값으로 변환하지 않고 버림

  -. inplace=True : 변경내용 원본 반영

 

# 인덱스 재설정
result.reset_index(drop=True, inplace=True)

댓글