본문 바로가기

study/인공지능

[데이콘 스터디] 2주차_ 함수 정리

중복데이터 처리

  • duplicated : 메서드가 적용된 열과 길이가 동일한 boolean vector 반환, 어떤 요소가 중복된 요소인지 확인 가능
  • drop_duplicates : 중복 요소 삭제

출처 : https://kongdols-room.tistory.com/124

DataFrame의 열 리셋

  • reset_index 사용
    drop : 인덱스로 세팅한 열을 DataFrame내에서 삭제할 지 여부 결정
    implace : 원본 객체를 변경할 지 여부를 결정

출처 : https://kongdols-room.tistory.com/123

(reset_index 사용 전)
image
(reset_index 사용 후)
image

  • groupby() 그룹별 집계
    : 전체 데이터를 그룹 별로 나누고(split) 각 그룹별로 집계 함수 적용(apply), 그룹별 집계 결과를 하나로 합치는(combine)단계를 거치게 된다.

출처 : https://rfriend.tistory.com/383