중복데이터 처리
- duplicated : 메서드가 적용된 열과 길이가 동일한 boolean vector 반환, 어떤 요소가 중복된 요소인지 확인 가능
- drop_duplicates : 중복 요소 삭제
DataFrame의 열 리셋
- reset_index 사용
drop : 인덱스로 세팅한 열을 DataFrame내에서 삭제할 지 여부 결정
implace : 원본 객체를 변경할 지 여부를 결정
(reset_index 사용 전)
(reset_index 사용 후)
- groupby() 그룹별 집계
: 전체 데이터를 그룹 별로 나누고(split) 각 그룹별로 집계 함수 적용(apply), 그룹별 집계 결과를 하나로 합치는(combine)단계를 거치게 된다.
'study > 인공지능' 카테고리의 다른 글
[데이콘 스터디] 6주차_함수 정리 (0) | 2021.02.16 |
---|---|
[데이콘 스터디] 5주차_함수 정리 (0) | 2021.01.27 |
[데이콘 스터디] 4주차_함수 정리 (0) | 2021.01.27 |
[인공지능] 국제인공지능대전 참관 후기 (3) | 2020.11.05 |
[인공지능] Teachable Machine 미니 프로젝트 (0) | 2020.07.22 |