안녕하세요 콥스랩(COBS LAB)입니다. 오늘 소개해드릴 주제는 pandas입니다. 이번시간에는 데이터 프레임을 정렬하기 위해서 필요한 함수 sort_index와 sort_value에 대해서 알아보도록 하겠습니다.
예제용 데이터프레임입니다.
df = pd.DataFrame({'name': ['A','B','C','D','E','F'],
'age': [20,22,18,18,24,30],
'state': ['서울','부산','대구','포항','울산','광주'],
'point': [74,84,70,90,88,97]}
)
df
>>>
1. sort_index
sort_index는 인덱스 값을 기준으로 정렬하는 방법입니다.
df.sort_index()
>>>
아무 값도 넣지 않고 실행하면 index기준으로 오름차순으로 정렬합니다.
df.sort_index(ascending=False)
>>>
ascending에 False값을 넣어 내림차순으로 정렬하면 index 기준으로 내림차순으로 정렬합니다.
참고로 ascending: True(오름차순)/False(내림차순) 입니다.
2. sort_values
sort_value는 특정 칼럼을 기준으로 정렬하는 방법입니다.
sort_values는 특정 컬럼을 기준으로 정렬하기 때문에 by에 정렬할 기준값을 넣어줘야 합니다. ascending을 넣지 않으면 default 값인 오름차순으로 정렬합니다.
df.sort_values(by='point', ascending = False)
>>>
칼럼 ‘point’ 기준으로 ascending=False를 넣어서 내림차순으로 정렬하였습니다.
여러 개를 기준으로 사용할 수도 있습니다. 이때 정렬은 리스트의 뒤부터 실행하게 됩니다.
df.sort_values(by=['point','age'], ascending = False)
>>>
‘age’를 먼저 내림차순으로 정렬하고 ‘point’를 정렬하였습니다.
이번 시간에는 데이터 정렬에 대한 sort_index와 sort_values에 대해서 알아 보았습니다. 다음에는 칼럼에 대해서 좀 더 자세히 알아보도록 하겠습니다.
'pandas' 카테고리의 다른 글
pandas 기초(7) - 칼럼 배우기 part 2 (0) | 2023.01.31 |
---|---|
pandas 기초(6) - 칼럼 배우기 part 1 (0) | 2023.01.30 |
pandas 기초(4) - loc와 iloc 차이 (2) | 2023.01.27 |
pandas 기초 (3) - pandas 인덱스 설정하는 법 (0) | 2023.01.19 |
pandas 기초(2) - csv 읽기, DataFrame 필수 함수!! (0) | 2023.01.18 |
댓글