본문 바로가기
  • CobsLab upgrades your company value by AI technology
pandas

pandas 기초(5) - 데이터 프레임 정렬하기

by dmkdmk 2023. 1. 28.

안녕하세요 콥스랩(COBS LAB)입니다. 오늘 소개해드릴 주제는 pandas입니다. 이번시간에는 데이터 프레임을 정렬하기 위해서 필요한 함수 sort_index와 sort_value에 대해서 알아보도록 하겠습니다.

 

 

예제용 데이터프레임입니다.

df = pd.DataFrame({'name': ['A','B','C','D','E','F'],
                   'age': [20,22,18,18,24,30],
                   'state': ['서울','부산','대구','포항','울산','광주'],
                   'point': [74,84,70,90,88,97]}
                  )

df
>>>

 

1. sort_index

sort_index는 인덱스 값을 기준으로 정렬하는 방법입니다.

df.sort_index()

>>>

아무 값도 넣지 않고 실행하면 index기준으로 오름차순으로 정렬합니다.

 

 

df.sort_index(ascending=False)

>>>

ascending에 False값을 넣어 내림차순으로 정렬하면 index 기준으로 내림차순으로 정렬합니다.

참고로 ascending: True(오름차순)/False(내림차순) 입니다.

 

 

2. sort_values

 

sort_value는 특정 칼럼을 기준으로 정렬하는 방법입니다.

sort_values는 특정 컬럼을 기준으로 정렬하기 때문에 by에 정렬할 기준값을 넣어줘야 합니다. ascending을 넣지 않으면 default 값인 오름차순으로 정렬합니다.

df.sort_values(by='point', ascending = False)

>>>

칼럼 ‘point’ 기준으로 ascending=False를 넣어서 내림차순으로 정렬하였습니다.

여러 개를 기준으로 사용할 수도 있습니다. 이때 정렬은 리스트의 뒤부터 실행하게 됩니다.

 

 

df.sort_values(by=['point','age'], ascending = False)

>>>

‘age’를 먼저 내림차순으로 정렬하고 ‘point’를 정렬하였습니다.

 

 

이번 시간에는 데이터 정렬에 대한 sort_index와 sort_values에 대해서 알아 보았습니다. 다음에는 칼럼에 대해서 좀 더 자세히 알아보도록 하겠습니다.

댓글