AI Big Data/pandas

그래프 그리기

retro_blue 2020. 7. 9. 09:42
반응형

데이터의 시각화는 데이터 분석에 있어서 아주 중요한 요소입니다.

이번 포스트에서는 간단한 그래프 작성과 함께 데이터 시각화가 무엇인지 확인하겠습니다.

 

 

 %matplotlib inline은 Jupyter Notebook에서 그래프를 그리기 위해 사용하는 매직 함수입니다.

 

 

Kaggle에서 1985-2016년도 까지 나라별 자살률에 대한 데이터를 가지고 실습해보겠습니다.

 

 

데이터 구성 확인
자살한 사람 수, 10만명 당 자살한 사람 수의 평균값을 나라별, 연도별로 그룹화하여 추출했습니다.

 

그룹화된 데이터에서 country가  'Republic of Korea' 인 데이터를 추출하여 그래프를 만들어보겠습니다.

 

다시 연도별로 묶어보겠습니다.

이제 구한 값을 plot 메서드를 사용하여 그래프로 만들어보겠습니다.

 

이 그래프를 통해 대한민국의 자살한 사람 수는 가파르게 상승하였으나, 10만명 당 자살한 사람의 수는 30년동안 큰 차이가 없다는 점을 확인할 수 있었습니다.

 

 


[참고자료]

(Data) Kaggle (https://www.kaggle.com/russellyates88/suicide-rates-overview-1985-to-2016)

 

Suicide Rates Overview 1985 to 2016

Compares socio-economic info with suicide rates by year and country

www.kaggle.com

(Book) Do it! 데이터 분석을 위한 판다스 입문 (Chen. Daniel Y 저) - 이지스퍼블리싱

Do it! 데이터 분석을 위한 판다스 입문
국내도서
저자 : 다니엘 첸(Chen, Daniel Y.) / 김영하역
출판 : 이지스퍼블리싱 2018.10.11
상세보기

(Documents) pandas: powerful Python data analysis toolkit (https://pandas.pydata.org/docs/pandas.pdf)

반응형