반응형
데이터의 시각화는 데이터 분석에 있어서 아주 중요한 요소입니다.
이번 포스트에서는 간단한 그래프 작성과 함께 데이터 시각화가 무엇인지 확인하겠습니다.
%matplotlib inline은 Jupyter Notebook에서 그래프를 그리기 위해 사용하는 매직 함수입니다.
Kaggle에서 1985-2016년도 까지 나라별 자살률에 대한 데이터를 가지고 실습해보겠습니다.
그룹화된 데이터에서 country가 'Republic of Korea' 인 데이터를 추출하여 그래프를 만들어보겠습니다.
다시 연도별로 묶어보겠습니다.
이제 구한 값을 plot 메서드를 사용하여 그래프로 만들어보겠습니다.
이 그래프를 통해 대한민국의 자살한 사람 수는 가파르게 상승하였으나, 10만명 당 자살한 사람의 수는 30년동안 큰 차이가 없다는 점을 확인할 수 있었습니다.
[참고자료]
(Data) Kaggle (https://www.kaggle.com/russellyates88/suicide-rates-overview-1985-to-2016)
(Book) Do it! 데이터 분석을 위한 판다스 입문 (Chen. Daniel Y 저) - 이지스퍼블리싱
|
(Documents) pandas: powerful Python data analysis toolkit (https://pandas.pydata.org/docs/pandas.pdf)
반응형
'AI Big Data > pandas' 카테고리의 다른 글
matplotlib 라이브러리 사용하기 (0) | 2020.07.09 |
---|---|
앤스콤 4분할 그래프 살펴보기 (0) | 2020.07.09 |
데이터 저장하고 불러오기 (0) | 2020.07.09 |
시리즈와 데이터프레임의 데이터 처리하기 (0) | 2020.07.08 |
데이터프레임 다루기 (0) | 2020.07.08 |