AI Big Data/pandas

데이터 집합 불러오기

retro_blue 2020. 7. 6. 16:32
반응형

스웨덴의 비영리 통계분석 서비스. 

UN의 데이터를 바탕으로 한 인구 예측, 부의 이동 등에 관한 연구논문과 통계 정보 등을 공유

 

원하는 형태의 파일로 다운로드 합니다.

csv 파일은 몇 가지 필드를 쉼표(, )로 구분한 텍스트 데이터입니다.

 

각 나라별 15세 이상 고용률에 대한 자료를 사용하겠습니다.


1. 데이터 불러오기

# 만약 ', '가 아닌 탭(tab)으로 구분되어 있는 파일들(.tsv)을 호출할 때는 sep 속성값을 사용하여 \t를 지정합니다

    ex) df = pandas.read_Csv('data/jupyter.tsv', sep='\t')

 

 

 

2. 데이터 집합 살펴보기

 

 

# info 메서드를 사용하면 자료형에 대해 좀 더 자세한 내용을 확인할 수 있습니다.

# non-null 은 결측값 (NaN, nan, NAN) 이 없다는 뜻

# country는 문자열, float64는 소수점을 가진 숫자형으로 구성되어 있다는 점을 확인할 수 있습니다.

 

pandas 자료형 python 자료형 설명
object string 문자열
int64 int 정수
float64 float 소수점을 가진 숫자
datetime64 datetime python 표준 라이브러리인 datetime이 반환하는 자료형

 

 

 


[참고자료]

(Data) Gapminder (https://www.gapminder.org/data/)

 

Data

Data The table below lists all indicators displayed in Gapminder World. Click the name of the indicator or the data provider to access information about the indicator and a link to the data provider. Indicators labeled “Various sources” are compiled b

www.gapminder.org

(Book) Do it! 데이터 분석을 위한 판다스 입문 (Chen. Daniel Y 저) - 이지스퍼블리싱

Do it! 데이터 분석을 위한 판다스 입문
국내도서
저자 : 다니엘 첸(Chen, Daniel Y.) / 김영하역
출판 : 이지스퍼블리싱 2018.10.11
상세보기
반응형

'AI Big Data > pandas' 카테고리의 다른 글

시리즈 다루기  (0) 2020.07.08
나만의 데이터 만들기  (0) 2020.07.07
기초적인 통계 계산하기  (2) 2020.07.06
데이터 추출하기  (0) 2020.07.06
pandas 설치하기  (0) 2020.07.06