반응형
스웨덴의 비영리 통계분석 서비스.
UN의 데이터를 바탕으로 한 인구 예측, 부의 이동 등에 관한 연구논문과 통계 정보 등을 공유
csv 파일은 몇 가지 필드를 쉼표(, )로 구분한 텍스트 데이터입니다.
각 나라별 15세 이상 고용률에 대한 자료를 사용하겠습니다.
1. 데이터 불러오기
# 만약 ', '가 아닌 탭(tab)으로 구분되어 있는 파일들(.tsv)을 호출할 때는 sep 속성값을 사용하여 \t를 지정합니다
ex) df = pandas.read_Csv('data/jupyter.tsv', sep='\t')
2. 데이터 집합 살펴보기
# info 메서드를 사용하면 자료형에 대해 좀 더 자세한 내용을 확인할 수 있습니다.
# non-null 은 결측값 (NaN, nan, NAN) 이 없다는 뜻
# country는 문자열, float64는 소수점을 가진 숫자형으로 구성되어 있다는 점을 확인할 수 있습니다.
pandas 자료형 | python 자료형 | 설명 |
object | string | 문자열 |
int64 | int | 정수 |
float64 | float | 소수점을 가진 숫자 |
datetime64 | datetime | python 표준 라이브러리인 datetime이 반환하는 자료형 |
[참고자료]
(Data) Gapminder (https://www.gapminder.org/data/)
(Book) Do it! 데이터 분석을 위한 판다스 입문 (Chen. Daniel Y 저) - 이지스퍼블리싱
|
반응형
'AI Big Data > pandas' 카테고리의 다른 글
시리즈 다루기 (0) | 2020.07.08 |
---|---|
나만의 데이터 만들기 (0) | 2020.07.07 |
기초적인 통계 계산하기 (2) | 2020.07.06 |
데이터 추출하기 (0) | 2020.07.06 |
pandas 설치하기 (0) | 2020.07.06 |