1. pandas란?
pandas
Python 프로그래밍 언어로 구축된 오픈 소스 데이터 분석 조작 도구
구조화된 데이터나 표 형식의 데이터를 빠르고 쉽고 표현적으로 다루도록 설계된 고수준의 자료구조와 함수를 제공
NumPy의 고성능, 배열 연산 아이디어 + 스프레드시트/관계형 DB (SQL) 데이터 처리 기능을 결합
- 자료구조 : 표 형태의 로우와 컬럼 이름을 가지는 DataFrame(데이터프레임)
1차원 배열 객체인 Series(시리즈)
1-1. 아나콘다 설치
라는 파이썬과 데이터 분석 라이브러리를 한데 모아 놓은 패키지를 설치하여 실습합니다.
https://www.anaconda.com/products/individual 에 접속하여 각 운영체제에 해당되는 파일을 다운 받습니다.
금전적 부담이 없는 만큼 처음 데이터 분석을 시작하는 사람들에게 유용한 프로그램이라 할 수 있습니다.
기본적으로 NumPy, Matplotlib, pandas 등의 다양한 Package를 지원하고 있습니다.
1-2. Python 설치 확인
만약 Python이 설치되었는지 확인하고 싶다면,
+ R 버튼을 눌러 [실행] 창을 띄어줍니다.
1-3. 환경변수 설정
python.exe 실행파일이 있는 경로를 입력해주면 됩니다.
명령프롬프트 창에서 python을 입력해보면, python이 실행되는 것을 볼 수 있습니다.
2. Jupyter Notebook 실행하기
플랫폼 내 Application을 살펴보면 Jupyter Notebook이 있습니다.
처음 설치하였을 때에는 Launch 가 아닌 Install로 적혀있는데, Install을 클릭해서 설치해줍니다.
2-1. Jupyter Notebook 실행 경로 변경
Jupyter Notebook을 처음 실행하면 최초 폴더 경로가 사용자 폴더로 되어있습니다.
다른 폴더에서 작업을 하고 마치더라도 항상 시작하면 사용자 폴더 C:\사용자\(Username) 으로 접속되어 불편합니다.
C:\Users\(username)\.jupyter\jupyter_notebook_config.py 파일이 생성됩니다.
Jupyter Notebook을 실행하면 표시되는 경로입니다.
처음에는 # c.NotebookApp.notebook_dir = '' 으로 설정되어 있는데
# 를 제거해주시고, ' ' 사이에 pandas 실습에 사용할 폴더의 경로를 입력해줍니다.
그리고 [저장] 하시고 메모장은 종료시킵니다.
2-2. pandas 설치 및 Anaconda 내의 Python 패키지 업데이트
pip install pandas
# Install pandas Package
conda update --all
# Anaconda의 Python Package all update
Jupyter Notebook 에서 라이브러리를 설치하려면 셀 시작 부분에 느낌표(!) 를 추가해야합니다.
느낌표를 추가하면, 명령 프롬프트에서 입력한 것처럼 처리가 되어 편리합니다.
[참고자료]
(Documents) pandas: powerful Python data analysis toolkit (https://pandas.pydata.org/docs/pandas.pdf)
'AI Big Data > pandas' 카테고리의 다른 글
시리즈 다루기 (0) | 2020.07.08 |
---|---|
나만의 데이터 만들기 (0) | 2020.07.07 |
기초적인 통계 계산하기 (2) | 2020.07.06 |
데이터 추출하기 (0) | 2020.07.06 |
데이터 집합 불러오기 (0) | 2020.07.06 |