AI Big Data/pandas

pandas 설치하기

retro_blue 2020. 7. 6. 13:54
반응형

1. pandas란?

 


pandas

 

Python 프로그래밍 언어로 구축된 오픈 소스 데이터 분석 조작 도구

구조화된 데이터나 표 형식의 데이터를 빠르고 쉽고 표현적으로 다루도록 설계된 고수준의 자료구조와 함수를 제공

NumPy의 고성능, 배열 연산 아이디어 + 스프레드시트/관계형 DB (SQL) 데이터 처리 기능을 결합

 

- 자료구조 : 표 형태의 로우와 컬럼 이름을 가지는 DataFrame(데이터프레임)

                1차원 배열 객체인 Series(시리즈)


1-1. 아나콘다 설치

 

라는 파이썬과 데이터 분석 라이브러리를 한데 모아 놓은 패키지를 설치하여 실습합니다.

 

https://www.anaconda.com/products/individual  에 접속하여 각 운영체제에 해당되는 파일을 다운 받습니다.

 

 

그대로 Next > 버튼을 눌러 진행하면 됩니다

 

Python 언어 기반 Open Source Data Science 관련 application들을 만나볼 수 있다

 

금전적 부담이 없는 만큼 처음 데이터 분석을 시작하는 사람들에게 유용한 프로그램이라 할 수 있습니다.

기본적으로 NumPy, Matplotlib, pandas 등의 다양한 Package를 지원하고 있습니다.

 

 

1-2. Python 설치 확인

 

만약 Python이 설치되었는지 확인하고 싶다면,

+ R 버튼을 눌러 [실행] 창을 띄어줍니다.

 

cmd는 명령프롬프트 프로그램을 실행시킬 수 있는 실행어입니다. 
아나콘다를 통해 Python을 설치했다면, 'Python 3.7 : : Anaconda, lnc' 라 표시된다.

 

1-3. 환경변수 설정

 

 

python.exe 실행파일이 있는 경로를 입력해주면 됩니다.

 

명령프롬프트 창에서 python을 입력해보면, python이 실행되는 것을 볼 수 있습니다.

 

 

2. Jupyter Notebook 실행하기

플랫폼 내 Application을 살펴보면 Jupyter Notebook이 있습니다.

처음 설치하였을 때에는 Launch 가 아닌 Install로 적혀있는데, Install을 클릭해서 설치해줍니다.

 

Install 후 Launch를 클릭하면 본인이 사용하고 있는 브라우저를 통해 Jupyter Notebook 이 실행됩니다.

 

 

2-1. Jupyter Notebook 실행 경로 변경

 

Jupyter Notebook을 처음 실행하면 최초 폴더 경로가 사용자 폴더로 되어있습니다.

다른 폴더에서 작업을 하고 마치더라도 항상 시작하면 사용자 폴더 C:\사용자\(Username) 으로 접속되어 불편합니다.

 

C:\Users\(username)\.jupyter\jupyter_notebook_config.py 파일이 생성됩니다.

 

메모장으로 실행시켜줍니다.
Ctrl + F 로 dir을 검색해줍니다.

Jupyter Notebook을 실행하면 표시되는 경로입니다.

 

처음에는 # c.NotebookApp.notebook_dir = '' 으로 설정되어 있는데

# 를 제거해주시고, ' ' 사이에 pandas 실습에 사용할 폴더의 경로를 입력해줍니다.

그리고 [저장] 하시고 메모장은 종료시킵니다.

 

경로를 원하는 폴더로 변경한 모습. 

2-2. pandas 설치 및 Anaconda 내의 Python 패키지 업데이트

pip install pandas
# Install pandas Package

conda update --all
# Anaconda의 Python Package all update

 

Jupyter Notebook 에서 라이브러리를 설치하려면 셀 시작 부분에 느낌표(!) 를 추가해야합니다.

느낌표를 추가하면, 명령 프롬프트에서 입력한 것처럼 처리가 되어 편리합니다.

 


[참고자료]

(Documents) pandas: powerful Python data analysis toolkit (https://pandas.pydata.org/docs/pandas.pdf)

반응형

'AI Big Data > pandas' 카테고리의 다른 글

시리즈 다루기  (0) 2020.07.08
나만의 데이터 만들기  (0) 2020.07.07
기초적인 통계 계산하기  (2) 2020.07.06
데이터 추출하기  (0) 2020.07.06
데이터 집합 불러오기  (0) 2020.07.06