AI Big Data/R

변수명 바꾸기

retro_blue 2020. 7. 21. 14:04
반응형

 

데이터를 다루는 데에 있어 변수명이 기억하기 어려운 문자로 되어 있으면 쉬운 단어로 변경하는 것이 데이터를 수월하게 다룰 수 있습니다.

 

예를 들어, 응답자의 성별이 h1232, 소득이 c323 이런식으로 변수명이 정해졌다면, 이해하기 쉽게 성별을 sex, 소득을 income으로 변경해서 사용할 수 있습니다.

 

실습에 활용할 2개의 변수로 구성된 데이터 프레임을 먼저 생성하겠습니다.

 

rename() 함수를 이용하기 위해선 먼저 dplyr 패키지를 설치하고 로드해야 합니다.

dplyr데이터를 원하는 형태로 가공할 때 사용하는 패키지입니다.

 

 

 

- 변수명을 바꾸기 전에 원본을 보유하기 위해 df_new 라는 데이터 프레임 복사본을 만들겠습니다.

 

- 데이터 프레임 복사본을 만드는 이유는 작업 중에 오류가 발생하더라도 원 상태로 돌릴 수 있고, 데이터를 비교하면서 변형되는 과정을 검토할 수 있습니다.

 

 

 

 

- df_new는 var1, var2 2개의 변수로 구성되어 있는데, 이 중 var2를 v2로 바꾸어 보았습니다.

 

- rename()에 '데이터 프레임명, 새 변수명 = 기존 변수명'을 입력하면 됩니다.

 

- 순서가 바뀌면 실행되지 않습니다.

 

 

 

 

 

 

 

## 연습문제

mpg 데이터의 변수명은 긴 단어를 짧게 줄인 축약어로 되어 있습니다. cty 변수는 도시연비, hwy 변수는 고속도로 연비를 의미합니다. 변수명을 이해하기 쉬운 단어로 바꾸려고 합니다. mpg 데이터를 이용해 아래 문제를 해결해 보세요.

 

Q1. ggplot2() 패키지의 mpg 데이터를 사용할 수 있도록 불러온 후 복사본을 만드세요.

Q2. 복사본 데이터를 이용해 cty는 city, hwy는 highway로 수정하세요.

Q3. 데이터 일부를 출력해 변수명이 바뀌었는지 확인해 보세요. 

 

 


[참고자료]

(Book) Do it! 쉽게 배우는 R 데이터 분석 - 이지스퍼블리싱

Do it! 쉽게 배우는 R 데이터 분석
국내도서
저자 : 김영우
출판 : 이지스퍼블리싱 2017.07.20
상세보기

 

반응형

'AI Big Data > R' 카테고리의 다른 글

데이터 전처리  (0) 2020.07.22
파생변수 만들기  (0) 2020.07.21
데이터 파악하기  (0) 2020.07.20
데이터 프레임 이해하기  (0) 2020.07.19
함수와 패키지 이해하기  (0) 2020.07.19