AI Big Data/R

변수란?

retro_blue 2020. 7. 18. 14:19
반응형

여기 표가 하나 있습니다.

대학교 학년 성별 점수 국적
서울 1 84 대한민국
연세 3 96 대한민국
성균관 4 89 대한민국
한양 2 93 대한민국

표를 살펴보면 [국적]은 '대한민국' 이라는 고정된 값을 지니고 있는 반면, [대학교], [학년], [성별], [점수]는 다양한 값을 지니고 있습니다.

 

이처럼 하나의 값으로만 되어 있는 속성은 '상수(Constant)' 라고 하지만, 다양한 값을 지니고 있는 하나의 속성은 '변수(Variable)라고 합니다.

 

상수는 분석할 게 없는 반면, 변수는 데이터 분석의 대상이 될 수 있습니다.

위의 표 자료에선 모든 학생들이 같은 국적을 지니고 있기 때문에 국적에 따른 점수 차이, 남ㆍ녀 비율을 분석할 수 없습니다.

 

 

 

그럼 R에서는 변수를 어떻게 만들까요? 한 번 알아보도록 하겠습니다.

 

# 변수 만들기

 

R에서는 변수를 만들 때 왼쪽을 향한 화살표 기호 '<-' 를 사용합니다.

화살표 기호는 변수에 값을 할당한다는 의미에서 '할당 연산자(Assignment Operators)' 라고 합니다.

예를 들어, a <- 1 은 a 라는 이름의 빈 상자에 1이라는 물건을 담는다고 생각하면 쉽습니다.

 

a = 1 처럼 화살표 대신 등호(=)를 사용할 수도 있습니다. 다만, R에서는 등호가 변수를 만드는 것 외에도 다른 기능을 하기 때문에 이왕이면 헷깔리지 않도록 화살표 기호를 사용하는 것이 좋습니다.

 

이렇게 변수를 만들어두면 그 변수들을 이용해 연산이 가능합니다.

 

 

실제 분석에서는 score, grade 처럼 알아보기 쉽게 이름을 정합니다.

변수명은 문자, 숫자, 대시( - ), 언더바( _ )를 조합해 정할 수 있습니다. 단, 문자로 시작해야 합니다.

변수명은 한글로 정해도 되지만, 간혹 오류가 발생되는 경우가 있으니 영문으로 보통 정합니다.

또한 대소문자를 구분하기 때문에 헷깔리지 않도록 소문자로 통일하면 좋습니다.

 

# 여러 값으로 구성된 변수 만들기

 

변수에는 여러 개의 값을 넣을 수도 있습니다. c() 함수는 변수에 여러 개의 값을 넣는 기능을 합니다.

괄호 안에 쉼표를 이용해 숫자를 나열하는 형태로 사용합니다.

 

* c() 함수의 'c'는 '합치다'를 의미하는 'Combine'의 머리글자입니다. 함수는 특정한 기능을 수행하는 명령어입니다.

 

* var (Variable) : 변수

* seq (Sequence) : 연속

 

- 파라미터는 함수에 특정한 기능을 설정하는 일종의 옵션입니다.

- by 파라미터를 이용하면 일정한 간격을 두고 연속된 숫자로 된 변수를 만들 수 있습니다.

 

var1에 2를 더하면 var1의 다섯 개의 숫자에 2를 더한 값이 출력됩니다.

그리고 여러 값으로 구성된 변수끼리 연산하면 같은 순서에 위차한 값끼리 연산합니다.

 

# 문자로 된 변수 만들기

 

 

- str : string (문자열)

 

- 변수에 문자를 넣을 때는 문자 앞 뒤에 따옴표 " 를 붙여야 합니다.

 

- 문자 변수에는 하나의 문자, 여러 개의 문자로 구성된 단어, 여러 개의 단어로 구성된 문장을 넣을 수 있습니다.

 

- 띄어쓰기나 특수문자를 넣을 수 있습니다.

 

- c() 함수를 이용하면 여러 개의 문자로 구성된 변수를 만들 수 있습니다. 변수에 넣을 문자를 쉼표를 사용해 나열하면 됩니다. 이때 각 문자의 앞뒤에 따옴표를 넣어야 합니다.

 

 

 

 

 

 문자로 된 변수로는 연산할 수가 없습니다.

* 문자 변수로 연산하면 에러 메시지가 출력됩니다. 단어들을 붙이거나 자르는 등 문자로 된 데이터로 분석 작업을 하려면 문자 처리 기능을 가지고 있는 함수를 이용해야 합니다.

 

 

 


[참고자료]

(Book) Do it! 쉽게 배우는 R 데이터 분석

Do it! 쉽게 배우는 R 데이터 분석
국내도서
저자 : 김영우
출판 : 이지스퍼블리싱 2017.07.20
상세보기

 

반응형

'AI Big Data > R' 카테고리의 다른 글

데이터 프레임 이해하기  (0) 2020.07.19
함수와 패키지 이해하기  (0) 2020.07.19
R Studio 살펴보기  (0) 2020.07.16
R / R Studio 설치하기  (0) 2020.07.16
R이란?  (0) 2020.07.16