dataframe 2

데이터 프레임 이해하기

데이터 프레임(Data Frame)은 행과 열로 구성된 사각형 모양의 표처럼 생겼습니다. 가장 많이 사용하는 데이터의 형태입니다. 대학교 학년 성별 점수 서울 1 남 84 연세 3 여 96 성균관 4 여 89 한양 2 남 93 저번에 만들었던 데이터 프레임을 가져왔습니다. 4개의 행, 4개의 열로 구성되어 있는 데이터 프레임입니다. 열은 대학교, 학년, 성별, 점수의 네 가지 속성으로 되어 있으며, 행을 보면 4명의 학생의 자료라는 것을 알 수 있습니다. 세로로 나열되는 열은 속성을 나타냅니다. '컬럼(Column)' 또는 '변수(Variable)' 라고 불립니다. 가로로 나열되는 행은 각 사람에 대한 정보를 나타내줍니다. 'Row' 또는 '케이스(Case)'라고 불립니다. 이렇게 한 명에 대한 데이터는..

AI Big Data/R 2020.07.19

데이터프레임 다루기

데이터프레임 또한 시리즈와 마찬가지로 불린 추출과 브로드캐스팅을 할 수 있습니다. 1. 불린 추출 KBO 팀들의 평균 승리 수를 계산해보니 26.8 이라는 결괏값이 나왔습니다. kborank의 W 열에서 W 열의 평균보다 높은 행을 출력해본 결과 6개의 팀이 평균치 이상의 승리를 달성했습니다. 이번엔 참, 거짓을 담은 bool 벡터를 데이터프레임에 적용시켜 보겠습니다. 인덱스가 1, 4, 5인 행 데이터는 bool 값이 False라 출력되지 않습니다. 2. 브로드캐스팅 시리즈에 스칼라 연산을 적용할 때는 모든 요소에 스칼라를 적용하여 연산했습니다. 데이터프레임도 마찬가지입니다. kborank 데이터프레임에 2를 곱하면 정수 데이터는 2를 곱한 숫자를, 문자열 데이터는 문자열이 2배로 늘어납니다. [참고자..

AI Big Data/pandas 2020.07.08