[R language] : 기초 문법 (4)

이번에는 간단하게 통계값을 뽑아내는 방법들을 다뤄보도록 하겠다.
변수에 대한 요약값 살펴보기
변수가 Factor 형태일 때에는 각 level에 해당하는 집계 count를 나타내주며, Numeric 형태일 때는 최소값, 최대값, 평균, 분위수를 나타낸다.


분위수 계산
분위수란 변수를 오름차순으로 정리하였을 때, 특정 % 위치에 해당되는 값을 의미한다. 예를 들어, Q1은 1분위수로 하위 25%에 해당되고 Median은 50%에 해당되는 직원의 satisfaction_level을 나타내주며, Q3는 하위 75%의 기준에 해당된다.

합, 평균, 표준편차 구하기
- 단일 변수의 합 구하기

- 단일 변수의 평균 구하기

- 단일 변수의 표준편차 구하기

- 다중 변수의 합, 평균 구하기
행별로 합, 평균 구할시에는 rowSums,rowMeans 활용

빈도 테이블 작성하기
- 1차원 빈도 테이블


- 2차원 빈도 테이블

