06-1 데이터 전처리- 원하는 형태로 데이터 가공하기
분석에 적합하게 데이터를 가공하는 작업을 '데이터 전처리'라고 합니다.
Data Preprocessing
06-2 조건에 맞는 데이터만 추출하기
filter()
06-3 필요한 변수만 추출하기
select()
06-4 순서대로 정렬하기
arrange()를 이용하면 데이터를 원하는 순서로 정렬할 수 있습니다.
06-5 파생변수 추가하기
mutate() 를 사용하면 기존 데이터에 파생변수를 만들어 추가할 수 있습니다.
06-6 집단별로 요약하기
summarise()
06-7 데이터 합치기
가로로 합치기 by = ""
세로로 합치기 bind_rows()
07. 데이터 정제 - 빠진 데이터 , 이상한 데이터 제거하기
07-1 빠진 데이터를 찾아라 !- 결측치 정제하기
is.na()
na.rm = T
07-2 이상한 데이터를 찾아라 !- 이상치 정제하기
정상 범주에서 크게 벗어난 값을 '이상치 Outlier라고 합니다.
극단치 : 논리적으로 존재할 수 있지만 극단적으로 크거나 작은 값을 '극단치'라고 합니다.
boxplot()
08. 그래프 만들기
08-1 R로 만들 수 있는 그래프 살펴보기
ggplot2
08-2 산점도 - 변수 간 관계 표현하기
산점도
geom_point()
08-3 막대 그래프 -집단 간 차이 표현하기
geom_bar()
08-4 선그래프 - 시간에 따라 달라지는 데이터 표현하기
geom_line()
08-5 상자 그림 - 집단 간 분포 차이 표현하기
geom_boxplot()