반응형

06-1 데이터 전처리- 원하는 형태로 데이터 가공하기

분석에 적합하게 데이터를 가공하는 작업을 '데이터 전처리'라고 합니다. 

Data Preprocessing

 

06-2 조건에 맞는 데이터만 추출하기

filter()

 

06-3 필요한 변수만 추출하기

select()

 

06-4 순서대로 정렬하기

arrange()를 이용하면 데이터를 원하는 순서로 정렬할 수 있습니다.

 

06-5 파생변수 추가하기

mutate() 를 사용하면 기존 데이터에 파생변수를 만들어 추가할 수 있습니다.

 

06-6 집단별로 요약하기

summarise()

 

06-7 데이터 합치기

가로로 합치기 by = ""

세로로 합치기 bind_rows()

 

07. 데이터 정제 - 빠진 데이터 , 이상한 데이터 제거하기 

07-1 빠진 데이터를 찾아라 !- 결측치 정제하기 

is.na()

na.rm = T

 

07-2 이상한 데이터를 찾아라 !-  이상치 정제하기

정상 범주에서 크게 벗어난 값을 '이상치 Outlier라고 합니다.

극단치 : 논리적으로 존재할 수 있지만 극단적으로 크거나 작은 값을 '극단치'라고 합니다.

 

boxplot()

 

08. 그래프 만들기 

08-1 R로 만들 수 있는 그래프 살펴보기

ggplot2

 

08-2 산점도 - 변수 간 관계 표현하기 

산점도 

geom_point()

 

08-3 막대 그래프 -집단 간 차이 표현하기

geom_bar()

 

08-4 선그래프 - 시간에 따라 달라지는 데이터 표현하기 

geom_line()

 

08-5 상자 그림 - 집단 간 분포 차이 표현하기

geom_boxplot()

 

반응형

+ Recent posts