글
팩터(범주형 데이터)[2]
작업일지2
2019. 8. 2. 01:16
저번 포스트에서는 팩터가 범주형 데이터이고, 팩터를 factor 함수로 생성하는 것을 공부했다.
이번 시간에는 저번에 이어서 팩터를 다루는 것을 공부할 것이다.
팩터의 요소 다루기
팩터를 문자 벡터로 변환할 수 있다.
팩터를 숫자 벡터로 변환할 수도 있다.
문자로 변환할 때는 Levels에 매칭된 문자열로 변환되고, 숫자로 변환될 때는 내부 코드값으로 변환된다.
levels 옵션을 사용해 범주를 직접 정의해 보면,
levels 즉, 범주에 사과와 복숭아만 정의해서 오렌지는 <NA> 즉, Not Available 유효하지 않은 값으로 표현된다.
levels를 통해 범주의 순서도 정의할 수 있다. 범주의 순서는 그래프나 분석 결과에 영향을 준다.
서열형 팩터 생성
분석 대상이 되는 데이터 항목 중 범주형 데이터가 있다면 팩터로 변환 후 데이터를 분석함으로써 더 정확한 분석 결과를 기대할 수 있다.
*범주가 숫자로 구성된 팩터를 변환할 때 주의사항
범주가 숫자로 구성된 팩터의 경우 숫자로 보이다 보니 벡터로 변환할 때 as.numeric을 사용해 의도치 않게 내부 인덱스 벡터로 변환되는 경우가 있다. 만약 범주명으로 벡터 변환하려면 as.character 함수로 먼저 변환한 후 다시 as.numeric 함수로 변환해야 한다.
'작업일지2' 카테고리의 다른 글
벡터 요소 수정/추가/삭제 (0) | 2019.08.16 |
---|---|
벡터 내 특정 요소 선택하기 (0) | 2019.08.14 |
팩터(범주형 데이터)[1] (0) | 2019.07.29 |
벡터 (벡터 생성과 데이터 타입) (0) | 2019.07.19 |
R studio (0) | 2019.07.19 |