글
팩터(범주형 데이터)[1]
R의 팩터는 범주형 데이터를 담는다.
범주형 데이터는 제한된 범주 안에서 선택되는 데이터이다.
ex) 성별(남,여), 혈액형(A, B, O, AB), 옷의 종류(치마, 바지), 응답(매우 그렇다, 그렇다, 보통이다, 아니다, 매우 아니다) 등
범주형 데이터는 크게 두 종류로 구분한다.
서열형 데이터 vs. 명목형 데이터
-서열형 데이터: 항목 간에 서열이 존재 ex) 응답(매우 그렇다, 그렇다, 보통이다, 아니다, 매우 아니다) / 등급(A, B, C, D, E, F)
-명목형 데이터: 단순 분류 ex)성별(남, 여), 혈액형
팩터는 factor 함수를 통해 생성한다.
factor( x, levels, ordered)
x: 팩터로 변환할 벡터
levels: 입력한 벡터 x의 범주를 정의한 벡터. 범주의 순서도 정의할 수 있음(특별히 정의하지 않을 경우 자동 생성)
ordered: 서열형 데이터인 경우 TRUE로 설정(기본값은 FALSE/명목형 데이터)
v_factor는 문자열로 출력되지만 내부적으로는 숫자로 된 코드 값 벡터로 구성돼 있다.
'작업일지2' 카테고리의 다른 글
벡터 내 특정 요소 선택하기 (0) | 2019.08.14 |
---|---|
팩터(범주형 데이터)[2] (0) | 2019.08.02 |
벡터 (벡터 생성과 데이터 타입) (0) | 2019.07.19 |
R studio (0) | 2019.07.19 |
R 관련 책 선정 (0) | 2019.07.15 |
글
벡터 (벡터 생성과 데이터 타입)
벡터란?
벡터가 무엇일까? 내가 알던 벡터는 방향과 크기를 모두 담는 표현이다.
그런데 R언어에서 벡터는 무슨 뜻일까?
이때, 벡터는 자료구조를 뜻한다.
-벡터는 R의 가장 기본적인 구조로서 일반적인 1차 배열 형태를 띠고 있다.
-벡터의 길이는 별도의 선언 없이 요소를 추가한 만큼 늘어난다.
-요소들은 모두 같은 데이터 타입이어야 한다.
벡터 생성하기
벡터는 "c"(combine) 함수를 통해 생성한다.
**벡터는 한 가지 데이터 타입만 저장할 수 있으므로 숫자와 문자가 함께 담기면 숫자를 문자로 변환한 후 문자 벡터로 생성한다.
-한 개의 숫자나 문자도 길이가 1인 벡터로 인식한다.
벡터에 담을 수 있는 데이터 타입은?
1. 숫자(정수, 소수점)
-min() 함수: 최솟값
-max() 함수: 최댓값
-mean() 함수: 평균
-median() 함수: 중간값
-sum() 함수: 합계
2. 논리(TRUE, FALSE, T, F)
*소문자로 쓰거나 따옴표와 함께 쓰면 논리형으로 인식하지 않는다.
-!TRUE == FALSE
-!FALSE == TRUE
3. 문자열
*"" 또는 ''를 사용하여 문자열 표현
-nchar(): 문자개수 출력
-substr("~~", n, m): n번 째부터 m번째까지 문자열 자르기
-substr( c("", "", '', "", ... , ""), n, m): n부터 m까지의 문자열 추출
-strsplit("", split="/"): 특정 문자로 데이터 나누어 벡터로 반환
-paste("a" , "b", "c", sep=""): "a","b", "c" 각 문자열 합친다. (sep으로 합칠때 문자열 사이의 문자 정의, sep을 정의안하면 공백없이 합친다.)
-toupper(): 대문자 변환
-tolower(): 소문자 변환
'작업일지2' 카테고리의 다른 글
팩터(범주형 데이터)[2] (0) | 2019.08.02 |
---|---|
팩터(범주형 데이터)[1] (0) | 2019.07.29 |
R studio (0) | 2019.07.19 |
R 관련 책 선정 (0) | 2019.07.15 |
주제조사 (0) | 2019.07.12 |
글
1. 데스크탑의 R 스튜디오의 창 별로 기능에 대해서 알아봄.
-R 콘솔(명령어 수행)
-R 소스 편집기(명령어 강조 및 자동완성, 명령어들을 파일로 관리 가능, 실행할 라인에 커서를 놓고 Ctrl+Enter 누르면 바로 실행 가능.)
-기타 창의 Environment(변수명과 값들 확인), History(수행했던 명령어들 표시, 손쉽게 다시 수행 가능), Files, Plots(그래프를 보여줌), Packages(현재 설치된 패키지 보여줌), Help 등으로 구성되어 있다.
2. R언어의 특징에 대해 공부함.
-함수 사용 가능
-대소문자 구분
-주석은 #으로..
-명령어를 받을 준비가 되었음을 알려주는 프롬프트(>)가 있다.
오류로 실행이 되지 않고 +프롬프트를 출력한 상태로 대기하고 있을 때 오류 원인을 찾기 어려우면 Esc버튼을 눌러 +를 빠져나와 > 프롬프트로 돌아갈 수 있다.
-정의 해주는 수식 "<-" "=" "->"
'작업일지2' 카테고리의 다른 글
팩터(범주형 데이터)[2] (0) | 2019.08.02 |
---|---|
팩터(범주형 데이터)[1] (0) | 2019.07.29 |
벡터 (벡터 생성과 데이터 타입) (0) | 2019.07.19 |
R 관련 책 선정 (0) | 2019.07.15 |
주제조사 (0) | 2019.07.12 |