R의 팩터는 범주형 데이터를 담는다.

 

범주형 데이터는 제한된 범주 안에서 선택되는 데이터이다.

ex) 성별(남,여), 혈액형(A, B, O, AB), 옷의 종류(치마, 바지), 응답(매우 그렇다, 그렇다, 보통이다, 아니다, 매우 아니다) 등

 

범주형 데이터는 크게 두 종류로 구분한다.

 

서열형 데이터 vs. 명목형 데이터

 

-서열형 데이터: 항목 간에 서열이 존재  ex) 응답(매우 그렇다, 그렇다, 보통이다, 아니다, 매우 아니다) / 등급(A, B, C, D, E, F)

 

-명목형 데이터: 단순 분류 ex)성별(남, 여), 혈액형

 

 

팩터는 factor 함수를 통해 생성한다.

factor( x, levels, ordered)

x: 팩터로 변환할 벡터

levels: 입력한 벡터 x의 범주를 정의한 벡터. 범주의 순서도 정의할 수 있음(특별히 정의하지 않을 경우 자동 생성)

ordered: 서열형 데이터인 경우 TRUE로 설정(기본값은 FALSE/명목형 데이터)

v_factor는 문자열로 출력되지만 내부적으로는 숫자로 된 코드 값 벡터로 구성돼 있다.

'작업일지2' 카테고리의 다른 글

벡터 내 특정 요소 선택하기  (0) 2019.08.14
팩터(범주형 데이터)[2]  (0) 2019.08.02
벡터 (벡터 생성과 데이터 타입)  (0) 2019.07.19
R studio  (0) 2019.07.19
R 관련 책 선정  (0) 2019.07.15

설정

트랙백

댓글

벡터란?

 

벡터가 무엇일까? 내가 알던 벡터는 방향과 크기를 모두 담는 표현이다.

그런데 R언어에서 벡터는 무슨 뜻일까?

이때, 벡터는 자료구조를 뜻한다.

 

-벡터는 R의 가장 기본적인 구조로서 일반적인 1차 배열 형태를 띠고 있다.

-벡터의 길이는 별도의 선언 없이 요소를 추가한 만큼 늘어난다.

-요소들은 모두 같은 데이터 타입이어야 한다. 

 

벡터 생성하기

 

벡터는 "c"(combine) 함수를 통해 생성한다.

**벡터는 한 가지 데이터 타입만 저장할 수 있으므로 숫자와 문자가 함께 담기면 숫자를 문자로 변환한 후 문자 벡터로 생성한다.

-한 개의 숫자나 문자도 길이가 1인 벡터로 인식한다.

 

 

벡터에 담을 수 있는 데이터 타입은?

 

1. 숫자(정수, 소수점)

-min() 함수: 최솟값

-max() 함수: 최댓값

-mean() 함수: 평균

-median() 함수: 중간값

-sum() 함수: 합계

 

2. 논리(TRUE, FALSE, T, F)

*소문자로 쓰거나 따옴표와 함께 쓰면 논리형으로 인식하지 않는다.

-!TRUE == FALSE

-!FALSE == TRUE

 

3. 문자열

*"" 또는 ''를 사용하여 문자열 표현

-nchar(): 문자개수 출력

-substr("~~", n, m): n번 째부터 m번째까지 문자열 자르기

-substr( c("", "", '', "", ... , ""), n, m): n부터 m까지의 문자열 추출

-strsplit("", split="/"): 특정 문자로 데이터 나누어 벡터로 반환

-paste("a" , "b", "c", sep=""): "a","b", "c" 각 문자열 합친다. (sep으로 합칠때 문자열 사이의 문자 정의, sep을 정의안하면 공백없이 합친다.)

-toupper(): 대문자 변환

-tolower(): 소문자 변환

 

 

'작업일지2' 카테고리의 다른 글

팩터(범주형 데이터)[2]  (0) 2019.08.02
팩터(범주형 데이터)[1]  (0) 2019.07.29
R studio  (0) 2019.07.19
R 관련 책 선정  (0) 2019.07.15
주제조사  (0) 2019.07.12

설정

트랙백

댓글

R studio

작업일지2 2019. 7. 19. 09:51

1. 데스크탑의 R 스튜디오의 창 별로 기능에 대해서 알아봄.

-R 콘솔(명령어 수행)

-R 소스 편집기(명령어 강조 및 자동완성, 명령어들을 파일로 관리 가능, 실행할 라인에 커서를 놓고 Ctrl+Enter 누르면 바로 실행 가능.)

-기타 창의 Environment(변수명과 값들 확인), History(수행했던 명령어들 표시, 손쉽게 다시 수행 가능), Files, Plots(그래프를 보여줌), Packages(현재 설치된 패키지 보여줌), Help 등으로 구성되어 있다. 

 

 

2. R언어의 특징에 대해 공부함.

-함수 사용 가능

-대소문자 구분

-주석은 #으로..

-명령어를 받을 준비가 되었음을 알려주는 프롬프트(>)가 있다.

    오류로 실행이 되지 않고 +프롬프트를 출력한 상태로 대기하고 있을 때 오류 원인을 찾기 어려우면 Esc버튼을 눌러       +를 빠져나와 > 프롬프트로 돌아갈 수 있다.

-정의 해주는 수식 "<-" "=" "->"

'작업일지2' 카테고리의 다른 글

팩터(범주형 데이터)[2]  (0) 2019.08.02
팩터(범주형 데이터)[1]  (0) 2019.07.29
벡터 (벡터 생성과 데이터 타입)  (0) 2019.07.19
R 관련 책 선정  (0) 2019.07.15
주제조사  (0) 2019.07.12

설정

트랙백

댓글