'작업일지2' 카테고리의 글 목록

단어추출하기 KoNLP, 빈도수 높은 단어를 워드클라우드 표현 (0)	2019.10.16
객체 조회/삭제/저장/불러오기 (0)	2019.09.25
[제어문] if/else, for문 (0)	2019.09.20
나만의 함수 만들기!! (0)	2019.09.18
[리스트]모든 요소에 일괄 반영 (0)	2019.09.10

단어추출하기 KoNLP, 빈도수 높은 단어를 워드클라우드 표현

작업일지2 2019. 10. 16. 09:22

코타키나발루를 블로그에 검색한 결과에서 단어만 추출해 그 결과를 확인해보자.

글자 길이가 1이거나 의미없는 단어들을 제거한다.

빈도수(table)를 기준으로 내림차순으로 상위 50개 단어를 추출한다.

추출한 단어들을 wordcloud2 패키지의 wordcloud2 함수를 활용해 워드 클라우드로 표현해보았다.

wordcloud2(data, size, shape)

data: 단어와 빈도수 정보가 포함된 데이터프레임 또는 테이블

size: 글자 크기

shape: 워드 클라우드의 전체 모양(circle, cardioid, diamond, triangle, star 등)

'작업일지2' 카테고리의 다른 글

공일 (0)	2019.11.02
객체 조회/삭제/저장/불러오기 (0)	2019.09.25
[제어문] if/else, for문 (0)	2019.09.20
나만의 함수 만들기!! (0)	2019.09.18
[리스트]모든 요소에 일괄 반영 (0)	2019.09.10

설정

,

트랙백

단어추출하기 KoNLP, 빈도수 높은 단어를 워드클라우드 표현 (0)	2019.10.16
객체 조회/삭제/저장/불러오기 (0)	2019.09.25
나만의 함수 만들기!! (0)	2019.09.18
[리스트]모든 요소에 일괄 반영 (0)	2019.09.10
리스트 생성, 요소 접근 (0)	2019.09.08

객체 조회/삭제/저장/불러오기 (0)	2019.09.25
[제어문] if/else, for문 (0)	2019.09.20
[리스트]모든 요소에 일괄 반영 (0)	2019.09.10
리스트 생성, 요소 접근 (0)	2019.09.08
데이터 프레임의 구조 변경 (0)	2019.09.06

[제어문] if/else, for문 (0)	2019.09.20
나만의 함수 만들기!! (0)	2019.09.18
리스트 생성, 요소 접근 (0)	2019.09.08
데이터 프레임의 구조 변경 (0)	2019.09.06
데이터 변경 (0)	2019.09.04

나만의 함수 만들기!! (0)	2019.09.18
[리스트]모든 요소에 일괄 반영 (0)	2019.09.10
데이터 프레임의 구조 변경 (0)	2019.09.06
데이터 변경 (0)	2019.09.04
데이터 개요 보기, 데이터 탐색 (0)	2019.08.28

[리스트]모든 요소에 일괄 반영 (0)	2019.09.10
리스트 생성, 요소 접근 (0)	2019.09.08
데이터 변경 (0)	2019.09.04
데이터 개요 보기, 데이터 탐색 (0)	2019.08.28
데이터프레임, 데이터 접근 (0)	2019.08.25

리스트 생성, 요소 접근 (0)	2019.09.08
데이터 프레임의 구조 변경 (0)	2019.09.06
데이터 개요 보기, 데이터 탐색 (0)	2019.08.28
데이터프레임, 데이터 접근 (0)	2019.08.25
벡터 간의 연산 (0)	2019.08.23

데이터 개요 보기, 데이터 탐색

작업일지2 2019. 8. 28. 09:02

데이터 개요 보기

R에는 기본적으로 제공되는 iris라는 데이터 셋이 있다.

iris는 150개의 행, 5개열로 구성되어 있고, 5개 열의 속성과 일부 데이터 값을 확인할 수 있다.

데이터프레임의 총 행 수는 nrow, 총 열 수는 ncol 함수로 알 수 있다.

*데이터프레임의 데이터가 매우 많을 때는 창에 출력하는 데에만 엄청난 시간이 걸려서 head함수와 tail함수를 이용해 앞뒤 일부만 출력 가능

head( 데이터프레임명, 보고 싶은 행 수) 행 수 입력 안하면 기본적으로 6행 출력

tail( 데이터프레임명, 보고 싶은 행 수) 행 수 입력 안하면 기본적으로 6행 출력

summary 함수를 통해 각 열의 데이터에 대한 요약 정보를 확인 가능

summary( 데이터프레임명 )

숫자 데이터의 경우 Min최솟값, 1st Qu1사분위 수, Median중간값, Mean평균, 3rd Qu3분위 수, Max최댓값을 보여줌.

팩터의 경우 각 범주 당 몇 개가 존재하는지 집계함.

별도의 통계 함수로도 특정 값을 산출할 수 있다.

View 함수: 데이터프레임 표 형식으로 조회하고 정렬 및 조건 검색 가능

Filter 기능을 이용해 원하는 조건에 부합하는 데이터만 볼 수 있다.

Sepal.Width: 3.5, Species: virginia 필터 적용

subset 함수로 조건 검색

다양한 조건들을 조합해 큰 데이터를 분석해야 할 때는 View 보다 subset 등 조건 검색을 지원하는 함수나 논리벡터를 활용해 데이터를 확인한다.

subset( 데이터프레임명, 찾고자 하는 조건, 조회하고 싶은 열(입력안하면 전체 조회))

A%in% ( c(2,4,5)) : A는 2,4,5 중 하나인 것

+)함수 호출하기

1. 입력 항목명을 지정하지 않고 입력 객체를 순서대로 입력

2. 입력 항목명을 지정해 입력 - 순서를 지키지 않아도 된다!!

attach와 detach 함수

[]를 사용해 데이터프레임에서 조건 검색을 할 때는 subset 함수와 달리 열 이름 앞에 항상 데이터프레임명도 명시해주어야 하기 때문에 가독성이 떨어지고 코드가 너무 길어질 수 있다. attach 함수는 R이 객체를 찾는 경로를 추가해 주는 함수로서 데이터프레임을 추가하면 R은 우선적으로 등록한 데이터프레임 내부에서 객체를 찾아준다. 따라서 열 이름 앞에 데이터프레임명을 명시해주지 않아도 된다. attach 함수의 설정 내역을 해제할 때는 detach 함수를 사용한다.

attach(데이터프레임명)

detach(데이터 프레임명)

*주의사항

[] 연산자로 데이터프레임을 조건 검색한 결과가 한 개의 열이면 데이터프레임이 아닌 벡터로 반환한다. 벡터로의 반환은 프로그램 내의 오류를 발생시키기도 한다. 데이터프레임 형태를 유지하여 조회하고 싶으면 drop = FALSE 옵션을 사용한다.

정렬

[] 연산자를 사용해 벡터 요소의 순서를 변경해 행이 출력되는 순서를 바꿀 수 있다.

order 함수는 입력받은 데이터를 정렬시켜 값이 아닌 위치 벡터를 반환한다.

order( x, decreasing, na.last)

x: 정렬할 벡터. 만약 정렬기준이 여러 개면 연속으로 입력

decreasing: TRUE면 내림차순, FALSE면 오름차순

na.last: 정렬 시 유효하지 않은 값 위치를 지정. TRUE면 맨 끝에, FALSE면 맨 앞에, NA면 정렬 시 NA값 제거

*sort 함수는 order 함수처럼 정렬된 순서를 나타내지만 위치벡터를 반환하는 order 함수와 달리 sort 함수는 벡터값 자체를 반환한다.

그룹 지어보기

aggregrate 함수: 특정 열을 기준으로 그룹을 지어 집계할 때 사용

aggregate( formula, data, FUN)

formula: 집계 기준을 표현한 식 집계할 열~집계 기준열

data: 집계할 데이터프레임

FUN: 집계할 함수

aggregate 함수의 입력항목 중 formula는 "~"를 기준으로 왼쪽은 집계할 열, 오른쪽은 집계 기준열을 나타낸다. 집계할 열이 여러 개면 cbind 함수로 연결하고 집계 기준열이 여러 개면 "+"기호로 연결한다.

cbind(집계할 열1, 집계할 열2, 집계할 열3) ~ 집계 기준열 + 집계 기준열2

만약 데이터프레임에서 집계 기준이 되는 열을 제외한 나머지 열 모두를 집계하는 것이면 해당 열들을 모두 나열하는 대신 "."기호로 대체할 수 있다.

. ~ 집계 기준열1 + 집계 기준열2

'작업일지2' 카테고리의 다른 글

데이터 프레임의 구조 변경 (0)	2019.09.06
데이터 변경 (0)	2019.09.04
데이터프레임, 데이터 접근 (0)	2019.08.25
벡터 간의 연산 (0)	2019.08.23
벡터 요소 수정/추가/삭제 (0)	2019.08.16

설정

,

검색결과 리스트

작업일지2에 해당되는 글 20건

글

'작업일지2' 카테고리의 다른 글

설정

트랙백

댓글

글

'작업일지2' 카테고리의 다른 글

설정

트랙백

댓글

글

'작업일지2' 카테고리의 다른 글

설정

트랙백

댓글

글

'작업일지2' 카테고리의 다른 글

설정

트랙백

댓글

글

'작업일지2' 카테고리의 다른 글

설정

트랙백

댓글

글

'작업일지2' 카테고리의 다른 글

설정

트랙백

댓글

글

'작업일지2' 카테고리의 다른 글

설정

트랙백

댓글

글

'작업일지2' 카테고리의 다른 글

설정

트랙백

댓글

글

'작업일지2' 카테고리의 다른 글

설정

트랙백

댓글

글

'작업일지2' 카테고리의 다른 글

설정

트랙백

댓글

사이드 메뉴

CATEGORY

TAG

RECENT POSTS

RECENT COMMENT

ARCHIVE

CALENDAR

NOTICE

MY LINK

COUNTER

티스토리툴바