오늘 처음 알게 되었는데, 먼가 편한 기분이다. 앞으로 응용할 수 있는 방법이 있는지 알아봐야겠다.
Category: R
-
R에서 matrix나 data.frame을 화면으로 출력할 경우 일정 범위 이후부터는 출력이 되지 않는다. 이렇게 삭제되는 부분을 확인해야 할 경우가 있다면, options() 명령어를 이용하면 된다. 기본적으로 99999 기본값이라고 하는데, 정확한 사용법은 모르지만 한 번 입력해두면 그 효과가 지속되는 것 같다.
options(max.print=99999)
-
try()
R에서 for 등의 방법으로 반복적으로 함수를 실행하는 경우 오류가 나는 경우가 있게 된다. 이런 오류는 사전에 예측이 되는 경우도 있지만, 예측할 수 없는 경우도 있다. 오류가 있더라도 전체 자료 분석을 위하여 계속 분석 알고리즘을 실행하여야 하는 경우 발생 가능한 부분이 있는 곳을 try() 함수로 넣어준다. 결과 생성물을 이용하여 추가 분석을 하는 방식이라면 오류가 발생했는지 여부를 한 번 더 확인해주는 과정을 거치면 됨.
-
기본적으로 다음의 웹페이지에서 내용을 참고했다.
https://blog.pabii.co/wordcloud-r/
library(tm) library(SnowballC) library(wordcloud) library(RColorBrewer) A = read.csv("~/R/1.csv", stringsAsFactors = F) A = Corpus(VectorSource(A)) B = tm_map(A, PlainTextDocument) B = tm_map(B, content_transformer(tolower)) B = tm_map(B, removePunctuation) B = tm_map(B, removeWords, stopwords('english')) B = tm_map(B, removeNumbers) excludes = c("with", "for", "were", "and", "was", "may", "performed", "high", "this", "the", "using", "cases", "can", "showed", "methods", "The", "results", "case", "similar", "revealed") B = tm_map(B, removeWords, excludes) # B = tm_map(B, stemDocument) wordcloud(B, random.order = F, colors = brewer.pal(8, "Dark2"), rot.per = 0.1, max.words = 100)
Stemming 과정에서 단어가 짤리는게 꽤 나온다.