Category: R

  • RStudio session

    RStudio session

    RStudio 는 기본적으로 2시간을 사용하지 않으면 session 을 닫아버린다. 평소에는 문제가 없지만, 메모리에 많은 자료가 있을 경우에는 다시 로딩하는 시간이 꽤 아깝다. 이럴 경우에는 session 종료 시간을 0으로 하여 사용하지 않도록 설정하면 된다.

    메모리가 약간 여유가 있고, 다루고 있는 파일이 메모리에서 차지하는 비중이 크지 않을 경우에 아주 편하다. 나의 경우는 동시에 여러 통계 분석을 하는 경우 여러 계정에서 동시에 진행한다. 그럴 경우 계정 전환시에도 마지막 작업 환경을 그대로 보존할 수 있기 때문에 편함.

  • 벤다이어그램 Venn diagram

    벤다이어그램 Venn diagram

    공통 항목을 포함하고 있는 서로 다른 그룹의 상태를 보기에 유용한 벤다이어그램. 인터넷 검색을 해 본 결과 여러 패키지가 있는 것을 확인할 수 있었다. 나는 예쁜게 필요한 것이 아니라, 공통으로 포함되는 것이 얼마나 있는지 확인하는 것이 주목적이어서 가장 편할 것으로 보이는 방법으로 선택하였다. gplots 패키지에 포함된 venn() 명령어를 사용하였다. 

  • RStudio 다중 사용자

    RStudio 다중 사용자

    RStudio server 버젼의 장점은 분명히 여러 사용자들이 사용할 수 있다는 것이다. 이름부터 server 라는게 들어가 있다. 그런데 그동안 설정을 잘못해서인지 여러번 시도해 보았으나 동시에 한 컴퓨터에서 혹은 여러 컴퓨터에서 접속을 하면 한 번에 하나만 유지되는 문제가 생겼다.

    그냥 프로젝트를 바꿔가면서 계속 사용하였으나 더 이상은 불편함을 감수하기가 힘들어서 동시에 접속을 가능하도록 하기로 하였다. 여러번 시도해 보았으나 잘 안되었는데, 최근에 그 문제를 찾아서 해결할 수 있었다.

    원인은 두 가지였다. 첫 번째 원인은 /etc/rstudio/rserver.conf 파일에서 특정 사용자 그룹을 지정한 것이다. 그냥 지워버렸다. ‘#’ 를 붙여서 주석처리를 해도 되지만, 그냥 지워버렸다.

    두 번째 원인은 계정을 추가할 때에 adduser 명령어를 사용하지 않고, useradd 를 사용한 것이다.

    그 다음 여러번 확인을 해 보았는데, 하나의 웹 브라우져로는 하나의 계정만을 유지할 수 있었다. 크롬이나 파이어 폭스 모두에서 나타난 현상으로 다른 계정으로 접속을 해도 결국엔 하나의 세션만 유지된다. 해결하는 방법은 2개의 계정을 사용할 일이 생기면 2개의 브라우져를 사용하는 것. 3개를 사용해야 하는 일이 생기면 다른 브라우져를 사용해 볼 예정이다.

  • CoxPH 와 model selection

    CoxPH 와 model selection

    없을리가 없다고 생각했지만 그 동안 R에서 못썼던 기능 중 하나는 Cox PH 분석에서 forward 혹은 backward 방식의 model selection 이다. 너무 쉽게 찾아낸 방법은 step() 함수이다.

    step() 괄호 안에 coxph 명령어를 넣고 실행하면 SPSS 랑 똑같이 나온다. 다만, forward 순서는 조금 다르게 나오는 듯함. 내가 잘못 사용하고 있는지도 모르겠다.

    SPSS 에서는 결측값이 있는 항목이 들어갈 경우 자동으로 그 부분을 인식하지만, R에서는 에러가 나기 때문에 결측값이 없는 자료만을 입력해야 한다.

    trace=0 을 사용하면 최종 결과만을 확인할 수 있다.