Category: R

  • amino acid sequence

    a = “ATGAATAAGGGCTG…GCGCCAGTGA”
    b = strsplit(a, “\n”)
    for (X in 1:length(b[[1]])){
    if (X == 1) X1 = b[[1]][X]
    if (X >= 2) X1 = paste(X1, b[[1]][X], sep=””)
    }
    substr(X1, 1770, 1780)

    CCDS 에서 찾고자 하는 유전자의 coding sequence 를 확보한 후에, 특정 위치의 아미노산이 어디쯤 있는지 찾아보는 편한 방법을 생각해 보았다.

  • CRAN Mirror

    새로 이직하는 곳은 인터넷 보안이 꽤 빡빡하다. 교육 때 리눅스 컴퓨터 사용에 대한  문의를 하였다.

    1. 공개된 wifi를 사용하는 방법
    2. USB 포트 물리적 봉인 + 내부망만 사용

    이런 2가지 옵션이 있었고, 2번의 방법을 사용하기로 하였다. linux 에 추가 네트웍 카드 설치에 대한 제한점은 없는 것으로 판단하였다. 그래서 별도의 mirror 서버를 구축하여 일정 주기로 업데이트 하는 방법을 선택하는 것이 좋을 것 같았다. 구글링과 [1] CRAN 공식 홈페이지 [2] 를 통하여 미러 서버를 구축중에 있다.

     

     

    http://freesearch.pe.kr/archives/3913

    1.
    . [Internet]. . Available from: http://freesearch.pe.kr/archives/3913
    2.
    . [Internet]. . Available from: https://cran.r-project.org/
  • 2017/01/04

    자료 재검토를 위하여 3년전에 작성한 R 스크립트를 확인하고, R 스트립트가 없는 부분은 다시 그 과정을 복원 중에 있다. 이 과정에서 다시금 깨닫고 있는 중요한 내용.

    일단 항상 자료는 백업해 놓아야 한다. 이메일 같은 경우는 요즘엔 GB 단위의 저장 용량을 제공하고 있다. 굳이 지우지 말아야 할 내용이 아닌 이상 남겨두는 것이 좋다. 다만, 대용량 첨부 파일로 인한 용량 낭비에 대해서는 상황에 따른 고려가 필요하다.

    R 스크립트는 최대한 이해하기 쉽도록 작성한다. 직관적으로 구성된 것이 아니면, 나중에 이해하는데 많은 시간이 소요된다. 발표 자료를 만들 경우에는 비상시를 대비하여 분석 스크립트 부분도 포함시켜서 화면 저장을 한다.

  • R에서 cpu 사용량 확인하기

    혹시나 쓸 일이 있을까 싶어서 R에서 cpu 사용량을 확인할 수 있는 방법을 찾아보았다. 우선 ubuntu 상에서 cpu 사용량을 확인하는 방법을 찾아 보았다. 몇몇이 있었는데, 그 중에서 쓸만한 것은 mpstat (sysstat 에 포함) 과 uptime 을 이용한 방법이다. 난 R에서 불러올 것이니까 정규식 표현을 이해할 필요는 없었고, 다음과 같은 방법으로 해당 값을 불러올 수 있을 것 같다.

    system(“mpstat”)
    tmp = system(“mpstat”, intern = TRUE)
    tmp1 = tmp[length(tmp)]
    tmp2 = strsplit(tmp1, ” “)[[1]]
    as.numeric(tmp2[length(tmp2)])

    tmp1 = system(“uptime”, intern=TRUE)
    tmp2 = strsplit(tmp1, ” “, fixed=T)[[1]]
    tmp3 = tmp2[length(tmp2) – 2]
    as.numeric(strsplit(tmp3, “,”)[[1]])