Blog

  • Ganglion cells

    Ganglion cells


    대장에서 얼마나 많은 ganglion cell 이 보여야 정상범위에 속하는지 널리 받아들여지는 기준은 없다. 대략 1cm 에 100개 정도로 준비하고 있음.

    Reference; Swaminathan M et al. Counting myenteric ganglion cells in histologic sections: an empirical approach. Hum Pathol 2010; 41(8): 1097-1108. (PMID: 20346481)

  • Quantile Normalization

    #Quantile Normalization
    quan_order <- matrix(nrow=nrow(Z), ncol=ncol(Z))
    for (X in 1:ncol(Z)){quan_order[,X] <- order(Z[,X], decreasing=FALSE)}
    : 원래의 값이 몇 번째에 해당하는 값인지 미리 기록하고..

    quan_sort <- matrix(nrow=nrow(Z), ncol=ncol(Z))
    for (X in 1:ncol(Z)){quan_sort[,X] <- sort(Z[,X], decreasing=FALSE)}
    : 자료를 오름차순으로 정렬한 다음..

    quan_sort_mean <- matrix(nrow=nrow(Z), ncol=1)
    for (X in 1:nrow(Z)){quan_sort_mean[X,1] <- mean(quan_sort[X,])}
    : 평균값을 구하고..

    QN_Z <- matrix(nrow=nrow(Z), ncol=ncol(Z))
    for (I in 1:nrow(Z)){for (J in 1:ncol(Z)){QN_Z[quan_order[I,J],J] <- quan_sort_mean[I,1]}}
    : 원래의 위치에 해당되는 값을 다시 입력하기..

    Quantile normalization 은 microarray analysis 에 필요한 과정인 것 같기는 한데 사실 아직도 개념이 이해가 되지 않는다. 이런 저런 자료를 찾아본 후에 이런식으로 구현하면 될 것 같아서 시도해 보았다.

    Bioinformatics 의 기본에 대한 것을 배울 수 있으면 언제 청강이나 도강이라도 해봐야 겠다. ㅡㅡ

  • R (64bit) on Ubuntu 10.10

    R (64bit) on Ubuntu 10.10

    Ubuntu 에 내장되어 있던 R을 업그레이드 하는 방법을 찾는다고 시간이 걸리기는 했지만 최신 버젼의 R로 설치하는데 성공했다. 이제는 한 번 대용량의 메모리를 필요로 하는 계산을 해볼까나.. 🙂

    Vista 64bit 버젼으로 설치를 하는 것도 나쁘지는 않았겠지만, 그래도 이런 Terminal 입력창을 가지고 있는 프로그램은 그에 걸맞는 대우를 해줘야..

  • read.table 사용시 주의사항

    사실 엄청난 삽질을 통해서 알아낸 것이기는 한데 X축에 자료의 평가 항목, Y 축에 증례를 기록하는 일반적인 방식으로 자료를 기록한 경우 R에서 자료를 편하게 불러오는 방법을 확인했다. ㅡ_ㅡ;;

    read.table(“~~.csv”, header = TRUE, sep = “,”, row.names=1)

    row.names 항목을 사용하면 이 부분이 Y 축의 값으로 빠져 나오게 되는데 이러면, 보통 이 값은 통계 분석이 불가능한 문자열의 나열이다. 이 부분을 제외한 나머지 값은 거의 대부분 통계적으로 처리할 수 있는 항목이어서, 자료를 편리하게 다룰 수가 있다. 특히 내가 삽질한 clustering에서 말이다. ㅡㅡ;;

    주의사항으로는 당연한 것이지만, row.names 에 해당할 값에서는 중복된 값이 있어서는 안된다. Microarray 를 사용한 gene expression 자료의 경우 하나의 유전자에 대한 여러 값이 있을 수가 있고, 이럴 때 row.names 에 대항하는 항목을 유전자 이름이나, 염색체 내부의 위치 등으로 해버리면 중복된 값이 있어서 오류가 난다. 중복되는 값을 해결해야 추가 분석이 가능함.