Blog

  • Array data 살펴 보기 – Simple

    for (X in 1:5467) {
    x <- c(data[X,2],data[X,3],data[X,4],data[X,5], data[X,6],data[X,7],data[X,8],data[X,9])
    y <- c(data[X,10],data[X,11])                       
    if (t.test(x,y)$p.value < 10e-07) print(data[X,])
    }


      예전에 사놓고 존재를 망각해버린 책을 뒤져 보다가 if 문은 저렇게 쓴다는 것을 알았다. ㅡㅡ;;

    2010/05/26 – [공부해 봅시다/R-Project] – Array data 살펴 보기 – 삽질편

  • Array data 살펴 보기 – 삽질편

    Array data 살펴 보기 – 삽질편

      Array 값을 살펴 보다가 의미 있는 차이를 보이는 그룹을 찾는 것도 좋을 것 같아서 방법을 시도해 보았다. 문법을
    잘 몰라 한참을 삽질하다가 우여곡절 끝에 대충대충 해결할 수 있었다.


    data <- read.table(“Book1-1-3.csv”, header=T, sep=”,”)

    a <- matrix(nrow=5467, ncol=2)

    for (X in 1:5467) {
    x <- c(data[X,2],data[X,3],data[X,4],data[X,5], data[X,6],data[X,7],data[X,8],data[X,9])
    y <- c(data[X,10],data[X,11])                       
    a[X,1] <- X
    a[X,2] <- t.test(x,y)$p.value
    }

    z <- which(a[,2] < 5e-02)
    a[z,]


      삽질을 시작하기 전에 우선 5467×2 의 크기를 같은 a 라는 matrix 를 만들어 둔다.
    a <- matrix(nrow=5467, ncol=2)

      첫 row 와 column 에는 문자값이 있기 때문에 그것을 제외하면 5467×10 의 값을 가지게 된다. 우선 1~8 column 의 값과 9, 10 column 의 값이 서로 유의한 차이가 있는지 알아보고 싶었다. 그리고 이렇게 구한 t-test 를 5467 번 반복해야 하는 문제도 있었다.
     
      우선 X 를 1 부터 5467 까지 순환하도록 했다.
    for (X in 1:5467) { — }

      그러한 X 값에 따라서 1~8 column 에 포함된 값을 x 라는 항목에 입력을 하고 9, 10 column 값을 y 라는 항목에 입력했다.
    x <- c(data[X,2],data[X,3],data[X,4],data[X,5], data[X,6],data[X,7],data[X,8],data[X,9])
    y <- c(data[X,10],data[X,11])        

      이러한 x 와 y 를 t-test 를 시행하였을 때의 p.value 만을 알고 싶었고, 이 값과 이 것이 몇 번째 X 값인지를 알아야 할 필요가 있었다.
    a[X,1] <- X
    a[X,2] <- t.test(x,y)$p.value

      여기까지 한 번에 구해지기 때문에 나중에 a 라고 입력된 값을 보면 다음과 같다.

      이 a 라는 matrix 에서 2 column 에 포함된 값중 p-value 가 0.05 이하인 값을 찾고 싶었기 때문에 다음과 같이 했다. which 를 사용해서 구하기는 하는데 매번 row 값을 출력하는 문제(??)가 있엇다.
    z <- which(a[,2] < 5e-02)

      그래서 그냥 이 문제를 안고 살기로 했다. p.value가 0.05 이하인 값을 가지는 row 가 z 로 지정하도록 하고 이 것을 그냥 사용하는게 내가 알고 있는 지식으로는 최고의 결론이었다. ㅡㅡ;;
    a[z,]

      유의 수준을 10e-07 까지 올리면 다음과 같이 나온다.

  • Green-Black-Red heatmap

    Green-Black-Red heatmap

      Heatmap 은 역시 녹색, 검정, 빨강으로 표시가 되어야 제맛이다. 🙂
      R-Project에서 제공하는 Heatmap 으로는 안되고 별도의 패키지를 설치하여야 하며, 이 경우에는 gplots 패키지를 설치해야 한다. 그러면 heatmap.2 라는 명령어를 사용할 수 있으며, 이 명령어를 통해서 쉽게 만들 수 있다.

    library(gplots)
    heatmap.2(abc, col=redgreen(75), trace=”none”, density.info=”none”, hclustfun=my.hclust, distfun=my.dist)

    아직 trace, density.info 에 대한 것은 확인하지 못했다. 없어도 늘 보는 것들과 차이가 없다는 점에서 필요 없을 것 같기는 하다. 🙂

  • IgA nephropathy

     IgA nephropathy is a glomerular disease in which glomerular
    immunohistologic staining for IgA is more intense or equally intense as
    staining for IgG and IgM.

      IgA 신증은 꽤 흔하게 볼 수 있는 질환이기 때문에 정의를 꼭 알아야 하는 질환이다. 딸랑 저 한줄 뿐만이 아니라 다른 배제 기준이 있기는 하지만 기본이 가장 중요하고 길면 잘 안외워지니깐.. 🙂

    Reference:
    AFIP(Armed Forces Institute of Pathology) 에서 출간된 Non-Neoplastic Kidney Diseases