Category: R

  • 내 맘대로 Chromosome 17

    내 맘대로 Chromosome 17

    R에서 그래프를 그리는 명령어에 여러 색상을 넣어야 하는 경우가 있다. 숫자가 적으면 상관없는데 숫자가 많아지면 겁나게 귀찮은 부분. R Reference card 를 참고한 결과 N개의 색상을 뽑아주는 간편한 명령어인 rainbow(N) 을 찾을 수 있었다.

    pie(rep(1,27),col=rainbow(27))

    요 명령어를 사용하면 다음과 같은 결과를 얻을 수 있다. 숫자로 표시된 부분이 해당되는 색을 나타낸다.

    이 색상표를 참고해서 다음과 같은 응용을 해보았다.

    Breast cancer 의 치료의 한 획을 그은 ERBB2 (CD340, HER-2, HER-2/neu, HER2, MLN 19, NEU, NGL, TKR1) 억제제인 Trastuzumab. 이를 치료에 사용하기 위해서는 HER2 amplification 이 있음을 FISH 를 통해서 입증하거나 면역화학검사(IHC)에서 3+ 가 해당이 되야 한다고 한다(후자의 경우는 보험 되는지 잘 모르겠음).

    (Wolff AC, Hammond ME, Schwartz JN, et al. American Society of Clinical Oncology/College of American Pathologists guideline recommendations for human epidermal growth factor receptor 2 testing in breast cancer. J Clin Oncol 2007;25:118-45.)

    HER2 FISH 를 보다보면 CEP17 이 증가한 경우를 볼 수 있으며, 경우에 따라서는 CEP17 과 HER2 의 Co-amplification 이 관찰되기도 한다. 이럴 경우 HER2/CEP17 비율이 2.2 미만으로 나올 수 있다.

    (Sauter G, Lee J, Bartlett JM, Slamon DJ, Press MF. Guidelines for human epidermal growth factor receptor 2 testing: biologic and methodologic considerations. J Clin Oncol 2009;27:1323-33.)

    Breast cancer 에서 CEP17 이 증가하는 것에 대하여 여러 사람들이 연구를 해 보았으나, Polysomy 17 이 매우 드문 현상이며, amplification 을 평가하기 위하여 CEP17 이외의 다른 17번 염색체에 존재하는 유전자를 reference 로 삼을 것을 이야기하고 있다.

    (Tse CH, Hwang HC, Goldstein LC, et al. Determining true HER2 gene status in breast cancers with polysomy by using alternative chromosome 17 reference genes: implications for anti-HER2 targeted therapy. J Clin Oncol 2011;29:4168-74.)

    HER2 와의 co-amplification 되는 경우도 있으며, anthracycline 에 대한 저항성과 관련이 있는 것으로 알려진, TOP2A 에 를 추가로 확인할 수 있도록 한 시제품들도 있다. 

    (Vysis TOP2A / HER-2 / CEP 17 FISH Probe Kit)

    지금은 Catalog 에서 안보이는데 17번 염색체의 다른 부위에 대한 probe 를 제공하는 제품도 있다.

    그래서 나도 한 번 확인해 보고자 시도해 보았다. FISH 와 비슷한 효과를 볼 수 있는 aCGH (array comparative genomic hybridization) 가 있으며, GEO 에서 찾아 보았을 때, GSE23720 에서 Agilent 제품으로 시행한 결과를  찾을 수 있었다. 이 자료에서는 197개의 aCGH 결과가 포함되어 있다.

    Series Matrix 파일을 다운 받은 다음 엑셀에서 불러와서 17번 염색체가 포함된 부분만을 별도의 파일로 저장한다. GSE23720이 포함된 논문에서는 1.5배 이상 변화가 있을 때 gain 이라고 정의하였으니깐 거기에 맞추어서 ERBB2 가 1.5 이상인 값을 찾아보면 27개가 나오며, 그것을 그려보면 다음과 같다. 빨간 화살표가 HER2 부위이다.

    다음은 CEP17 에 해당하는 부위. 2개의 증례는 FISH 를 하였을 경우 왠지 나올 것 같은 예감을 불러일으킨다.

    TOP2A 에 해당하는 곳을 확인해 봤더니 1례를 제외하고는 gain 이라 할 수가 없는 결과를 보여주는데, TOP2A를 추가로 확인할 수 있는 FISH 제품을 사용하면 왠지 더 도움이 될 것 같은 느낌을 준다고 할까. 이 probe 가 포함된 FISH 제품이 전공의 생활 끝나기 전에 안들어온 것이 다행이다. 🙂

  • Calibration

    Calibration

    지금 마지막 마무리 작업 중인 논문에 넣을지 말지 고민하고 있는 Figure 의 내용. 어떤 식으로 그래프를 그려야 좁은 범위에서 직관적이면서도 예쁘고, 그럴듯해 보일까 고민을 하다 Boxplot 을 선택했다. 원래 프로그램에서는 Local southern sizing algorithm 에 의한 것으로 추정은 되지만 확신할 수 없는 어떤 방식에 의하여 상단의 값을 구해주는데, 이 값들은 알 수 없는 이유로 인하여 점점 감소하는 경향을 보이고 있다.
    좁은(?) 범위에서 보이는 선형의 경향이라서 그냥 선형회귀분석을 사용하여 보정을 하기는 했는데, 뭘 해도 마음에 쏙들어 오지는 않는다.

    보정을 제대로 하기 위해선 바로 이 녀석을 회귀분석 해야한다. 대학교 때 선형회귀분석의 기초만 배웠는데 이런건 도대체 어떻게 해야하는지.. OTL

  • Barplot

    Barplot

    논문을 보면 이런 식으로 표현하는 figure 들이 있다. 우선 따라할 줄 알아야 독창적으로 만들 수도 있는법. 그래서 비슷하게 만들어 보았다.

    평균값이 양수일 때랑 음수일 때랑 따로 색을 지정하는 방법을 찾지 못하여, 양수 따로 음수 따로 그리는 방법을 선택하였다.
    가로값이 4200개 정도 되기 때문에 옵션중에서 border 와 space 는 FALSE 로 지정할 필요가 있다.
    0을 나타내는 선을 추가로 표현해야 한다.
    2번째 부터 같이 표현하기 위하여는 add 옵션을 사용한다.

    barplot(dataaver[,8], col=”red”, border=F, space=F, ylab=”Ratio”, ylim=c(-1,1))
    barplot(dataaver[,9], col=”blue”, add=T, border=F, space=F)
    abline(h=0)

  • 3 개를 1개로..

    3 개를 1개로..

    3개의 검체를 대상으로 aCGH 검사를 하였는데, 어떤 값은 다른 값에 없는 경우가 있어서 하나의 테이블로 합치는 것이 어려웠다. 약간의 고민끝에 매우 간단한 방법으로 해결하는데 성공. 🙂