Blog

  • 생존기간

    생존기간

    여러 논문을 찾아본 결과, 2007년 Punt 의 논문이 대장암 연구에서 사용되는 각종 survival time 에 대한 정의를 내려놓은 것을 찾을 수 있었다. 이 방식을 다른 암종에도 적용할 수 있는 것은 아니겠지만, 참고할 수는 있으니 꼭 알아두어야 할 논문이라고 할 수 있을 듯 하다. 이 외에 유방암에 대하여 정의해둔 논문이 있기는 한데(J Clin Oncol. 2007;25(15):2127-32.), 이 논문은 내가 쓸 일은 없을 듯 하니 이 번에는 생략함.

    DFS의 경우 좀 유의할 만한 점은 다른 암이 생겼거나 다른 이유로 죽어도 모두 event 로 정의한 다는 것이다. 상당히 의외의 부분이었음. 생존 분석을 할 때에 굉장히 구체적으로 자료를 미리 정해두는 것의 필요성을 알게 해주었음.

    Reference: Punt CJ, Buyse M, Kohne CH, Hohenberger P, Labianca R, Schmoll HJ, et al. Endpoints in adjuvant treatment trials: a systematic review of the literature in colon cancer and proposed definitions for future trials. J Natl Cancer Inst. 2007;99(13):998-1003.

  • Survival plot

    Survival plot

    보통 이럴 때에는 후달린다는 표현을 쓰는데…

    결국엔 만들 수 있었다. 수 많은 옵션을 사용하면 되기는 되네. 😉

    스크립트는 나중에 수정한 것을 썼기 때문에, 사진 파일과 다르다. ㅋ

    cex.figure <- 1.7

    lwd.figure <- 6

    par(mai=c(1.5, 1.5, 0.5, 0.5), family=”Arial”)

    plot(survfit(figure.surv), col=c(“blue”, “red”),  ylim=y.lim, conf.int = FALSE, xlab=x.label, ylab=y.label, lty=1, lwd=lwd.figure, mark.time=TRUE, mgp=c(3.5, 1, 0), cex.lab=cex.figure, font.axis=1, font.lab=2, axes=F)

    axis(side=1, las=1, lwd=lwd.figure, cex.axis=cex.figure)

    axis(side=2, las=1, lwd=lwd.figure, cex.axis=cex.figure)

    text(10, 0.02, expression(italic(P), ”   = .042″), adj=c(0, 0), cex=cex.figure)

    legend(100, 0.2, c(“Retained”, “Loss or weak”), col=c(“blue”, “red”), lty=c(1, 1), xjust=1, yjust=1, bty=”n”, cex=cex.figure, lwd=c(rep(lwd.figure, 2)))

  • Arial 글꼴 설치

    윈도우 기반의 운영체제에서는 Arial 이 기본적으로 설치되어 있는 글꼴이다.

    하지만 Ubuntu 에서는 아니다.

    따라서 유분투에서는 Arial 을 별도로 설치해 주어야 한다.

    우선 Ubuntu 공식 홈페이지에서 언급한 다음의 msttcorefonts 패키지를 설치한다.

    https://help.ubuntu.com/community/RestrictedFormats/Microsoft_Fonts

    다음은 R 에서 다음의 “extrafont” 라이브러리를 설치한다.

    font_import() 를 실행하고

    font()를 통하여 확인한다.

  • R 사용 단상

    전공의 시절부터 통계에 R을 써보고자 노력하였으나

    미진한 노력으로 인하여.. 

    그저그런 상태로 유지하였다.

    요즘에 들어서야 R을 가지고 SPSS 정도로 쓸 수 있는 것 같은 

    근거 없는 자신감이 생기고 있다.

    Chi-squared 검정, Fisher 검정, KM 분석, Cox분석 정도라면

    약간의 노력으로 SPSS 정도만큼의 결과를 얻을 수 있다.

    근데 둘 다 써보면 알 수 있다. 왜 SPSS가 비싼지..

    정말 사용자가 편하게 할 수 있다. 

    KM 분석에서 strata를 적용시키는 것은 SPSS에서는 클릭 한 번이면 되지만

    R에서는 일일이 코드를 짜 넣어야 한다.

    몇 번 삽질하다 보면 일반화 시킬 수 있는 함수를 만들게 되고,

    그렇게 만들면 같은 등급으로 쉽기는 하다.

    문제라고 한다면..

    같은 분석 방식을 적용해도 p 값이 약간 다르게 나온다. 

    mean survival time (엄밀하게는 restricted mean survival time) 의 경우 차이가 발생한다. 10% 정도 범위에서.. 원인을 모르겠다. 

    근래에 발견한 최고의 장점은

    Survival plot 을 하나로 모아 그리기 쉽다. 이거 최고다.

    SPSS에서는 하나씩 맞춰서 합쳐야 하는데 이거 정말 힘들다.