Tag: Boxplot

  • boxplot의 whisker 구하기

    gross 항목의 whisker를 구해보도록 하자. boxplot의 위쪽 whisker는 (Q3-Q1) * 1.5 를 넘어서는 값으로 알려져 있다.

    boxplot.stats() 을 이용하면 구할 수 있다. dataframe이나 list 형식의 자료는 처리할 수 없다. pull()을 이용해서 자료를 추출한다.

    > boxplot.stats(dt %>% filter(Refri == 'gross') %>% pull(Temp))
    $stats
    [1] 5.7 6.2 6.4 6.7 7.4
    
    $n
    [1] 1647
    
    $conf
    [1] 6.380534 6.419466
    
    $out
     [1] 8.9 8.9 8.4 8.4 8.2 7.8 7.6 7.6 7.6 7.6 7.7 7.8 7.8 7.8 8.1 7.8 7.7 7.8 7.8 8.1 7.6 7.8 7.7 7.6 7.9 7.8 7.8 7.7 7.6 7.9 8.1 8.3 7.8 8.2 7.6 7.8 7.7 7.9 7.5 7.7 7.8 7.7 7.6 7.8 7.8
    [46] 8.1 8.2 7.6 7.8 7.6 7.6 8.9 8.2 8.3 7.6 7.9 7.6

    그러면 $out 항목에서 whisker 값을 알 수 있다.

    사용할 때 주의할 점. 이렇게 구한 것은 coef = 1.5가 기본값이다. 통계의 주요 5값을 구하려면 coef = 0을 지정해야 한다.

  • Calibration

    Calibration

    지금 마지막 마무리 작업 중인 논문에 넣을지 말지 고민하고 있는 Figure 의 내용. 어떤 식으로 그래프를 그려야 좁은 범위에서 직관적이면서도 예쁘고, 그럴듯해 보일까 고민을 하다 Boxplot 을 선택했다. 원래 프로그램에서는 Local southern sizing algorithm 에 의한 것으로 추정은 되지만 확신할 수 없는 어떤 방식에 의하여 상단의 값을 구해주는데, 이 값들은 알 수 없는 이유로 인하여 점점 감소하는 경향을 보이고 있다.
    좁은(?) 범위에서 보이는 선형의 경향이라서 그냥 선형회귀분석을 사용하여 보정을 하기는 했는데, 뭘 해도 마음에 쏙들어 오지는 않는다.

    보정을 제대로 하기 위해선 바로 이 녀석을 회귀분석 해야한다. 대학교 때 선형회귀분석의 기초만 배웠는데 이런건 도대체 어떻게 해야하는지.. OTL

  • Boxplots

      얼핏보면 의학을 하는 사람에게 익숙한 그래프가 Boxplots인데은 우선 자료를 쉽게 알아볼 수 있도록 할 수 있다. 기본적으로 5개의 값을 나타내는데 최소값, 최대값과 함께 25, 50, 75 percentile에 해당하는 값을 보여준다. 그리고 75 percentile값과 25 percentile 값의 차이를 Interquartile range(IQR) 이라고 한다. 이 IQR의 값의1.5배 이하인 곳에 최소값이나 최대값이 있다면 그 값까지 점선이 그어지게 되고(mild outliers) 1.5배를 넘어서는 값이 있다면 1.5배에 해당하는 곳까지만 점선이 그어지게 되고 그 값을 넘어서는 값들은(extreme outliers) 점으로 표시가 되게 된다고 한다.
      말이야 간단한 것 같지만 사실 이 것을 어떤 식으로 활용할 수 있을지에 대해서는 잘 모르겠다. 통계학 책이라도 구해봐야하는지…

  • Boxplot

    Boxplot

    사용자 삽입 이미지Case report 준비하면서 통계 프로그램인 R을 사용하여 Boxplot 을 만들어 보았다. 그래프상 이 자료는 전혀 도움이 안될 것 같다. 미묘하게 측정값이 커졌다는 것을 알지만 충분히 오래동안(??) 살지 못한 상태에서 보상작용이 충분하게 일어나지 않아서 그런지는 몰라도 좀 크기가 작은 것 같다.
      숫자뿐에 지나지 않은 자료를 간단한 명령어를 많으로도 Boxplot이 만들어지는 것을 보니깐 세상 참 좋아졌다.
    Welch Two Sample t-test 라는 것도 있던데.. 역시 통계는 무슨 말인지를 알 수가 없다. 이해 불가능한 영역에 속하는 학문인것 같다.