어제 들은 R 통계강좌가 유익해서 기록으로 남김.
로지스틱의 의미는 모른다고 할지라도 로지스틱 회귀 분석을 해야할 경우가 있다. 이변량 자료에 대한 로지스틱 회귀분석은 분류(classification) 문제이기 때문에 실제로 같은 취급을 받는다고 한다.
선형회귀분석은 lm() 함수를 이용하지만, 로지스틱 회귀분석은 glm()을 이용한다. 그 중에서 이변량 자료를 분석하기 위해서는 glm( , family = binomial) 을 이용하면 된다.
모델 최적화를 위해서는 step( ) 을 95% 신뢰 구간의 오즈를 구하기 위해서는 confint( )를, 오즈비를 구하기 위해서는 exp(confint( )) 을 이용한다.
나이가 1살 증가할 때마다 오즈가 변하는 것을 a라고 한다면, 10살 증가할 때의 오즈비는 exp(10*a)가 된다고 함.
나머지 변수를 모두 포함시키는 분석을 위해서는 glm ( ~. ) 이렇게 물결표시 다음에 ‘.’ 을 입력하면 된다.
분석 변수가 지나치게 많아서 오류가 난다면, glm( ,maxit = ) 에서 큰 숫자를 입력해준다.