자료의 용량이 작으면 검색 하는데 짧은 시간이 소요되고, 용량이 크면 많은 시간이 소요된다. 이는 R이나 DB에서나 마찬가지이다.
왜 이런 당연한 내용부터 언급을 하는가 하면 현재 CDM에 아주 많은 자료가 들어가 있지는 않은데도 불구하고 수십GB 정도 된다. 고성능 컴퓨터를 이용하지 않는 이상 분석을 위하여 많은 연산을 해야 한다고 하면 검색 가능한 자료의 크기를 줄여야 시간을 줄일 수 있다. 몇 시간 동안 기다린 결과가 오류 메세지라면 누구나 빡칠 상황일 것이다.
해결하는 방법은 목적에 맞는 작은 테이블을 생성하여 이를 이용하는 것이다. 누구나 알고 있는 방법이지만, 이것을 무시하면 상당한 시간과 노력만 낭비하게 된다.