YOLOv5는 모델의 크기에 따라서 s, m, l, x 4가지가 있다. 큰 모델을 이용할 수록 검출을 잘 하는 것으로 알려져 있으나, 반대 급부로 학습에 더 많은 시간이 소요되고, 속도가 느리다고 한다. 속도가 중요한 문제가 되는 이유는 실시간 검출을 하는 경우가 많기 때문이다. 초당 많은 이미지를 평가할 수 있을 수록 실전에서는 유용해지기 때문이다. 운전을 예로 들면 초당 1회 검출하는 것보다는 10번이, 10번 보다는 30번이 훨씬 더 안전하게 운전이 가능할 것으로 예상되는 것과 같다.
어제 처음 학습을 시킬 때에는 s를 이용했는데, 오늘 시간이 조금 남아서 일단 x로 다시 학습을 시키도록 하고 집으로 왔다. 배치 크기를 거의 10% 수준으로 낮춰야 하는 문제가 있기는 하지만, 실제로 현저한 분석 시간의 저하는 없는 것 같다.