리스트에서 분할하여 중복 제거하기

R에서는 조금 쉽게 할 수 있는데, Python에서는 조금 더 복잡하게 해야 한다. 텍스트 리스트에서 일괄적으로 분할하는 split을 이용할 수가 없었기 때문에 하나씩 split으로 분할한 후에 리스트를 새로 만들고, 중복을 제거시키도록 한다.

ii = []

ii 라는 빈 리스트를 만든다.

for i in file_A:
    ii.append(i.split('_')[0])

그 다음 file_A로 만들어둔 파일 목록을 불러온다. 증례 번호가 가장 앞에 있고, 그 다음에는 언더바가 있는 구조였기 때문에 ‘_’로 분할한 첫 번째 것을 선택하여 ii에 계속 입력한다.

ii = list(set(ii))

set()을 이용하면 중복을 제거할 수 있고, 이 것을 다시 리스트로 만들어야 한다.