이건 정말 수 많은 방법이 있을 것이다. CLI로 작업하기 위해서 내가 알고 있는 소소한 것들을 조합하였다.
우선 데이터 첫 전처리 과정으로 한 번만 변환하면 된다. 파일 이름이 다양할 것이니까 이를 고려한다.
다음과 같은 Python 파일을 만든다. ‘python convert.py 파일이름’ 이런 식으로 명령어를 넣으면 CSV 파일로 변환하는 간단한 코드이다. Pandas를 이용하면 편하게 된다고 한다.
import pandas
import sys
input_name=sys.argv[1]
output_name=input_name.split('.xlsx')[0]+'.csv'
xlsx = pandas.read_excel(input_name)
xlsx.to_csv(output_name)
다음은 모든 XLSX 파일에 대하여 이 코드를 실행하여 주면 된다. 쉘스크립트를 이용하였다.
xlsx_lists=`ls -R *.xlsx`
for xlsx_file in $xlsx_lists; do
echo $xlsx_file
python convert.py $xlsx_file
done