기본 콘텐츠로 건너뛰기

라벨이 plotly인 게시물 표시

[2024-08-27] python 으로 excel(엑셀) 파일 다룰 때 주의점

[2024-08-27] python 으로 excel(엑셀) 파일 다룰 때 주의점 안녕하세요. 클스 입니다. 오늘은 python으로 엑셀 파일을 다룰 때 경험을 써보겠습니다. ----------- 환경 ------------ 인텔 맥 프로 2019 16인치, 메모리 32기가 ----------------------------- 약 70만건 대량의 데이터를 엑셀에서 불러옵니다. 약 10분이 걸립니다. 그래서 매번 불러서 분석하기에 시간이 너무 많이 들어서 불러들인 엑셀을 df.to_csv 해서 저장합니다. 그 다음 부터는 csv를 부르니 엄청 빠릅니다. 30초 ''' # pip install openpyxl xlsxwriter pandas numpy plotly nbformat poetry install or poetry add openpyxl xlsxwriter pandas numpy plotly nbformat ''' import os import pandas as pd import numpy as np import plotly.express as px version = 'v3' data_dir = os.path.expanduser( '~/data' ) installation_type_mapping_full = { "0001" : "ㅁㅁㅁ" , "0002" : "ㅁㅁㅁ1" , ... 보안상 생략 ....} # "송달구분" 코드에 따른 맵핑 딕셔너리 생성 delivery_type_mapping = { "0001" : "ㅁㅁㅁ" , "0002" : "ㅁㅁㅁ1" , ... 보안상 생략 .... } excel_source_file1 = f ' {data_dir} /7월_...