excel_data_combiner
объединяет несколько xlsx в одинuser_2065311
python
a year ago
2.0 kB
5
Indexable
''' Название файла скрипта: "excel_data_combiner.py" Описание: Данный скрипт предназначен для объединения данных из нескольких файлов Excel, находящихся в указанной директории. Скрипт автоматически определяет строки с заголовками столбцов, удаляет их из данных и объединяет оставшиеся данные в один файл Excel. Просто укажите путь к папке с файлами, и скрипт самостоятельно проведет процесс объединения, создавая новый файл "combined_data.xlsx". ''' import pandas as pd from glob import glob # Путь к папке с файлами Excel folder_path = r'/Volumes/PCFKO/o_synk/comb' # Получаем список всех файлов Excel в папке excel_files = glob(f"{folder_path}/*.xlsx") # Инициализируем пустой DataFrame для хранения объединенных данных combined_df = pd.DataFrame() for file in excel_files: # Читаем данные из файла Excel df = pd.read_excel(file, header=None) # Находим строку с заголовками столбцов header_row = df.iloc[:5].apply(pd.Series.nunique, axis=1).values.argmax() headers = df.iloc[header_row] # Удаляем строку с заголовками из данных df = df.drop(index=header_row) # Назначаем заголовки столбцам df.columns = headers # Объединяем с основным DataFrame combined_df = pd.concat([combined_df, df], ignore_index=True) # Сохраняем объединенные данные в новый файл Excel combined_df.to_excel('combined_data.xlsx', index=False)
Editor is loading...
Leave a Comment