excel_data_combiner

объединяет несколько xlsx в один
 avatar
user_2065311
python
a month ago
2.0 kB
1
Indexable
Never
'''
Название файла скрипта: "excel_data_combiner.py"

Описание:
Данный скрипт предназначен для объединения данных из нескольких файлов Excel, находящихся в указанной директории. Скрипт автоматически определяет строки с заголовками столбцов, удаляет их из данных и объединяет оставшиеся данные в один файл Excel. Просто укажите путь к папке с файлами, и скрипт самостоятельно проведет процесс объединения, создавая новый файл "combined_data.xlsx".
'''

import pandas as pd
from glob import glob

# Путь к папке с файлами Excel
folder_path = r'/Volumes/PCFKO/o_synk/comb'

# Получаем список всех файлов Excel в папке
excel_files = glob(f"{folder_path}/*.xlsx")

# Инициализируем пустой DataFrame для хранения объединенных данных
combined_df = pd.DataFrame()

for file in excel_files:
    # Читаем данные из файла Excel
    df = pd.read_excel(file, header=None)
    
    # Находим строку с заголовками столбцов
    header_row = df.iloc[:5].apply(pd.Series.nunique, axis=1).values.argmax()
    headers = df.iloc[header_row]
    
    # Удаляем строку с заголовками из данных
    df = df.drop(index=header_row)
    
    # Назначаем заголовки столбцам
    df.columns = headers
    
    # Объединяем с основным DataFrame
    combined_df = pd.concat([combined_df, df], ignore_index=True)

# Сохраняем объединенные данные в новый файл Excel
combined_df.to_excel('combined_data.xlsx', index=False)
Leave a Comment