Untitled

 avatar
unknown
plain_text
2 years ago
1.1 kB
5
Indexable
import os
import pandas as pd

def extract_date(df):
    date_row = df['Форма СЭТ-БТ'].str.contains('Дата торгов:', na=False)
    date_string = df[date_row]['Форма СЭТ-БТ'].iloc[0]
    date = date_string.split(': ')[1]
    return date

file_paths = [
]

files = os.listdir('/content/')

for i in files:
    if i.endswith(".xls"):
        file_paths.append(i)

combined_dfs = []


for file in file_paths:
    df = pd.read_excel(file, usecols='B:O', skiprows=7)  # Выбор столбцов B-O и пропуск первых 7 строк
    df = df[~df.apply(lambda x: x.astype(str).str.contains('ИТОГО')).any(axis=1)]  # Удаление строк с "ИТОГО"
    date = extract_date(pd.read_excel(file, nrows=10))  # Извлечение даты из каждого файла
    df['Дата торгов'] = date  # Добавление столбца с датой
    combined_dfs.append(df)


final_combined_df = pd.concat(combined_dfs, ignore_index=True)
final_combined_df.to_excel("final_combined_data.xlsx", index=False)
Editor is loading...
Leave a Comment