Untitled
unknown
plain_text
2 years ago
1.1 kB
24
Indexable
import os
import pandas as pd
def extract_date(df):
date_row = df['Форма СЭТ-БТ'].str.contains('Дата торгов:', na=False)
date_string = df[date_row]['Форма СЭТ-БТ'].iloc[0]
date = date_string.split(': ')[1]
return date
file_paths = [
]
files = os.listdir('/content/')
for i in files:
if i.endswith(".xls"):
file_paths.append(i)
combined_dfs = []
for file in file_paths:
df = pd.read_excel(file, usecols='B:O', skiprows=7) # Выбор столбцов B-O и пропуск первых 7 строк
df = df[~df.apply(lambda x: x.astype(str).str.contains('ИТОГО')).any(axis=1)] # Удаление строк с "ИТОГО"
date = extract_date(pd.read_excel(file, nrows=10)) # Извлечение даты из каждого файла
df['Дата торгов'] = date # Добавление столбца с датой
combined_dfs.append(df)
final_combined_df = pd.concat(combined_dfs, ignore_index=True)
final_combined_df.to_excel("final_combined_data.xlsx", index=False)Editor is loading...
Leave a Comment