Untitled
unknown
plain_text
2 years ago
1.1 kB
5
Indexable
import os import pandas as pd def extract_date(df): date_row = df['Форма СЭТ-БТ'].str.contains('Дата торгов:', na=False) date_string = df[date_row]['Форма СЭТ-БТ'].iloc[0] date = date_string.split(': ')[1] return date file_paths = [ ] files = os.listdir('/content/') for i in files: if i.endswith(".xls"): file_paths.append(i) combined_dfs = [] for file in file_paths: df = pd.read_excel(file, usecols='B:O', skiprows=7) # Выбор столбцов B-O и пропуск первых 7 строк df = df[~df.apply(lambda x: x.astype(str).str.contains('ИТОГО')).any(axis=1)] # Удаление строк с "ИТОГО" date = extract_date(pd.read_excel(file, nrows=10)) # Извлечение даты из каждого файла df['Дата торгов'] = date # Добавление столбца с датой combined_dfs.append(df) final_combined_df = pd.concat(combined_dfs, ignore_index=True) final_combined_df.to_excel("final_combined_data.xlsx", index=False)
Editor is loading...
Leave a Comment