Py извлечение кад_вых №

извлечение кадастровых номеров из excel файла
 avatar
user_2065311
python
16 days ago
1.6 kB
0
Indexable
Never
import pandas as pd
import re

# Путь к файлу !!!!!
file_path = '/Users/XXXXX/XXXXXXX/≈XX/XXXXXXXXXXXXXXX.xlsx'

# Загрузка файла Excel
df = pd.read_excel(file_path)

# Вывод названий столбцов
print("Названия столбцов:", df.columns)

# Регулярное выражение для поиска кадастровых номеров
cadastre_pattern = re.compile(r'\d{2}:\d{2}:\d+:\d+')

# Функция для извлечения кадастровых номеров из текста
def extract_cadastre_numbers(text):
    return cadastre_pattern.findall(text) if isinstance(text, str) else []

# Извлечение кадастровых номеров из столбца например 'Описание'!!!!!!!
df['Cadastre Numbers'] = df['Описание'].apply(extract_cadastre_numbers)

# Преобразование списка кадастровых номеров в отдельные столбцы
cadastre_df = df['Cadastre Numbers'].apply(pd.Series)

# Переименование столбцов
cadastre_df.columns = [f'Cadastre {i+1}' for i in range(cadastre_df.shape[1])]

# Объединение исходного DataFrame с новым DataFrame, содержащим кадастровые номера
result_df = pd.concat([df.drop(columns=['Cadastre Numbers']), cadastre_df], axis=1)

# Сохранение результата в новый Excel файл
output_path = '/Users/wl/Downloads/≈ chrm/output_with_cadastre_numbers.xlsx'
result_df.to_excel(output_path, index=False)

print(f"Processed data has been saved to '{output_path}'")
Leave a Comment