Untitled
# import os # import PyPDF2 # def extrair_texto_entre_palavras_chave(caminho_pdf, palavra_chave1, palavra_chave2): # try: # with open(caminho_pdf, 'rb') as arquivo: # leitor = PyPDF2.PdfReader(arquivo) # for pagina in leitor.pages: # texto = pagina.extract_text() # if texto: # indice1 = texto.find(palavra_chave1) # indice2 = texto.find(palavra_chave2) # if indice1 != -1 and indice2 != -1 and indice2 > indice1: # texto_entre_palavras_chave = texto[indice1 + len(palavra_chave1):indice2] # return texto_entre_palavras_chave.strip() # return None # except Exception as e: # print(f"Erro ao processar arquivo {caminho_pdf}: {e}") # return None # def renomear_arquivos_pdf(diretorio, palavra_chave1, palavra_chave2): # for arquivo in os.listdir(diretorio): # if arquivo.lower().endswith('.pdf'): # caminho_completo = os.path.join(diretorio, arquivo) # nome_extraido = extrair_texto_entre_palavras_chave(caminho_completo, palavra_chave1, palavra_chave2) # if nome_extraido: # novo_nome = f"LAUDO-{nome_extraido}.pdf" # novo_caminho = os.path.join(diretorio, novo_nome) # os.rename(caminho_completo, novo_caminho) # print(f"Arquivo renomeado: {novo_nome}") # else: # print(f"Texto não encontrado em: {arquivo}") # # Exemplo de uso # diretorio = './' # palavra_chave1 = 'Senhor(a)' # palavra_chave2 = 'nascido' # renomear_arquivos_pdf(diretorio, palavra_chave1, palavra_chave2) import os import PyPDF2 def extrair_nome_pdf(caminho_pdf): try: with open(caminho_pdf, 'rb') as arquivo: leitor = PyPDF2.PdfReader(arquivo) for pagina in leitor.pages: texto = pagina.extract_text() if texto: inicio = texto.find("EMPOSSADO") fim = texto.find("\nGerente", inicio) if inicio != -1 and fim != -1 and fim > inicio: nome = texto[inicio + len("EMPOSSADO"):fim] return nome.strip() return None except Exception as e: print(f"Erro ao processar arquivo {caminho_pdf}: {e}") return None def renomear_arquivos_pdf(diretorio): for arquivo in os.listdir(diretorio): if arquivo.lower().endswith('.pdf'): caminho_completo = os.path.join(diretorio, arquivo) nome_extraido = extrair_nome_pdf(caminho_completo) if nome_extraido: novo_nome = f"LAUDO-{nome_extraido}.pdf" novo_caminho = os.path.join(diretorio, novo_nome) os.rename(caminho_completo, novo_caminho) print(f"Arquivo renomeado: {novo_nome}") else: print(f"Nome não encontrado em: {arquivo}") # Exemplo de uso diretorio = './' renomear_arquivos_pdf(diretorio)
Leave a Comment