Untitled
unknown
plain_text
2 years ago
3.2 kB
12
Indexable
# import os
# import PyPDF2
# def extrair_texto_entre_palavras_chave(caminho_pdf, palavra_chave1, palavra_chave2):
# try:
# with open(caminho_pdf, 'rb') as arquivo:
# leitor = PyPDF2.PdfReader(arquivo)
# for pagina in leitor.pages:
# texto = pagina.extract_text()
# if texto:
# indice1 = texto.find(palavra_chave1)
# indice2 = texto.find(palavra_chave2)
# if indice1 != -1 and indice2 != -1 and indice2 > indice1:
# texto_entre_palavras_chave = texto[indice1 + len(palavra_chave1):indice2]
# return texto_entre_palavras_chave.strip()
# return None
# except Exception as e:
# print(f"Erro ao processar arquivo {caminho_pdf}: {e}")
# return None
# def renomear_arquivos_pdf(diretorio, palavra_chave1, palavra_chave2):
# for arquivo in os.listdir(diretorio):
# if arquivo.lower().endswith('.pdf'):
# caminho_completo = os.path.join(diretorio, arquivo)
# nome_extraido = extrair_texto_entre_palavras_chave(caminho_completo, palavra_chave1, palavra_chave2)
# if nome_extraido:
# novo_nome = f"LAUDO-{nome_extraido}.pdf"
# novo_caminho = os.path.join(diretorio, novo_nome)
# os.rename(caminho_completo, novo_caminho)
# print(f"Arquivo renomeado: {novo_nome}")
# else:
# print(f"Texto não encontrado em: {arquivo}")
# # Exemplo de uso
# diretorio = './'
# palavra_chave1 = 'Senhor(a)'
# palavra_chave2 = 'nascido'
# renomear_arquivos_pdf(diretorio, palavra_chave1, palavra_chave2)
import os
import PyPDF2
def extrair_nome_pdf(caminho_pdf):
try:
with open(caminho_pdf, 'rb') as arquivo:
leitor = PyPDF2.PdfReader(arquivo)
for pagina in leitor.pages:
texto = pagina.extract_text()
if texto:
inicio = texto.find("EMPOSSADO")
fim = texto.find("\nGerente", inicio)
if inicio != -1 and fim != -1 and fim > inicio:
nome = texto[inicio + len("EMPOSSADO"):fim]
return nome.strip()
return None
except Exception as e:
print(f"Erro ao processar arquivo {caminho_pdf}: {e}")
return None
def renomear_arquivos_pdf(diretorio):
for arquivo in os.listdir(diretorio):
if arquivo.lower().endswith('.pdf'):
caminho_completo = os.path.join(diretorio, arquivo)
nome_extraido = extrair_nome_pdf(caminho_completo)
if nome_extraido:
novo_nome = f"LAUDO-{nome_extraido}.pdf"
novo_caminho = os.path.join(diretorio, novo_nome)
os.rename(caminho_completo, novo_caminho)
print(f"Arquivo renomeado: {novo_nome}")
else:
print(f"Nome não encontrado em: {arquivo}")
# Exemplo de uso
diretorio = './'
renomear_arquivos_pdf(diretorio)Editor is loading...
Leave a Comment