Untitled

 avatar
unknown
plain_text
a year ago
3.2 kB
1
Indexable
# import os
# import PyPDF2

# def extrair_texto_entre_palavras_chave(caminho_pdf, palavra_chave1, palavra_chave2):
#     try:
#         with open(caminho_pdf, 'rb') as arquivo:
#             leitor = PyPDF2.PdfReader(arquivo)

#             for pagina in leitor.pages:
#                 texto = pagina.extract_text()

#                 if texto:
#                     indice1 = texto.find(palavra_chave1)
#                     indice2 = texto.find(palavra_chave2)

#                     if indice1 != -1 and indice2 != -1 and indice2 > indice1:
#                         texto_entre_palavras_chave = texto[indice1 + len(palavra_chave1):indice2]
#                         return texto_entre_palavras_chave.strip()

#         return None
#     except Exception as e:
#         print(f"Erro ao processar arquivo {caminho_pdf}: {e}")
#         return None

# def renomear_arquivos_pdf(diretorio, palavra_chave1, palavra_chave2):
#     for arquivo in os.listdir(diretorio):
#         if arquivo.lower().endswith('.pdf'):
#             caminho_completo = os.path.join(diretorio, arquivo)
#             nome_extraido = extrair_texto_entre_palavras_chave(caminho_completo, palavra_chave1, palavra_chave2)
            
#             if nome_extraido:
#                 novo_nome = f"LAUDO-{nome_extraido}.pdf"
#                 novo_caminho = os.path.join(diretorio, novo_nome)
#                 os.rename(caminho_completo, novo_caminho)
#                 print(f"Arquivo renomeado: {novo_nome}")
#             else:
#                 print(f"Texto não encontrado em: {arquivo}")

# # Exemplo de uso
# diretorio = './'
# palavra_chave1 = 'Senhor(a)'
# palavra_chave2 = 'nascido'
# renomear_arquivos_pdf(diretorio, palavra_chave1, palavra_chave2)

import os
import PyPDF2

def extrair_nome_pdf(caminho_pdf):
    try:
        with open(caminho_pdf, 'rb') as arquivo:
            leitor = PyPDF2.PdfReader(arquivo)

            for pagina in leitor.pages:
                texto = pagina.extract_text()

                if texto:
                    inicio = texto.find("EMPOSSADO")
                    fim = texto.find("\nGerente", inicio)

                    if inicio != -1 and fim != -1 and fim > inicio:
                        nome = texto[inicio + len("EMPOSSADO"):fim]
                        return nome.strip()

        return None
    except Exception as e:
        print(f"Erro ao processar arquivo {caminho_pdf}: {e}")
        return None

def renomear_arquivos_pdf(diretorio):
    for arquivo in os.listdir(diretorio):
        if arquivo.lower().endswith('.pdf'):
            caminho_completo = os.path.join(diretorio, arquivo)
            nome_extraido = extrair_nome_pdf(caminho_completo)
            
            if nome_extraido:
                novo_nome = f"LAUDO-{nome_extraido}.pdf"
                novo_caminho = os.path.join(diretorio, novo_nome)
                os.rename(caminho_completo, novo_caminho)
                print(f"Arquivo renomeado: {novo_nome}")
            else:
                print(f"Nome não encontrado em: {arquivo}")

# Exemplo de uso
diretorio = './'
renomear_arquivos_pdf(diretorio)
Leave a Comment