Untitled

 avatar
unknown
plain_text
21 days ago
1.5 kB
2
Indexable
import os
import PyPDF2

def cauta_string_in_pdf(director, string_cautat):

    fișiere_gasite = []
    for filename in os.listdir(director):
        if filename.endswith(".pdf"):
            cale_completa = os.path.join(director, filename)
            try:
                with open(cale_completa, "rb") as f:
                    reader = PyPDF2.PdfReader(f)
                    num_pages = len(reader.pages)
                    for page_num in range(num_pages):
                        page = reader.pages[page_num]
                        text = page.extract_text()
                        if string_cautat in text:
                            fișiere_gasite.append(cale_completa)
                            break  # Daca gaseste string-ul se opreste loop-ul
            except PyPDF2.errors.PdfReadError:
                print(f"Eroare la citirea fisierului: {filename}")
                continue # Sare peste fisierele corupte sau care nu au string-ul cautat

    if fișiere_gasite:
        return fișiere_gasite
    else:
        return None


if __name__ == "__main__":
    director_pdf = input("Pune aici calea/path-ul unde se afla fisierele: ")
    string_cautat = input("Pune string/ID-ul pe care il cauti: ")

    rezultate = cauta_string_in_pdf(director_pdf, string_cautat)

    if rezultate:
        print("\nFisierele PDF care contin string-ul sunt:")
        for fisier in rezultate:
            print(fisier)
    else:
        print("\nString-ul nu a fost gasit in niciun PDF.")

Leave a Comment