Untitled
import os import PyPDF2 def cauta_string_in_pdf(director, string_cautat): fișiere_gasite = [] for filename in os.listdir(director): if filename.endswith(".pdf"): cale_completa = os.path.join(director, filename) try: with open(cale_completa, "rb") as f: reader = PyPDF2.PdfReader(f) num_pages = len(reader.pages) for page_num in range(num_pages): page = reader.pages[page_num] text = page.extract_text() if string_cautat in text: fișiere_gasite.append(cale_completa) break # Daca gaseste string-ul se opreste loop-ul except PyPDF2.errors.PdfReadError: print(f"Eroare la citirea fisierului: {filename}") continue # Sare peste fisierele corupte sau care nu au string-ul cautat if fișiere_gasite: return fișiere_gasite else: return None if __name__ == "__main__": director_pdf = input("Pune aici calea/path-ul unde se afla fisierele: ") string_cautat = input("Pune string/ID-ul pe care il cauti: ") rezultate = cauta_string_in_pdf(director_pdf, string_cautat) if rezultate: print("\nFisierele PDF care contin string-ul sunt:") for fisier in rezultate: print(fisier) else: print("\nString-ul nu a fost gasit in niciun PDF.")
Leave a Comment