Untitled
unknown
plain_text
9 months ago
1.5 kB
4
Indexable
import os
import PyPDF2
def cauta_string_in_pdf(director, string_cautat):
fișiere_gasite = []
for filename in os.listdir(director):
if filename.endswith(".pdf"):
cale_completa = os.path.join(director, filename)
try:
with open(cale_completa, "rb") as f:
reader = PyPDF2.PdfReader(f)
num_pages = len(reader.pages)
for page_num in range(num_pages):
page = reader.pages[page_num]
text = page.extract_text()
if string_cautat in text:
fișiere_gasite.append(cale_completa)
break # Daca gaseste string-ul se opreste loop-ul
except PyPDF2.errors.PdfReadError:
print(f"Eroare la citirea fisierului: {filename}")
continue # Sare peste fisierele corupte sau care nu au string-ul cautat
if fișiere_gasite:
return fișiere_gasite
else:
return None
if __name__ == "__main__":
director_pdf = input("Pune aici calea/path-ul unde se afla fisierele: ")
string_cautat = input("Pune string/ID-ul pe care il cauti: ")
rezultate = cauta_string_in_pdf(director_pdf, string_cautat)
if rezultate:
print("\nFisierele PDF care contin string-ul sunt:")
for fisier in rezultate:
print(fisier)
else:
print("\nString-ul nu a fost gasit in niciun PDF.")
Editor is loading...
Leave a Comment