C
City-App
📄 Documente 📅 29 aprilie 2026 ⏱️ 6 min citit

Document Management cu OCR — căutare full-text în arhive

Cum transformăm 100.000 de pagini scanate în date căutabile. OCR cu corecție pentru română, indexare full-text, audit log pentru fiecare descărcare.

O primărie medie acumulează 50.000-200.000 pagini anual între cereri, hotărâri, dispoziții și documente externe. Fără un sistem DMS modern cu OCR, găsirea unui document specific devine o vânătoare de comori.

Ce este un DMS cu OCR

Document Management System (DMS) cu Optical Character Recognition (OCR):

  • Stochează toate documentele în arhivă digitală
  • Convertește PDF-uri scanate în text căutabil
  • Indexează full-text pentru regăsire instant
  • Aplică taxonomie (categorii, etichete)
  • Loggează fiecare acces (audit trail)

OCR optimizat pentru limba română

OCR-ul generic recunoaște caracterele engleze. Pentru română (cu ă, â, î, ș, ț), folosim:

  • Tesseract 5 cu dicționar românesc
  • Pre-procesare imagine: deskew, denoise, sharpen
  • Post-procesare: corectare diacritice și termeni juridici

Rezultat: acuratețe 95-98% pe documente curate, 80-90% pe scanări vechi.

Categorii standard

Sistemul predefinește taxonomie pentru documentele unei primării:

  • 📋 HCL (Hotărâri de Consiliu Local)
  • 📝 Dispoziții primar
  • 💰 Bugete și conturi anuale
  • 📑 Contracte (achiziții, servicii)
  • 🏗️ Autorizații (construcție, urbanism)
  • 📜 Certificate (fiscal, urbanism, atestate)
  • ✉️ Corespondență (intrări/ieșiri)
  • 📊 Rapoarte

Workflow procesare document nou

  1. Upload: prin scanare bulk sau drag-and-drop
  2. OCR: rulează automat pe fundal (queue)
  3. Clasificare: AI sugerează categorie pe baza conținutului
  4. Metadata: număr, dată, emitent, beneficiar
  5. Indexare: în Elasticsearch pentru căutare
  6. Aprobare: dacă e document oficial, semnătură electronică
  7. Publicare: vizibil intern sau public (după caz)

Semnătură electronică PAdES

Pentru documentele oficiale, ePrimăria suportă PAdES (PDF Advanced Electronic Signatures) compatibil cu:

  • DigiSign România
  • certSIGN
  • Adobe Acrobat Sign

Semnătura este vizibilă pe PDF, validabilă în orice viewer.

Audit log complet

Pentru fiecare document, sistemul înregistrează:

  • Cine a încărcat (utilizator + IP)
  • Cine a vizualizat (timestamp)
  • Cine a descărcat (count + utilizator)
  • Cine a modificat (versiuni)
  • Cine a șters (cu motivare)

Acest log este esențial pentru audit GDPR și controale interne.

Căutare full-text

Utilizatorul poate căuta:

  • Cuvânt în titlu, conținut sau metadata
  • Operatori AND/OR/NOT
  • Filtru pe dată, categorie, autor
  • Wildcards (*) pentru variații
  • Fuzzy match pentru typo-uri

Rezultatele apar cu evidențierea termenului găsit, scorul de relevanță și extrasul din document.

ROI

Pe baza implementărilor noastre, timpul mediu de căutare a unui document:

  • Fără DMS: 15-45 minute (sertare, mape, întrebări)
  • Cu DMS+OCR: 5-30 secunde

Pentru o primărie cu 20 angajați care caută 3-5 documente/zi, asta înseamnă 5-15 ore/săptămână recuperate.

Vrei să vezi cum funcționează în practică?

Demo live disponibil instant, fără înregistrare. Sau solicită consultanță gratuită pentru primăria ta.

Articole conexe