Document Management cu OCR — căutare full-text în arhive
Cum transformăm 100.000 de pagini scanate în date căutabile. OCR cu corecție pentru română, indexare full-text, audit log pentru fiecare descărcare.
O primărie medie acumulează 50.000-200.000 pagini anual între cereri, hotărâri, dispoziții și documente externe. Fără un sistem DMS modern cu OCR, găsirea unui document specific devine o vânătoare de comori.
Ce este un DMS cu OCR
Document Management System (DMS) cu Optical Character Recognition (OCR):
- Stochează toate documentele în arhivă digitală
- Convertește PDF-uri scanate în text căutabil
- Indexează full-text pentru regăsire instant
- Aplică taxonomie (categorii, etichete)
- Loggează fiecare acces (audit trail)
OCR optimizat pentru limba română
OCR-ul generic recunoaște caracterele engleze. Pentru română (cu ă, â, î, ș, ț), folosim:
- Tesseract 5 cu dicționar românesc
- Pre-procesare imagine: deskew, denoise, sharpen
- Post-procesare: corectare diacritice și termeni juridici
Rezultat: acuratețe 95-98% pe documente curate, 80-90% pe scanări vechi.
Categorii standard
Sistemul predefinește taxonomie pentru documentele unei primării:
- 📋 HCL (Hotărâri de Consiliu Local)
- 📝 Dispoziții primar
- 💰 Bugete și conturi anuale
- 📑 Contracte (achiziții, servicii)
- 🏗️ Autorizații (construcție, urbanism)
- 📜 Certificate (fiscal, urbanism, atestate)
- ✉️ Corespondență (intrări/ieșiri)
- 📊 Rapoarte
Workflow procesare document nou
- Upload: prin scanare bulk sau drag-and-drop
- OCR: rulează automat pe fundal (queue)
- Clasificare: AI sugerează categorie pe baza conținutului
- Metadata: număr, dată, emitent, beneficiar
- Indexare: în Elasticsearch pentru căutare
- Aprobare: dacă e document oficial, semnătură electronică
- Publicare: vizibil intern sau public (după caz)
Semnătură electronică PAdES
Pentru documentele oficiale, ePrimăria suportă PAdES (PDF Advanced Electronic Signatures) compatibil cu:
- DigiSign România
- certSIGN
- Adobe Acrobat Sign
Semnătura este vizibilă pe PDF, validabilă în orice viewer.
Audit log complet
Pentru fiecare document, sistemul înregistrează:
- Cine a încărcat (utilizator + IP)
- Cine a vizualizat (timestamp)
- Cine a descărcat (count + utilizator)
- Cine a modificat (versiuni)
- Cine a șters (cu motivare)
Acest log este esențial pentru audit GDPR și controale interne.
Căutare full-text
Utilizatorul poate căuta:
- Cuvânt în titlu, conținut sau metadata
- Operatori AND/OR/NOT
- Filtru pe dată, categorie, autor
- Wildcards (*) pentru variații
- Fuzzy match pentru typo-uri
Rezultatele apar cu evidențierea termenului găsit, scorul de relevanță și extrasul din document.
ROI
Pe baza implementărilor noastre, timpul mediu de căutare a unui document:
- Fără DMS: 15-45 minute (sertare, mape, întrebări)
- Cu DMS+OCR: 5-30 secunde
Pentru o primărie cu 20 angajați care caută 3-5 documente/zi, asta înseamnă 5-15 ore/săptămână recuperate.
Vrei să vezi cum funcționează în practică?
Demo live disponibil instant, fără înregistrare. Sau solicită consultanță gratuită pentru primăria ta.
Articole conexe
Plăți Ghișeul.ro pentru primării — integrare SNEP completă
⏱️ 6 min citit
Sesizări GPS — cum digitalizăm raportarea problemelor de infrastructură
⏱️ 7 min citit
Asistent AI pentru primării — răspunsuri instant 24/7
⏱️ 8 min citit
Petiții cu semnătură electronică — Legea 233/2002 modernă
⏱️ 5 min citit