software lettura ottica, Lettura ottica, riconoscimento caratteri ICR OCR OMR BCR CHR, elaborazione immagini, lettura ottica moduli, indicizzazione documenti, estrazione automatica dati Recogniform Technologies - Lettura ottica, riconoscimento caratteri ICR OCR OMR BCR CHR, elaborazione immagini, lettura ottica moduli, indicizzazione documenti, estrazione automatica dati
Come classificare automaticamente documenti, fax e email

Come classificare automaticamente documenti, fax e email

Un importante vantaggio, spesso sottovalutato, offerto dalla lettura ottica è la possibilità di poter effettuare l'elaborazione simultanea di documenti di tipologia diversa, lasciando al software l'incombenza di riconoscerne la natura per poterli trattare ciascuno secondo le proprie specifiche.

Si tratta di un vero e proprio processo di classificazione automatica, ossia di attribuzione di un documento ad una classe documentale (es: fattura, ordine, contratto, reclamo, sollecito, etc...) che può essere applicato sia a moduli strutturati sia a documenti non strutturati.

Laddove possibile, può essere utilizzata una tecnica di form identification, ossia di identificazione del modulo, che avendo una struttura fissa ed invariabile, può essere appunto riconosciuto verificando la presenza di elementi grafici costanti quali linee, marchi, caselle e fincatura in genere. Solitamente l'utilizzo di tale tecnica richiede una fase di "addestramento" in cui al sistema si sottopongono i campioni di moduli da riconoscere così che possa estrarne le features grafiche e crearsi una sorta di database da utilizzare per la successiva identificazione delle istanze sconosciute.

Quando non si tratta di moduli viene invece utilizzata una tecnica di keywording, ossia di identificazione di parole chiave significative, previo OCR dell'intera pagina, che costituiscono una sorta di minimo comun denominatore per ogni tipologia di documento da processare. L'identificazione di tali keyword può avvenire in modo manuale oppure in modo automatico. Nel primo caso è lasciato alla sensibilità ed esperienza di un operatore l'identificare quali siano le keyword da usarsi per ciascuna classe documentale. Nel secondo caso tali keyword vengono invece identificate automaticamente dal sistema sottoponendogli un sufficiente numero di documenti per ciascuna delle tipologia tra cui distinguere.

E' importante sottolineare che tale tecnologia può essere usata anche quando si elabora una sola tipologia di documento, ma multi-pagine, per verificare l'esatto ordinamento delle facciate che lo compongono così da essere certi che non ci siano stati errori di scansione che potrebbero portare alle immaginabili conseguenze in caso di salto o di scambio pagina.

Da non sottovalutare è anche uno dei "sottoprodotti" che possono risultare in modo naturale dalla classificazione dei documenti, ossia la possibilità di ottenerne il corretto orientamento, correggendo eventuali scansioni sotto-sopra.

Per meglio chiarire gli ambiti di applicazione di tale tecnologia, riportiamo quale esempio un'applicazione reale realizzata per il servizio di customer care di un importante operatore telefonico italiano. L'esigenza di partenza era quella di poter fare in modo che a ciascun documento ricevuto potesse essere attribuita la giusta destinazione per la sua "lavorazione" ed una priorità in base alla specifica tipologia. Infatti, confluendo le richieste dei clienti in un unico flusso digitale, sia mediante fax server che mediante scansione massiva del cartaceo ricevuto in casella postale, non era possibile attribuirvi priorità e routing a priori a meno che degli operatori umani non valutassero manualmente il contenuto di ciascuno di essi.

Utilizzando la nostra piattaforma di lettura ottica, Recogniform Reader, è stato invece possibile fare in modo che tali documenti venissero classificati automaticamente, sia mediante form identification che keywording, così da attribuire immediatamente priorità e routing a ciascuno di essi.

Esempio di architettura per l'identificazione e lo smistamento automatico dei documenti implementata con Recogniform Reader presso il customer care di un importante operatore telefonico.

Esempio di architettura per l'identificazione e lo smistamento automatico dei documenti implementata con Recogniform Reader presso il customer care di un importante operatore telefonico.

Lo scenario iniziale era dunque quello in cui, a fronte di una coda di migliaia di documenti da lavorare giornalmente, l'attività si poteva svolgere solo sequenzialmente, con operatori che manualmente guardavano a video i singoli documenti per decidere a chi inoltrarli e se lavorarli subito o meno, in base alle direttive ricevute. Lo scenario finale è diventato invece quello in cui ciascun operatore di customer care riceve i documenti che deve lavorare già in ordine di priorità ed addirittura già con parte dei dati "estratti" pronti per essere inseriti nel CRM/Gestionale aziendale!

Un vantaggio enorme quindi che si concretizza in un risparmio di tempo e risorse ed in un miglioramento della qualità del servizio offerto all'utente.

Approfondimenti: