Lettura ottica, riconoscimento caratteri ICR OCR OMR BCR CHR, elaborazione immagini, lettura ottica moduli, indicizzazione documenti, estrazione automatica dati Lettura ottica, riconoscimento caratteri ICR OCR OMR BCR CHR, elaborazione immagini, lettura ottica moduli, indicizzazione documenti, estrazione automatica dati
Recogniform Layout Analysis SDK

Recogniform Layout Analysis SDK

Recogniform Layout Analysis SDK consente di effettuare l'analisi del layout di qualsiasi documento attraverso complessi algoritmi in grado di riconoscere con estrema precisione le diverse tipologie di aree che compongono la pagina.
Questa libreria identifica le seguenti tipologie di aree:
Recogniform Form Designer
  • testo
  • testo invertito
  • rumore
  • immagini (fotografie o disegni)
  • tabelle (righe, colonne e celle)
  • linee orizzontali e verticali
In seguito al riconoscimento di questi elementi, è quindi possibile operare un'ulteriore sotto-classificazione definendo un insieme di regole determinabili in base alla tipologia del documento da analizzare. Ad esempio, analizzando una pagina di giornale, potremmo riconoscere come "didascalia" un'area di testo, qualora la stessa si trovi in corrispondenza della parte inferiore di un'immagine, magari centrata, magari con un carattere di dimensione inferiore alla media degli altri caratteri riportati nella pagina, riconosciuti come corpo del testo. Alla stessa maniera, è possibile riconoscere come "titolo" eventuali linee di testo in base alla posizione ed alla dimensione dei caratteri in esse contenuti.

Finalità dell'analisi del layout:
Generalmente obiettivo di chi effettua l'analisi del layout di un documento (sia esso un giornale, una rivista, un contratto, un modulo, una fattura, o qualsiasi altro tipo di documento) è comprenderne automaticamente la struttura, per poi identificarlo, estrarne le aree di interesse ed eventualmente effettuare il riconoscimento automatico del testo attraverso l'uso di motori di lettura ottica (OCR, ICR, BCR), per gli usi più disparati, dalla semplice estrazione dati, all'indicizzazione automatica, alla conversione in documento elettronico editabile, mantenendo lo stesso layout dell'originale.
Per migliorare i risultati dell'analisi è importante che la qualità dell'immagine sia la migliore possibile e che, prima di essere processata da Recogniform Layout Analysis, sia sottoposta a pre-processing per effettuare:

Raddrizzamento (Deskew)
Utilizzando scanner ad alte prestazioni, l'alimentatore automatico di fogli inevitabilmente inclina leggermente il foglio: è possibile risolvere il problema ed ottenere immagini diritte senza riscandire, correggendo l'inclinazione in modo automatico e velocemente. Vengono gestiti fino a 45 gradi di inclinazione e l'angolo può essere stimato con grande accuratezza in due modi diversi: analizzando il testo contenuto nell'immagine o trovando il bordo nero interno al foglio. Per avere ulteriori informazioni sul deskew è possibile dare uno sguardo al nostro Deskew SDK.

Despeckle e rimozione del rumore
Scandendo delle fotocopie o dei microfilm, la polvere e la sporcizia possono generare rumore nelle immagini: è possibile risolvere il problema con la rimozione automatica del rumore. Determinando quanto può essere grande una particella di sporco, è possibile tarare il processo per le proprie immagini. Per avere ulteriori informazioni sul despeckle è possibile dare uno sguardo al nostro Despeckle SDK.

Rimozione del bordo nero e ritaglio automatico
Utilizzando uno scanner per microfilm o uno scanner per documenti con sfondo nero, tutto intorno all'immagine viene generato un bordo nero: è possibile risolvere il problema ottenendo immagini pulite senza la necessità di effettuare un'altra scansione. Basta selezionare un livello di soglia e scegliere se rimuovere il bordo scuro ritagliando l'immagine o se sbiancarlo. Per avere ulteriori informazioni sul black border removal è possibile dare uno sguardo al nostro Black Border Removal SDK.

Esempio:
Prendiamo ad esempio un'immagine di cui è necessario eseguire l'analisi del layout: si noti come, attraverso i processi sopra descritti, il sistema riconoscerà automaticamente le aree, distinguendo tra aree di testo, testo invertito, immagini, linee, tabelle, ecc.
Recogniform Form Designer
Recogniform Form Designer
Come si evince dall'immagine a destra, con Recogniform Layout Analysis è possibile individuare le diverse aree con contenuto omogeneo, qui contrassegnate ciascuna con un colore diverso. In questo caso abbiamo:
  • colore giallo: testo
  • colore arancio: immagini
  • colore verde: testo invertito
  • colore rosa: linee
  • colore azzurro: colonna
  • colore grigio: tabella


Versione di Valutazione
Attraverso la sezione download è possibile scaricare una versione di valutazione di questo prodotto.

Cerchi una soluzione pronta all'uso in grado di elaborare moduli e documenti di ogni tipo, stampati o manoscritti, strutturati (layout fisso) o non strutturati (layout variabile)? Scegli Recogniform Reader!

Per richiedere ulteriori informazioni su Recogniform Layout Analysis SDK e sulle nostre soluzioni di lettura ottica ed elaborazione immagini puoi inviarci una e-mail all'indirizzo informazioni@recogniform.it oppure riempire il modulo seguente.


Azienda
Ruolo
Nome
Cognome
Indirizzo
CAP
Città
Provincia
Telefono
Fax
E-mail
Messaggio

Preso atto dell' Informativa per il trattamento dei dati personali (D. Lgs 30 giugno 2003 n. 196 e sue successive modificazioni ed integrazioni), cliccando sul pulsante "OK" acconsento a raccogliere, detenere, trattare, comunicare e, se del caso, cessare il trattamento/i dei dati personali che mi riguardano, per le finalità specificate nell'informativa.

   
  • Recogniform Layout Analysis SDK - Acquista

    Layout Analysis SDK - Royalties Free

    L' SDK Layout Analysis è royaltes-free per cui è possibile distribuire ed usare il software che ne integra le funzionalità anche fino a 1000 computer senza costi aggiuntivi. L' utilizzo di questo SDK richiede la sottoscrizione di un accordo di licenza per cui l'evasione dell'ordine non richiede spedizione fisica. Se si desidera distribuire più di 1000 licenze runtime è necessario acquistare licenze multiple del prodotto.
    € 5.000,00 + IVA