Recogniform Free Form and Layout Analysis Engine è il modulo opzionale disponibile per Recogniform Reader che consente il riconoscimento di modulistica SEMISTRUTTURATA o addirittura NON STRUTTURATA, ovvero con campi in posizione variabile anzichè fissa. Indispensabile per la lettura ottica del ciclo passivo (bolle, fatture) ma anche per leggere altre tipologie di documenti (RIBA, bonifici, contratti bancari, documenti pregressi non strutturati, etc.) l'utilizzo della tecnologia di riconoscimento Free Form consente di identificare un campo in base ad alcuni attributi specifici, quali ad esempio la sua etichetta, la sua formattazione, il suo layout grafico. Nel caso del campo "PARTITA IVA" di una fattura, ad esempio, sarà possibile riconoscerlo, e quindi ricavarne il valore, semplicemente dicendo al sistema di trovare una sequenza di 11 caratteri numerici (o 2 lettere + 11 caratteri numerici), in prossimità (sopra, sotto, a destra, a sinistra) delle parole "P.IVA" o "Partita Iva" o "PARTITA IVA", etc., magari limitatamente ad una certa zona del documento (ad esempio nella metà superiore dell'immagine). Lo stesso può essere fatto per trovare i campi DATA, NUMERO DOCUMENTO, IMPONIBILE, IVA, TOTALE, PESO, COLLI, etc.
Estrazione dati da documenti di trasporto eterogenei mediante Recogniform Free Form and Layout Analysis Engine
In pratica il modo di agire del software rispecchia il ragionamento umano: quando dobbiamo cercare su una fattura il campo TOTALE DOCUMENTO siamo naturalmente portati a guardare in basso a destra del foglio, magari ci soffermiamo su un riquadro particolarmente evidente o marcato e cerchiamo come "prova" le parole "TOTALE DOCUMENTO" O "IMPORTO FATTURA" o "TOT. FATTURA". Nello stesso modo agisce il nostro sistema di Free Form Analysis: ciò avviene ovviamente sulla base delle nostre indicazioni, sulla scorta cioè delle regole impostate tramite un semplice linguaggio di scripting.
Alla base delle funzioni di free-form processing c'è l'utilizzo del riconoscimento OCR full text del documento in sinergia con il nostro sofisticato algoritmo di analisi del layout: l'utilizzo combinato di questi due strumenti rende possibile l'identificazione dei blocchi di testo, delle linee verticali, orizzontali e degli elementi di testo con le rispettive confidenze, da cui deriva la possibilità di verificare o meno le condizioni imposte per la ricerca dei campi sulla pagina.
Recogniform FreeForm Engine è disponibile come modulo opzionale di Recogniform Reader, ed è integrato nella soluzione per l'estrazione dati da fatture e DDT Recogniform Invoices.