ICR: quando il computer impara a leggere

Per quasi tutti, ormai, è una tecnologia acquisita quella capace di interpretare i testi scritti a macchina, o al computer, tramite una semplice scansione, così da digitalizzarli non come una foto del documento, ma come una pagina di testo modificabile e utilizzabile. Ma oltre a questa tecnologia, detta OCR, ne esiste una ben più avanzata, che è capace di svolgere un compito molto simile, partendo però non da un testo dattiloscritto, bensì da uno scritto a mano – e quindi interpretando correttamente grafie personali estremamente differenziate. Questo è detto software ICR (acronimo di “Intelligent Character Recognition”) ed è attualmente la frontiera della digitalizzazione dei testi scritti.

La base di buona parte dei software ICR consiste di un sistema informatico di autoapprendimento, che viene solitamente definito come “rete neurale”. Lo scopo di tale sistema è quello di permettere al software stesso di imparare, appunto, da ogni scansione come interpretare nuovi tipi di scrittura e diverse forme dei caratteri base – un po’ come un bambino che, se dapprima sa leggere solamente in stampatello, impara con il tempo a decifrare le scritture personali, con tutte le loro variazioni, di qualsiasi tipo. Naturalmente, a differenza di quanto accade con il testo stampato, l’accuratezza non può essere sempre e costantemente garantita con assoluta precisione, poiché le varianti possibili sono troppo numerose; ciò nonostante, la combinazione di diversi algoritmi interpretativi per diverse aree dei documenti strutturati, come i moduli, permette di arrivare a livelli di esattezza superiori al 97%.

In combinazione con apposite interfacce sviluppate ad hoc, e con l’utilizzo di moduli con aree ben precise dedicate a diversi tipi di dati, questo fa sì che i software ICR (qui un esempio)rappresentino uno strumento di grande potenza ed utilità nella digitalizzazione e interpretazione dei dati. Si risparmia infatti tutto il tempo – e i conseguenti costi, naturalmente – che è tradizionalmente legato alla fase del “data entry”, che viene invece eseguito in pochi secondi dal sistema scanner-computer; non è difficile immaginare quale vantaggio questo possa essere per un gran numero di aziende ed enti pubblici.