Questo sito contribuisce alla audience di

OCR

in informatica, iniziali di Optical Character Recognition (lettore di caratteri ottici). Tale dispositivo analizza, riconosce e codifica informazioni stampate o scritte in caratteri alfanumerici. I moderni OCR sono in grado di leggere la maggior parte dei documenti stampati e scritti con calligrafia molto precisa e regolare, con un elevato grado di riconoscimento.Le tecniche utilizzate per il riconoscimento prevedono, in genere, l'utilizzo di operatori di image processing per l'eliminazione del rumore e l'identificazione di regioni che nell'immagine digitale corrispondono ai diversi segmenti costitutivi di un carattere. L'esistenza di particolari relazioni spaziali fra queste regioni (per esempio l'adiacenza, lo stare sopra, a sinistra, sotto o a destra) viene analizzata per stabilire la corrispondenza con le relazioni tipiche dei segmenti costitutivi di una possibile scrittura di un carattere. Per esempio una "A" maiuscola può risultare in due lati lunghi obliqui che si congiungono in alto e con un segmento orizzontale che unisce i loro punti di mezzo; oppure in quattro lati, due verticali lunghi e due orizzontali corti, con quelli orizzontali che collegano i punti in alto e in mezzo dei due lati verticali. L'associazione fra composizioni di segmenti e caratteri avviene su base statistica, o verificando che una descrizione simile a quella appena data possa essere generata da particolari sistemi formali. Programmi per l'OCR sono oggi tipicamente integrati con programmi per la separazione fra testo e immagine e per l'identificazione dei layout dei documenti, e incorporati nei programmi di acquisizione di documenti. Un tipico ambito di utilizzo è il riconoscimento automatico degli indirizzi sul materiale postale, che deve non solo individuare i singoli caratteri, ma interpretare il ruolo delle parole in base alla loro disposizione sul plico. Le tecniche sviluppate per l'OCR sono anche state incorporate nel software per la gestione di dispositivi pen-based che permettono agli utenti di scrivere parole, tracciando segni manualmente.

Media


Non sono presenti media correlati