I sistemi per la lettura automatica delle targhe: criticità, raccomandazioni e nuove soluzioni

Criticità, raccomandazioni e nuove soluzioni

La lettura della targa dei veicoli ha sempre rappresentato un elemento critico in un sistema di videosorveglianza sia qualora finalizzata alla sola registrazione di un filmato in cui la targa risulti intellegibile da un operatore ed a maggior ragione nel caso in cui sia destinata ad un processo OCR di ricerca e lettura automatica.
La targa, nell'ambito dell'inquadratura video, risulta costituire una porzione di dimensione relativamente piccole, di conseguenza la sua influenza è fortemente limitata rispetto alle tecniche di controllo dell'esposizione adottate, tipicamente finalizzate all'ottimizzazione della scena inquadrata.

Per questo motivo la soluzione ottimale è costituita da dei dispositivi integrati specificatamente ottimizzati allo scopo.
Stante l'evoluzione tecnologica dei sensori di ripresa le cose stanno rapidamente cambiando e se i dispositivi integrati, specificatamente dedicati alla ripresa delle targhe, continuano a rappresentare la soluzione principe in contesti con veicoli transitanti a velocità elevata (come per esempio l'ambito autostradale), in molte situazioni sono raggiungibili buone prestazioni di riconoscimento anche con architetture differenti.

Alcune telecamere, grazie alla nuova generazione di sensori ed all'avvento delle tecniche WDR, sono oramai caratterizzate da un'elevata dinamica e soprattutto in situazioni di transito con una velocità del veicolo relativamente bassa od in situazioni di controllo accessi dove i veicoli sono obbligati a fermarsi in prossimità di una sbarra i risultati sono eccellenti. In questi contesti la possibilità di utilizzo di telecamere standard permette da un lato l'integrazione delle funzionalità OCR con quelle di videosorveglianza e dall'altro andando a centralizzare la risorsa pregiata dell'analisi OCR di ottenere un notevole risparmio a livello di costi di impianto.

I software di riconoscimento targhe, distribuiti in versione di libreria, sono oramai disponibili sul mercato per i vari sistemi operativi Windows, Windows CE, Linux e Android sia per l'elaborazione di singole immagini o flussi video.
La capacità di elaborare un'immagine consiste nella capacità di rilevare la presenza di una targa all'interno dell'immagine stessa andando successivamente ad isolarne ed interpretarne i caratteri per arrivare a "decifrare" la stringa alfanumerica costituente la targa stessa; come si può vedere dall'immagine a fianco dove sono stati mascherati il 5° ed il 6° carattere.
Quindi è tipicamente effettuata un'analisi sintattica e semantica al fine di filtrare le false letture dovute a scritte non riferibili a targhe od a falsi allarmi generati da particolari strutture dei veicoli o ad ombre che potrebbero generare caratteristiche simili a quelle dei caratteri. Ovviamente la capacità di identificare la presenza di una targa e quella di filtrare elementi oggetto di falsi allarmi variano da algoritmo ad algoritmo e già, a questo livello, si notano le prime differenze tra le varie offerte commerciali disponibili sul mercato.

Il livello successivo è quello del vero e proprio riconoscimento della stringa alfanumerica della targa. Le tecniche adottate sono molteplici da un'analisi deterministica basata sugli archetipi dei singoli caratteri a quelle neuronali ovvero all'adozione di tecniche miste. Oltre all'aspetto "tecnologico" del riconoscimento, un altro elemento essenziale è l'ambito in cui il riconoscimento avviene. Tipicamente gli algoritmi possono riconoscere le targhe di una singola nazione, di un certo numero specifico di nazioni o essere caratterizzati da una semantica libera e quindi non imporre limitazione alcuna al numero delle nazioni riconosciute.
Ovviamente introducendo dei vincoli sulla specifica nazione sia i controlli semantici che quelli sulla forma del carattere possono essere più "stringenti" con una conseguente diminuzione dei falsi allarmi ed una miglior prestazione di lettura. Incrementando il numero delle nazioni analizzabili, fino ad arrivare al concetto di semantica libera, i vincoli si fanno via via più labili con una conseguente diminuzione nelle prestazioni di riconoscimento.

Le soluzioni più evolute provano ad associare la targa ad una specifica nazione, rendendo possibile quindi verifiche più circostanziate, operando solo a posteriori l'analisi a semantica libera qualora non riescano ad associare la targa a nessuna specifica nazionalità. Anche in questo caso le soluzioni si differenziano per il numero di nazioni che riescono a gestire contemporaneamente e per la possibilità di apertura alla semantica libera.

Le soluzioni più evolute permettono inoltre un ulteriore tipo di filtraggio, di tipo temporale, ovvero effettuato sulle varie istanze in cui è stata ripresa quella specifica targa. Tipicamente l'immagine della targa del veicolo è ripresa in più fotogrammi nei quali il veicolo stesso si trova in posizioni differenti quindi anche le condizioni di illuminazione e gli di angoli di ripresa risultano diversi nelle varie immagini così come eventuali disturbi esterni. Un filtraggio temporale può perciò aiutare a identificare con maggior attendibilità la targa.

Le soluzioni che operano questo tipo di analisi permettono inoltre, confrontando le varie istanze della targa, di determinare se il veicolo stava procedendo in avvicinamento oppure in allontanamento e quindi identificare anche la direzione del transito.

Come anticipato l'adozione di una soluzione architetturale basate su telecamere IP tradizionali installate ai varchi di ingresso ed uscita e l'analisi OCR centralizzata, permette tipicamente la realizzazione di soluzioni più economiche rispetto all'adozione sui varchi di soluzioni integrate all-in-one.

Inoltre la piattaforma può integrare direttamente, in modo maggiormente efficace ed efficiente, anche la gestione di dispositivi esogeni, quali per esempio il comando delle sbarre, l'integrazione con dB esterni, la videosorveglianza dell'area fino ad arrivare all'integrazione della libreria OCR all'interno di una piattaforma PSIM (Physical Security Information Management) per il controllo completo del sito ai fini della sicurezza.
In ogni caso particolare attenzione deve essere posta in relazione alla scelta della telecamera ed al suo posizionamento.

Come detto precedentemente è opportuno orientarsi verso telecamere con una buona dinamica, WDR, e dotate di illuminatore IR al fine di garantire la lettura anche in condizioni di bassa illuminazione ovvero di assenza totale di illuminazione.
Qualora si opti per la lettura della targa anteriore, si dovrà selezionare una telecamera con una buona immunità ai fenomeni di blooming e di smear che potrebbero saturare l'immagine catturata dalla telecamera a causa della presenza di sorgenti ad alta intensità luminosa quali i fari dei veicoli; nelle inquadrature posteriori questo fenomeno è notevolmente ridotto.

Un elemento fondamentale è la qualità dell'immagine; questa è determinata da vari fattori.

CONTINUA LA LETTURA NELL'ARTICOLO INTEGRALE