Implementazione OCR Java

Questa è principalmente solo curiosità, ma ci sono implementazioni OCR in puro Java? Sono curioso di sapere come ciò si realizzerebbe puramente in Java, e l’OCR in generale mi interessa, quindi mi piacerebbe vedere come è implementato in una lingua che capisco perfettamente. Naturalmente, ciò richiederebbe che l’implementazione fosse open source, ma sono comunque interessato a soluzioni proprietarie, in quanto potrei almeno verificare le prestazioni in quel caso.

Ne ho visto un paio che può essere usato in Java (come Asprise ) ma non sembra che queste siano pure implementazioni Java … ce ne sono?

Consiglio di provare il progetto Java OCR su sourceforge.net. Inizialmente l’ho sviluppato, e ho un post sul blog .

Da quando l’ho installato su sourceforge, la sua funzionalità è stata ampliata e migliorata un po ‘attraverso il grande lavoro di un ricercatore / sviluppatore volontario.

Fai un tentativo, e se non ti piace, puoi sempre migliorarlo!

Abbiamo testato alcuni motori OCR con Java come Tesseract, Asprise, Abbyy, ecc. Nella nostra analisi, Abbyy ha dato i risultati migliori.

Se stai cercando un’opzione molto estensibile o hai un dominio problematico specifico potresti prendere in considerazione il tuo personale utilizzo del Motore Neurale orientato agli oggetti Java . Un altro riferimento JOONE .

L’ho usato con successo in un progetto personale per identificare la lettera da un’immagine come questa , qui puoi trovare tutta la fonte per il componente OCR della mia applicazione su github.

Ci sono una varietà di librerie OCR là fuori. Tuttavia, la mia esperienza è che le principali implementazioni commerciali, ABBYY, Omnipage e ReadIris, superano di gran lunga l’open source o altre implementazioni minori. Queste librerie commerciali non sono progettate principalmente per funzionare con Java, anche se ovviamente è ansible.

Naturalmente, se il tuo interesse è imparare il codice, le implementazioni open-source faranno il trucco.

Ho appena trovato questo (non lo so, non testato, controlla te stesso)

Ron Cemer Java OCR


Come hai solo bisogno di questo per curiosità, puoi guardare nella fonte di questa applet.

Fa OCR di caratteri scritti a mano con una rete neuronale

OCR Java: Riconoscimento grafia