Localización de texto dentro de la imagen


Actualmente estoy trabajando en un proyecto y mi objetivo es localizar texto en una imagen. El texto no es mi intención hasta ahora. Básicamente quiero obtener los límites del texto dentro de una imagen. Estoy usando el AForge.Net componente de imagen para manipulación. ¿Alguna ayuda en algún sentido u otro?

Actualización 2/5/09: Desde entonces he seguido otra ruta en mi proyecto. Sin embargo, intenté obtener texto usando MODI (Microsoft Office Document Imaging). Le permite OCR una imagen y extrae el texto de él con cierta facilidad.

Author: Rais Alam, 2008-08-05

4 answers

Este es un área activa de investigación. Hay literalmente montones de artículos académicos sobre el tema. Va a ser difícil darle asistencia especialmente sin más deatails. ¿Está buscando tipos específicos de texto? ¿Fuentes? ¿Sólo inglés? ¿Está familiarizado con la literatura académica?

La"detección de texto" es un problema estándar en cualquier sistema OCR (reconocimiento óptico de caracteres) y, en consecuencia, hay muchos bits de código en las interwebs que se ocupan de él.

I podría comenzar a listar montones de enlaces de Google, pero le sugiero que simplemente haga una búsqueda de "detección de texto" y comience a leer :). También hay un amplio código de ejemplo disponible.

 12
Author: Louis Brandy,
Warning: date(): Invalid date.timezone value 'Europe/Kyiv', we selected the timezone 'UTC' for now. in /var/www/agent_stack/data/www/ajaxhispano.com/template/agent.layouts/content.php on line 61
2008-08-05 03:24:27

Reconocer el texto dentro de una imagen es de hecho un tema candente para los investigadores en ese campo, pero solo comenzó a crecer fuera de control cuando captcha se convirtió en la "norma" en términos de defensa contra los robots de spam. ¿Por qué usar captcha como protección? bueno, porque es/era muy difícil de localizar (y leer) el texto dentro de una imagen!

La razón por la que menciono captcha es porque el mayor avance* se hace dentro de esa pequeña área, y creo que su solución podría ser la mejor encontrada alli. especialmente porque los captcha son de hecho sobre la localización de texto (o algo que se asemeja al texto) dentro de una imagen desordenada y después tratando de leer las letras correctamente.

Así que si puedes encontrarte una buena herramienta de ruptura de captcha de código abierto probablemente tengas todo lo que necesitas para continuar tu búsqueda...
Probablemente incluso podría tirar el código más difícil que maneja el reconocimiento de caracteres en sí, porque esos OCR se utilizan para leer texto distorsionado, algo que no tienes que hacer.

*: avance en términos de información visible, utilizable y práctica para un "no investigador"

 3
Author: sven,
Warning: date(): Invalid date.timezone value 'Europe/Kyiv', we selected the timezone 'UTC' for now. in /var/www/agent_stack/data/www/ajaxhispano.com/template/agent.layouts/content.php on line 61
2008-08-05 06:00:46

Si está de acuerdo con usar una API en línea para esto, la API en http://www.wisetrend.com/wisetrend_ocr_cloud.shtml puede hacer detección de texto además de solo OCR.

 0
Author: Eugene Osovetsky,
Warning: date(): Invalid date.timezone value 'Europe/Kyiv', we selected the timezone 'UTC' for now. in /var/www/agent_stack/data/www/ajaxhispano.com/template/agent.layouts/content.php on line 61
2010-06-23 05:49:10

Trazo ancho transform puede hacer eso por usted. Eso es al menos lo que MS desarrolló para su sistema operativo de teléfono móvil. Una discusión sobre la implementación es aquí en https://stackoverflow.com/

 0
Author: Mathias,
Warning: date(): Invalid date.timezone value 'Europe/Kyiv', we selected the timezone 'UTC' for now. in /var/www/agent_stack/data/www/ajaxhispano.com/template/agent.layouts/content.php on line 61
2017-05-23 12:17:05