Biblioteca122.739 documentos en línea

Artículo

OCR with the Deep CNN Model for Ligature Script-Based Languages like ManchuOCR con el modelo Deep CNN para idiomas basados en escritura de ligaduras como el manchú.

Resumen

El manchú es un idioma de recursos limitados que rara vez se involucra en la tecnología de reconocimiento de texto. Debido a la combinación de tipos de letra, la práctica habitual de reconocimiento de texto requiere segmentación antes del reconocimiento, lo que afecta la precisión del reconocimiento. En este artículo, proponemos un sistema de reconocimiento de texto manchú dividido en dos partes: reconocimiento de texto y recuperación de texto. En primer lugar, se utiliza un modelo de CNN profundo para el reconocimiento de texto, utilizando una ventana deslizante en lugar de segmentación manual. En segundo lugar, la recuperación de texto encuentra similitudes dentro de la imagen y localiza la posición del texto reconocido en la base de datos; este proceso se describe en detalle. Realizamos experimentos comparativos en el conjunto de datos FAST-NU utilizando diferentes cantidades de datos de muestra, así como comparaciones con el último modelo. Los experimentos revelaron que los resultados óptimos del modelo de CNN profundo propuesto alcanzaron el 98.84%.

  • Tipo de documento:
  • Formato:pdf
  • Idioma:Inglés
  • Tamaño: Kb

Cómo citar el documento

Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.

Este contenido no est� disponible para su tipo de suscripci�n

Información del documento