En este artículo presentamos un nuevo enfoque para el reconocimiento óptico de caracteres (OCR) sin conexión de subpalabras persas impresas mediante la transformada de paquetes wavelet. El algoritmo propuesto se utiliza para extraer características invariantes de la fuente y del tamaño a partir de 87804 subpalabras de 4 fuentes y 3 tamaños. Los vectores de características se comprimen mediante PCA. Los vectores de características obtenidos dan lugar a un diccionario pictórico para el que una entrada es la media de cada grupo que consta de la misma subpalabra con 4 fuentes en 3 tamaños. Los conjuntos de estas características se agrupan combinándolos con las características de punto para el reconocimiento de subpalabras persas impresas. Para evaluar los resultados de la extracción de características, este algoritmo se probó con un conjunto de 2.000 subpalabras en documentos de texto persa impresos. Se obtuvo una tasa de reconocimiento alentadora del 97,9% a nivel de subpalabra.
Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.
Artículo:
Investigación de simulación numérica sobre la fracturación hidráulica para promover la extracción de metano de lechos de carbón.
Artículo:
Modelos empíricos para predecir parámetros de compactación para suelos en el Estado de Ceará, Noreste de Brasil
Artículo:
Prueba y estudio numérico sobre el comportamiento monótono de las uniones de columnas CFT complejas.
Artículo:
Optimización del sistema ATP basado en comunicación cuántica segura y su estrategia de control de seguimiento.
Artículo:
Modelado y simulación de la interacción proceso-máquina en el rectificado de insertos intercambiables de carburo cementado.