Ficha técnica

197 | 6

Ficha técnica
Metadata
Imprimir
Descargar
Reportar error

Artículo

Towards a supervised rescoring system for unstructured data bases used to build specialized dictionariesHacia un sistema de ponderación supervisado de bases de datos no estructuradas utilizadas en la construcción de diccionarios especializados

Resumen

El artículo propone la arquitectura de un sistema que usa valores previamente aprendidos para reordenar resultados de búsquedas en bases de datos no estructuradas al construir diccionarios especializados. Un recurso común en la construcción de diccionarios, las bases de datos no estructuradas han sido útiles ya que proveen información sobre unidades léxicas, tal como la frecuencia o ejemplos de uso de las mismas. Sin embargo, en la construcción de diccionarios especializados, cuya selección de elementos léxicos no depende de la frecuencia, el uso de estas bases de datos queda restringido a la simple ejemplificación. Incluso en esta tarea, la información de las bases de datos no estructuradas puede no ser muy útil si se buscan unidades léxicas con un uso especializado pero con varios otros significados que producen largas listas de resultados. Ante este problema, estas listas pueden ser ponderadas usando un modelo de aprendizaje automático supervisado que se apoye de los resultados previamente útiles. La recolección de un vasto conjunto de datos de alta calidad para este sistema de ponderación es reportada aquí. Finalmente, se propone la arquitectura de tal sistema, el cual representa una herramienta sin precedentes en la lexicografía especializada.

I. INTRODUCCIÓN

El objetivo final de este artículo es describir una ruta para construir un sistema que reorganice los resultados arrojados por las bases de datos no estructuradas utilizando la información sobre los aciertos previamente útiles. El contexto en el que se propone un sistema de este tipo es la construcción de un diccionario, concretamente de un diccionario de lenguaje subestándar. Este tipo de diccionario pretende describir el vocabulario de un dominio especializado que abarca diversos usos del lenguaje, como las interacciones coloquiales o relajadas, la comunicación en contextos populares o de bajo nivel socioeconómico y las formas de expresión estigmatizadas o groseras [1, 2]. Dada la diversidad de situaciones en las que se utiliza el lenguaje subestándar, el uso de frecuencias u otra información distributiva simple no es muy útil para identificar y trabajar con este tipo de vocabulario en grandes bases de datos no estructuradas. Por lo tanto, para maximizar el beneficio del uso de bases de datos no estructuradas, también conocidas como bases de datos textuales [3] o corpus lingüísticos [4], es necesario un enfoque novedoso. El enfoque aquí propuesto se deriva de dos pasos tradicionales en la elaboración de diccionarios, que incluyen la recopilación de todos los trabajos lexicográficos anteriores relacionados y la búsqueda de nuevos materiales para ofrecer un valor añadido en el diccionario derivado de ellos.

Materias:Datos masivos Bases de datos web Análisis de datos
Subjects:Big data Web databases data analysis
Palabras claves:bases de datos no estructuradas, listas de hipótesis supervisadas, lexicografía especializada, construcción de diccionarios
Keywords:unstructured data bases, supervised rescoring, specialized lexicography, dictionary making

Autor:Rico-Sulayes, Antonio.
Categoría:Ciencias aplicadas e interdisciplinarias
Subcategoría:Ingeniería de sistemas
Año de publicación:2015.
Editor:Universidad Pedagógica y Tecnológica de Colombia - UPTC

Tipo de documento:
Formato:pdf
Idioma:Inglés
Tamaño:504 Kb

Cómo citar el documento

Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.

Este contenido no estï¿½ disponible para su tipo de suscripciï¿½n

DC.Title.spa

Towards a supervised rescoring system for unstructured data bases used to build specialized dictionaries

DC.Title.eng

Hacia un sistema de ponderación supervisado de bases de datos no estructuradas utilizadas en la construcción de diccionarios especializados

DC.Creator

Rico-Sulayes, Antonio

DC.Subject.snpi.spa

Datos masivos Bases de datos web Análisis de datos

DC.Subject.snpi.eng

Big data Web databases data analysis

DC.Subject.spa

bases de datos no estructuradas, listas de hipótesis supervisadas, lexicografía especializada, construcción de diccionarios

DC.Subject.eng

unstructured data bases, supervised rescoring, specialized lexicography, dictionary making

DC.Description.spa

I. INTRODUCCIÓN

DC.Source

https://revistas.uptc.edu.co/index.php/ingenieria/article/view/3161

DC.Identifier.virtualpro

http://www.revistavirtualpro.com/biblioteca/hacia-un-sistema-de-ponderacion-supervisado-de-bases-de-datos-no-estructuradas-utilizadas-en-la-construccion-de-diccionarios-especializados

DC.Identifier.issn-isbn

ISSN:2357-5328 (Versión electrónica); 0121-1129 (Versión impresa)

DC.Identifier.citacion

Revista Virtual Pro, Enero 2015, Revista facultad de Ingeniería Vol. 24 No. 38

DC.Language

Inglés

DC.Relation

DC.Publisher

Universidad Pedagógica y Tecnológica de Colombia - UPTC

DC.Contributor

DC.Rights

Derechos de autor:1

DC.Date

2015

DC.Type

Artículo

DC.Format

pdf

DC.Identifier.file

29049.pdf

Ficha técnica
Metadata
Imprimir
Descargar
Reportar error

Información del documento

Titulo:Towards a supervised rescoring system for unstructured data bases used to build specialized dictionaries
Autor:Rico-Sulayes, Antonio
Tipo:Artículo
Año:2015
Idioma:Inglés
Editor:Universidad Pedagógica y Tecnológica de Colombia - UPTC
Materias:Datos masivos Bases de datos web Análisis de datos
Descarga:6

Biblioteca122.739 documentos en línea

Ficha técnica

Towards a supervised rescoring system for unstructured data bases used to build specialized dictionariesHacia un sistema de ponderación supervisado de bases de datos no estructuradas utilizadas en la construcción de diccionarios especializados

Resumen

Cómo citar el documento

Este contenido no estï¿½ disponible para su tipo de suscripciï¿½n

Información del documento

Cómo citar el documento

Documentos relacionados

Recursos

Infografías

Principios de Onda en una cuerda

Introducción a Polaridad de la molécula

Cadena de producción de la carne

Ósmosis inversa

Principios de Adición de Vectores

Matriz de alternativas ambientales

Generalidades de Masas y Resortes

Videos

Aplicaciones de Quantum y proyectos de usuario con D-Wave | Webinar

Reciclaje PET - Cómo abrir un negocio de reciclaje

Nuevas fronteras en biorremediación

Criterios para la selección de Válvulas

Emily Carter. Mecanismos de reducción fotoelectroquímica de dióxido de carbono... - 27 de septiembre de 2013

Webinar: Active learning en aulas para adultos, Parte 1

Aplicaciones de la nanotecnología en el envasado de alimentos

Documentos más descargados

2022-09-12
De la peste negra al SARS-CoV-2: la respuesta de la humanidad ante las crisis sanitarias

Virtual Pro

Virtual Plant

Actualidad

Investigación

Suscripción

Publicidad

Virtual Pro | Procesos Industriales

Biblioteca122.739 documentos en línea

Ficha técnica

Towards a supervised rescoring system for unstructured data bases used to build specialized dictionariesHacia un sistema de ponderación supervisado de bases de datos no estructuradas utilizadas en la construcción de diccionarios especializados

Resumen

Cómo citar el documento

Este contenido no estï¿½ disponible para su tipo de suscripciï¿½n

Información del documento

Cómo citar el documento

Documentos relacionados

Recursos

Infografías

Principios de Onda en una cuerda

Introducción a Polaridad de la molécula

Cadena de producción de la carne

Ósmosis inversa

Principios de Adición de Vectores

Matriz de alternativas ambientales

Generalidades de Masas y Resortes

Videos

Aplicaciones de Quantum y proyectos de usuario con D-Wave | Webinar

Reciclaje PET - Cómo abrir un negocio de reciclaje

Nuevas fronteras en biorremediación

Criterios para la selección de Válvulas

Emily Carter. Mecanismos de reducción fotoelectroquímica de dióxido de carbono... - 27 de septiembre de 2013

Webinar: Active learning en aulas para adultos, Parte 1

Aplicaciones de la nanotecnología en el envasado de alimentos

Documentos más descargados

2022-09-12De la peste negra al SARS-CoV-2: la respuesta de la humanidad ante las crisis sanitarias

Virtual Pro

Virtual Plant

Actualidad

Investigación

Suscripción

Publicidad

Virtual Pro | Procesos Industriales

2022-09-12
De la peste negra al SARS-CoV-2: la respuesta de la humanidad ante las crisis sanitarias