Biblioteca122.739 documentos en línea

Artículo

Development of Integrated Neural Network Model for Identification of Fake Reviews in E-Commerce Using Multidomain DatasetsDesarrollo de un modelo de red neuronal integrado para la identificación de reseñas falsas en el comercio electrónico utilizando conjuntos de datos multidominio

Resumen

Las reseñas de productos en línea desempeñan un papel importante en el éxito o el fracaso de una empresa de comercio electrónico. Antes de adquirir productos o servicios, los compradores suelen consultar las reseñas en línea publicadas por clientes anteriores para obtener recomendaciones sobre los detalles de los productos y tomar decisiones de compra. Sin embargo, es posible mejorar o dificultar determinados productos de comercio electrónico mediante la publicación de reseñas falsas, que pueden ser escritas por personas denominadas estafadores. Estas reseñas pueden causar pérdidas financieras a las empresas de comercio electrónico y orientar a los consumidores a tomar la decisión equivocada de buscar productos alternativos. Por lo tanto, es necesario desarrollar un sistema de detección de reseñas falsas para las empresas de comercio electrónico. La metodología propuesta ha utilizado cuatro conjuntos de datos de reseñas falsas estándar de multidominios que incluyen hoteles, restaurantes, Yelp y Amazon. Además, se han utilizado métodos de preprocesamiento como la eliminación de palabras clave, la eliminación de la puntuación y la tokenización, así como el método de secuencia de relleno para hacer que la secuencia de entrada tenga una longitud fija durante el entrenamiento, la validación y la prueba del modelo. Como esta metodología utiliza conjuntos de datos de diferentes tamaños, se desarrollan y crean varias matrices de entrada de características de n-gramas del texto de la reseña con la ayuda de la capa de incrustación de palabras, que es un componente del modelo propuesto. Las capas convolucionales y de agrupación máxima de la técnica CNN se implementan para la reducción de la dimensionalidad y la extracción de características, respectivamente. Sobre la base de mecanismos de puerta, la capa LSTM se combina con la técnica CNN para aprender y manejar la información contextual de las características de los n-gramas del texto de la reseña. Finalmente, una función de activación sigmoidea como última capa del modelo propuesto recibe las secuencias de entrada de la capa anterior y realiza la tarea de clasificación binaria del texto de la reseña en falso o verdadero. En este trabajo, el modelo CNN-LSTM propuesto se evaluó en dos tipos de experimentos, en el dominio y en el dominio cruzado. Para un experimento in-domain, el modelo se aplica a cada conjunto de datos individualmente, mientras que en el caso de un experimento cross-domain, todos los conjuntos de datos se reúnen y se ponen en un único marco de datos y se evalúan en su totalidad. Los resultados de las pruebas de los conjuntos de datos del experimento dentro del dominio fueron del 77%, 85%, 86% y 87% en términos de precisión para los conjuntos de datos de restaurantes, hoteles, Yelp y Amazon, respectivamente. En cuanto al experimento entre dominios, el modelo propuesto ha alcanzado un 89 de precisión. Además, se ha realizado un análisis comparativo de los resultados de los experimentos en el dominio con los enfoques existentes en base a la métrica de precisión y se observa que el modelo propuesto superó a los métodos comparados.

Cómo citar el documento

Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.

Este contenido no est� disponible para su tipo de suscripci�n

Información del documento