Discussion of “Clustering on dissimilarity representations for detecting mislabelled seismic signals at Nevado del Ruiz Volcano” by Mauricio Orozco Alzate, and César Germán Castellanos Domínguez
Discusión sobre agrupación de representaciones de disimilitud para detectar señales sísmicas mal etiquetadas en el volcán Nevado del Ruiz por Mauricio Orozco Alzate y César Germán Castellanos DomÍnguez
Los autores han llevado a cabo varios algoritmos de agrupación de los registros de eventos sísmicos del Observatorio Vulcanológico y Sismológico de Manizales. Su objetivo era probar la agrupación de datos sísmicos (es decir, terremotos volcánicos y tónicos, terremotos de larga duración y terremotos de hielo) digitalizados con una frecuencia de muestreo de 100,16 Hz. Su estudio parece añadir un nuevo enfoque a su anterior trabajo de Langer y otros (2006), que aplicaron diferentes técnicas de clasificación a los datos sísmicos.
Los discutidores tienen las siguientes sugerencias para mejorar la investigación del autor sobre los datos del volcán Ruiz y para ser una guía para futuros estudios similares.
1.Hay cinco pasos empíricos que deben seguirse en la aplicación del análisis de conglomerados que son (i) selección de variables, (ii) selección de la técnica de estandarización (si es necesario), (iii) métrica de disimilitud, (iv) selección de un método apropiado, y (v) prueba de estabilidad o validación (Demirel 2004; Everitt 1993; Green et al.1990). Estos pasos son difíciles de distinguir en el presente estudio de Orozco-Alzate y Castellanos-Domínguez (2007). La experiencia y las preferencias de los usuarios en estos pasos pueden afectar radicalmente a las estructuras de agrupación resultantes. Por ejemplo, la métrica de distancia seleccionada no se menciona claramente en el texto. ¿La notación ρkl se refiere al coeficiente de correlación entre las entidades k y l? ¿Cuántas estaciones se seleccionaron cerca del cráter Olleta y del glaciar del complejo volcánico Nevado del Ruiz? ¿Existen problemas de escala en el conjunto de datos que puedan perturbar las matrices de disimilitud? A partir de ahora, la extensión de los datos y alguna información estadística sobre la estructura de los datos debería explicarse para facilitar el seguimiento de los lectores y evitar las preguntas mencionadas. La estandarización previa a la fase de análisis es necesaria cuando surgen diferencias de escala en un conjunto de datos (Demirel et al. 2008; Everitt 1993; Gnanadesikan et al.1995; Milligan y Cooper 1988).
2. Los autores aplicaron varios algoritmos a sus datos y razonaron la siguiente afirmación "la falta de un único algoritmo de agrupación adecuado". Sin embargo, la mayoría de los algoritmos ya han sido probados en la literatura y las deficiencias relevantes se recogen en muchos libros de texto (Bacher 2002; Everitt 1993).
Recursos
-
Formatopdf
-
Idioma:inglés
-
Tamaño:514 kb