Comparación de algunos métodos para estimar el modelo de riesgos proporcionales de Cox para datos con censura a intervalo
Comparison of some methods for estimating the Cox proportional hazards model for interval censored data
Los datos con censura a intervalo son comunes en varias áreas del conocimiento, tales como: epidemiología, finanzas, demografía, medicina, entre otras. Ocurren cuando el evento de interés, el tiempo de falla, no se observa exactamente, sino que se encuentra dentro de algún intervalo del tiempo de observación. Con frecuencia en esta situación se realiza una imputación de los datos que no se conocen exactamente. Algunos de los métodos de imputación múltiple propuestos en la literatura son el algoritmo PMDA (Poor Man’s Data Augmentation) y el algoritmo ANDA (Asymptotic Normal Data Augmentation), los cuales permiten estimar los parámetros del modelo de riesgos proporcionales de Cox utilizando métodos clásicos de estimación. También existen métodos alternativos para realizar estas estimaciones, como el algoritmo ICM (Iterative Convex Minorant) y un enfoque Bayesiano, que no realizan imputación de los datos con censura a intervalo.
En este trabajo se realizó una comparación vía simulación del desempeño de los estimadores de los parámetros del modelo de Cox producidos por cada uno de los métodos anteriormente mencionados. Los resultados evidenciaron que en términos generales los métodos ICM y el enfoque Bayesiano presentan valores de probabilidad de cobertura más altos y errores cuadráticos medios más bajos, además al aumentar el tamaño de la muestra estos valores mejoran notablemente comparados con los métodos PMDA y ANDA. En estos últimos no se evidenciaron diferencias considerables entre los resultados. Finalmente, se realizó una aplicación con datos reales asociados a un estudio de mastitis en ganado lechero.
1. INTRODUCCIÓN
Los datos con censura a intervalo ocurren comúnmente en muchos campos, tales como: demografía, epidemiología y estudios médicos. En tales estudios, los participantes se someten periódicamente a observaciones o exámenes y los tiempos de falla no son observados exactamente, pero se conoce que se encuentran dentro de algún intervalo [1]. Esto último es un problema ya que convencionalmente se ha usado el límite inferior, el punto medio o el límite superior del intervalo de inspección como tiempo de falla, esto es conocido en la literatura como imputación simple y ha sido bastante utilizado por su simpleza frente a otros métodos [2]. Sin embargo, estos métodos presentan problemas de sesgo de los estimadores de la función de supervivencia, especialmente cuando los intervalos son de gran tamaño, o son de diferentes longitudes [3, 4]. El uso de los métodos de imputación múltiple incorporando variables auxiliares, es decir, información auxiliar acerca del tiempo de falla para las observaciones con censura a intervalo, pueden mejorar la eficiencia de los estimadores y reducir el efecto de visitas perdidas en comparación con enfoques más simples [3].
Algunos métodos de imputación múltiple para estimar el modelo de riesgos proporcionales de Cox para datos con censura a intervalo fueron estudiados inicialmente por [5], donde proponen los algoritmos denominados PMDA (Poor Man´s Data Augmentation) y ANDA (Asymptotic Normal Data Augmentation) para datos con censura a intervalo, basados en imputación múltiple para el modelo de regresión de Cox, y demostró que los resultados de las estimaciones de los coeficientes de regresión y el error estándar asociado suministra una alternativa prometedora para el estimador de máxima verosimilitud no paramétrico (NPMLE).
Recursos
-
Formatopdf
-
Idioma:español
-
Tamaño:552 kb