Contribuciones a la metodología para estimar efectos causales en estudios longitudinales observacionales.

Esta tesis contribuye a la estimación de efectos causales de tratamientos variantes en el tiempo en presencia de variables confusoras variantes en el tiempo que se ven afectadas por el tratamiento recibido en el pasado. La tesis consta de dos capítulos. El primer capítulo contribuye a la estimación...

Descripción completa

Guardado en:
Detalles Bibliográficos
Autor principal: Babino, Lucía
Formato: Tesis Doctoral
Lenguaje:Inglés
Publicado: 2019
Materias:
Acceso en línea:https://hdl.handle.net/20.500.12110/tesis_n6884_Babino
Aporte de:
id todo:tesis_n6884_Babino
record_format dspace
institution Universidad de Buenos Aires
institution_str I-28
repository_str R-134
collection Biblioteca Digital - Facultad de Ciencias Exactas y Naturales (UBA)
language Inglés
orig_language_str_mv Inglés
topic MODELOS COMPATIBLES
MODELOS MARGINALES ESTRUCTURALES PARA LA MEDIA
ESTIMACION DOBLE ROBUSTA
ESTIMACION MULTIPLE ROBUSTA
G-FORMULA
ESTIMACION NO PARAMETRICA
COMPATIBLE MODELS
MARGINAL STRUCTURAL MEAN MODELS
DOUBLY ROBUST ESTIMATION
MULTIPLY ROBUST ESTIMATION
G-FORMULA
NON-PARAMETRIC ESTIMATION
spellingShingle MODELOS COMPATIBLES
MODELOS MARGINALES ESTRUCTURALES PARA LA MEDIA
ESTIMACION DOBLE ROBUSTA
ESTIMACION MULTIPLE ROBUSTA
G-FORMULA
ESTIMACION NO PARAMETRICA
COMPATIBLE MODELS
MARGINAL STRUCTURAL MEAN MODELS
DOUBLY ROBUST ESTIMATION
MULTIPLY ROBUST ESTIMATION
G-FORMULA
NON-PARAMETRIC ESTIMATION
Babino, Lucía
Contribuciones a la metodología para estimar efectos causales en estudios longitudinales observacionales.
topic_facet MODELOS COMPATIBLES
MODELOS MARGINALES ESTRUCTURALES PARA LA MEDIA
ESTIMACION DOBLE ROBUSTA
ESTIMACION MULTIPLE ROBUSTA
G-FORMULA
ESTIMACION NO PARAMETRICA
COMPATIBLE MODELS
MARGINAL STRUCTURAL MEAN MODELS
DOUBLY ROBUST ESTIMATION
MULTIPLY ROBUST ESTIMATION
G-FORMULA
NON-PARAMETRIC ESTIMATION
description Esta tesis contribuye a la estimación de efectos causales de tratamientos variantes en el tiempo en presencia de variables confusoras variantes en el tiempo que se ven afectadas por el tratamiento recibido en el pasado. La tesis consta de dos capítulos. El primer capítulo contribuye a la estimación múltiple robusta paramétrica de modelos estructurales marginales. Específicamente, hacemos propuestas de estimación, en base a datos recogidos de estudios longitudinales observacionales, de los parámetros de los modelos marginales estructurales para la media (MMEM) para variables de respuesta no acotadas. Actualmente, los métodos populares utilizados en las aplicaciones para estimar los parámetros de los MMEM incluyen a los estimadores ”inverse probability of treatment weighted” y a los estimadores paramétricos doble robustos (DR). Bajo la metodología paramétrica DR, el investigador postula una secuencia de modelos de trabajo paramétricos, un modelo para la media de la variable de respuesta contrafactual dado el historial de covariables y tratamientos hasta cada instante de tiempo de exposición (que, a lo largo de este resumen, denominamos media contrafactual del instante de tiempo específico) y otra secuencia de modelos de trabajo, un modelo para la probabilidad de tratamiento en cada instante de tiempo condicional a los tratamientos y las covariables del pasado que, a lo largo de este resumen, denominamos probabilidad de tratamiento del instante de tiempo específico. Los estimadores DR de los parámetros de los MMEM son consistentes y asintóticamente normales siempre y cuando o bien la secuencia de modelos de trabajo para las medias contrafactuales de cada instante de tiempo específico sea correcta o bien la secuencia de modelos para las probabilidades de tratamiento sea correcta, pero no necesariamente ambas secuencias de modelos sean correctas. Una dificultad con la estimación DR paramétrica es que la mayoría de los modelos naturales para las medias contrafactuales de cada instante de tiempo específico son usualmente incompatibles. Robins, Rotnitzky y Scharfstein (2000) propusieron una parametrización de la verosimilitud que implica modelos paramétricos compatibles para dichas medias. Esta parametrización no se ha explotado para construir estimadores DR y uno de los objetivos del primer capítulo es llenar este vacío. M ́as importante a ́un, al explotar esta parametrización, proponemos un estimador múltiple robusto (MR) de los parámetros de un MMEM que otorga una protección aún mayor contra la especificación errónea de los modelos que los estimadores DR, ya que el estimador tiene la propiedad múltiple robusta de ser consistente y asintóticamente normal siempre y cuando, en cada instante de tiempo, o bien el modelo de trabajo para la media contrafactual o bien el modelo de trabajo para la probabilidad de tratamiento sea correcto, pero no necesariamente ambos lo sean. Nuestros métodos son de fácil implementación ya que se basan en el ajuste iterativo de una secuencia de regresiones ponderadas. El segundo capítulo explora y contrasta los méritos relativos de los estimadores no paramétricos doble y múltiple robustos de la media de una variable de respuesta contrafactual medida al final de un estudio longitudinal. Cuando hablamos de estimador no paramétrico doble robusto (o múltiple robusto) nos referimos a uno que se calcula siguiendo un procedimiento que produciría un estimador con la propiedad doble (o múltiple) robusta si las medias contrafactuales y las probabilidades de tratamiento de cada tiempo específico se hubieran estimado a tasas paramétricas, pero en el que estas funciones desconocidas se estiman de manera no paramétrica utilizando, por ejemplo, estimación por series, núcleo, spline o, más generalmente, cualquier estimador de aprendizaje automático. Las contribuciones centrales de este capítulo son (1) la derivación de expresiones novedosas para el sesgo asintótico de los estimadores DR y MR no paramétricos y (2) el cálculo de cotas para las tasas de convergencia de estos sesgos cuando asumimos que las medias contrafactuales y las probabilidades de tratamiento desconocidas pertenecen a bolas Hölder y son estimadas mediante estimación por series. Nuestros análisis sugieren que, en lo que respecta a conseguir estimadores √n−consistentes de la media contrafactual al final del estudio, nunca es contraproducente y, bajo algunos procesos de generación de datos, es preferible realizar estimación MR no paramétrica que realizar estimación DR.
format Tesis Doctoral
author Babino, Lucía
author_facet Babino, Lucía
author_sort Babino, Lucía
title Contribuciones a la metodología para estimar efectos causales en estudios longitudinales observacionales.
title_short Contribuciones a la metodología para estimar efectos causales en estudios longitudinales observacionales.
title_full Contribuciones a la metodología para estimar efectos causales en estudios longitudinales observacionales.
title_fullStr Contribuciones a la metodología para estimar efectos causales en estudios longitudinales observacionales.
title_full_unstemmed Contribuciones a la metodología para estimar efectos causales en estudios longitudinales observacionales.
title_sort contribuciones a la metodología para estimar efectos causales en estudios longitudinales observacionales.
publishDate 2019
url https://hdl.handle.net/20.500.12110/tesis_n6884_Babino
work_keys_str_mv AT babinolucia contribucionesalametodologiaparaestimarefectoscausalesenestudioslongitudinalesobservacionales
AT babinolucia contributionstomethodsforestimatingcausaleffectsfromlongitudinalobservationalstudies
_version_ 1782026722042970112
spelling todo:tesis_n6884_Babino2023-10-03T13:13:52Z Contribuciones a la metodología para estimar efectos causales en estudios longitudinales observacionales. Contributions to methods for estimating causal effects from longitudinal observational studies. Babino, Lucía MODELOS COMPATIBLES MODELOS MARGINALES ESTRUCTURALES PARA LA MEDIA ESTIMACION DOBLE ROBUSTA ESTIMACION MULTIPLE ROBUSTA G-FORMULA ESTIMACION NO PARAMETRICA COMPATIBLE MODELS MARGINAL STRUCTURAL MEAN MODELS DOUBLY ROBUST ESTIMATION MULTIPLY ROBUST ESTIMATION G-FORMULA NON-PARAMETRIC ESTIMATION Esta tesis contribuye a la estimación de efectos causales de tratamientos variantes en el tiempo en presencia de variables confusoras variantes en el tiempo que se ven afectadas por el tratamiento recibido en el pasado. La tesis consta de dos capítulos. El primer capítulo contribuye a la estimación múltiple robusta paramétrica de modelos estructurales marginales. Específicamente, hacemos propuestas de estimación, en base a datos recogidos de estudios longitudinales observacionales, de los parámetros de los modelos marginales estructurales para la media (MMEM) para variables de respuesta no acotadas. Actualmente, los métodos populares utilizados en las aplicaciones para estimar los parámetros de los MMEM incluyen a los estimadores ”inverse probability of treatment weighted” y a los estimadores paramétricos doble robustos (DR). Bajo la metodología paramétrica DR, el investigador postula una secuencia de modelos de trabajo paramétricos, un modelo para la media de la variable de respuesta contrafactual dado el historial de covariables y tratamientos hasta cada instante de tiempo de exposición (que, a lo largo de este resumen, denominamos media contrafactual del instante de tiempo específico) y otra secuencia de modelos de trabajo, un modelo para la probabilidad de tratamiento en cada instante de tiempo condicional a los tratamientos y las covariables del pasado que, a lo largo de este resumen, denominamos probabilidad de tratamiento del instante de tiempo específico. Los estimadores DR de los parámetros de los MMEM son consistentes y asintóticamente normales siempre y cuando o bien la secuencia de modelos de trabajo para las medias contrafactuales de cada instante de tiempo específico sea correcta o bien la secuencia de modelos para las probabilidades de tratamiento sea correcta, pero no necesariamente ambas secuencias de modelos sean correctas. Una dificultad con la estimación DR paramétrica es que la mayoría de los modelos naturales para las medias contrafactuales de cada instante de tiempo específico son usualmente incompatibles. Robins, Rotnitzky y Scharfstein (2000) propusieron una parametrización de la verosimilitud que implica modelos paramétricos compatibles para dichas medias. Esta parametrización no se ha explotado para construir estimadores DR y uno de los objetivos del primer capítulo es llenar este vacío. M ́as importante a ́un, al explotar esta parametrización, proponemos un estimador múltiple robusto (MR) de los parámetros de un MMEM que otorga una protección aún mayor contra la especificación errónea de los modelos que los estimadores DR, ya que el estimador tiene la propiedad múltiple robusta de ser consistente y asintóticamente normal siempre y cuando, en cada instante de tiempo, o bien el modelo de trabajo para la media contrafactual o bien el modelo de trabajo para la probabilidad de tratamiento sea correcto, pero no necesariamente ambos lo sean. Nuestros métodos son de fácil implementación ya que se basan en el ajuste iterativo de una secuencia de regresiones ponderadas. El segundo capítulo explora y contrasta los méritos relativos de los estimadores no paramétricos doble y múltiple robustos de la media de una variable de respuesta contrafactual medida al final de un estudio longitudinal. Cuando hablamos de estimador no paramétrico doble robusto (o múltiple robusto) nos referimos a uno que se calcula siguiendo un procedimiento que produciría un estimador con la propiedad doble (o múltiple) robusta si las medias contrafactuales y las probabilidades de tratamiento de cada tiempo específico se hubieran estimado a tasas paramétricas, pero en el que estas funciones desconocidas se estiman de manera no paramétrica utilizando, por ejemplo, estimación por series, núcleo, spline o, más generalmente, cualquier estimador de aprendizaje automático. Las contribuciones centrales de este capítulo son (1) la derivación de expresiones novedosas para el sesgo asintótico de los estimadores DR y MR no paramétricos y (2) el cálculo de cotas para las tasas de convergencia de estos sesgos cuando asumimos que las medias contrafactuales y las probabilidades de tratamiento desconocidas pertenecen a bolas Hölder y son estimadas mediante estimación por series. Nuestros análisis sugieren que, en lo que respecta a conseguir estimadores √n−consistentes de la media contrafactual al final del estudio, nunca es contraproducente y, bajo algunos procesos de generación de datos, es preferible realizar estimación MR no paramétrica que realizar estimación DR. This thesis makes contributions to the estimation of causal effects of time-dependent exposures in the presence of time-dependent confounders that are themselves affected by previous treatments. The thesis is comprised of two chapters. The first chapter makes contributions to the parametric multiple robust estimation of marginal structural models. Specifically, we consider estimation, from longitudinal observational data, of the parameters of marginal structural mean models (MSMM) for unconstrained outcomes. Currently popular methods used in applications for estimating parameters of MSMM include inverse probability of treatment weighted and parametric doubly robust (DR) estimators. Under the parametric DR methodology the investigator postulates a sequence of parametric working models, one model for the mean of the counterfactual outcome given the covariate and treatment history up to each exposure time point -throughout this abstract referred to as the time specific counterfactual mean- and another sequence of working models, one model for the conditional probability of treatment at each time given past treatments and covariates -throughout referred to as the time specific propensity score-. The DR estimators of the parameters of MSMM have the doubly robust property that they are consistent and asymptotically normal so long the sequence of working models for the time specific counterfactual means are correct or the sequence of models for the propensity scores are correct, but not necessarily both sequences of models are correct. A difficulty with parametric DR estimation is that most natural models for the time specific counterfactual means are often incompatible. Robins, Rotnitzky and Scharfstein (2000) proposed a parameterization of the likelihood which implies compatible parametric models for such means. Their parameterization has not been exploited to construct DR estimators and one goal of the first chapter is to fill this gap. More importantly, exploiting this parameterization we propose a multiple robust (MR) estimator of the parameters of a MSMM that confers even more protection against model misspecification than DR estimators in that the estimator has the multiple robust property that it is consistent and asymptotically normal so long at each time, either the working model for the counterfactual mean or the working model for the propensity score is correct, but not necessarily both. Our methods are easy to implement as they are based on the iterative fit of a sequence of weighted regressions. The second chapter explores and contrasts the relative merits of non-parametric doubly and multiply robust estimators of the mean of a counterfactual outcome measured at the end of a longitudinal study. By a non-parametric doubly robust (multiply robust) estimator we mean one that is computed following a procedure which would yield an estimator with the double (multiple) robust property if the time specific counterfactual means and the time specific propensity scores had been estimated at parametric rates, but in which these unknowns functions are instead estimated non-parametrically, e.g. using series, kernel, spline or more generally arbitrary machine learning estimators. The key contributions of this chapter are (1) the derivation of novel expressions for the asymptotic bias of the non-parametric DR and MR estimators and (2) the calculation of bounds on the rates of convergence of these biases when the unknown time specific counterfactual means and propensity scores are assumed to belong to Hölder balls and are estimated by series estimation. Our analyses suggest that as far as achieving √n−consistent estimators of the counterfactual mean at the end of the study is concerned, it never hurts and, under some data generating processes, it sometimes helps to conduct non-parametric MR estimation as opposed to non-parametric DR estimation. Fil: Babino, Lucía. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina. 2019 Tesis Doctoral PDF Inglés info:eu-repo/semantics/openAccess https://creativecommons.org/licenses/by-nc-sa/2.5/ar https://hdl.handle.net/20.500.12110/tesis_n6884_Babino