Estimación robusta en modelos de regresión funcional

La mayoría de los procedimientos estadísticos clásicos están basados en modelos con hipótesis rígidas, tales como errores normales u observaciones equidistribuídas, entre otros. Bajo estas hipótesis, se deducen procedimientos óptimos. Sin embargo, estos métodos son muy sensibles al incumplimiento de...

Descripción completa

Guardado en:
Detalles Bibliográficos
Autor principal: Parada, Daniela Laura
Formato: Tesis de Maestría
Lenguaje:Español
Publicado: Marz
Materias:
Acceso en línea:https://hdl.handle.net/20.500.12110/tesis_n7298_Parada
Aporte de:
id todo:tesis_n7298_Parada
record_format dspace
institution Universidad de Buenos Aires
institution_str I-28
repository_str R-134
collection Biblioteca Digital - Facultad de Ciencias Exactas y Naturales (UBA)
language Español
orig_language_str_mv Español
topic DATOS FUNCIONALES
MODELO DE REGRESION FUNCIONAL
ESTIMACION ROBUSTA
DIRECCIONES PRINCIPALES ESFERICAS
MM-ESTIMADORES
FUNCTIONAL DATA
FUNCTIONAL REGRESSION MODEL
ROBUST ESTIMATION
SPHERICAL PRINCIPALCOMPONENTS
MM-ESTIMATORS
spellingShingle DATOS FUNCIONALES
MODELO DE REGRESION FUNCIONAL
ESTIMACION ROBUSTA
DIRECCIONES PRINCIPALES ESFERICAS
MM-ESTIMADORES
FUNCTIONAL DATA
FUNCTIONAL REGRESSION MODEL
ROBUST ESTIMATION
SPHERICAL PRINCIPALCOMPONENTS
MM-ESTIMATORS
Parada, Daniela Laura
Estimación robusta en modelos de regresión funcional
topic_facet DATOS FUNCIONALES
MODELO DE REGRESION FUNCIONAL
ESTIMACION ROBUSTA
DIRECCIONES PRINCIPALES ESFERICAS
MM-ESTIMADORES
FUNCTIONAL DATA
FUNCTIONAL REGRESSION MODEL
ROBUST ESTIMATION
SPHERICAL PRINCIPALCOMPONENTS
MM-ESTIMATORS
description La mayoría de los procedimientos estadísticos clásicos están basados en modelos con hipótesis rígidas, tales como errores normales u observaciones equidistribuídas, entre otros. Bajo estas hipótesis, se deducen procedimientos óptimos. Sin embargo, estos métodos son muy sensibles al incumplimiento de las hipótesis que los generaron. Los métodos estadísticos robustos tienen como objetivo permitir inferencias válidas cuando el modelo no se cumple exactamente y, al mismo tiempo, ser altamente eficientes bajo el modelo central. Por otra parte y en muchas aplicaciones, los datos observados provienen de fenómenos que son continuos en el tiempo o en el espacio y que pueden ser supuestos como curvas o funciones suaves más que como vectores de dimensión finita. El análisis de datos funcionales ha recibido considerable atención por su versatilidad en estos contextos. Cabe mencionar que el análisis de este tipo de datos requiere herramientas propias ya que, en muchas ocasiones, las extensiones naturales de las técnicas estadísticas multivariadas usuales no son adecuadas. El objetivo de esta tesis de maestría es hacer una revisión bibliográfica del tema, en particular, de los procedimientos existentes para estimar los parámetros en un modelo regresión funcional cuando las covariables son funcionales y cumplen un modelo lineal o cuadrático, a la vez que proponer estimadores robustos de los parámetros involucrados. En particular, se considera el modelo cuadrático dado en Yao y Müller (2010) y en Horváth y Reeder (2013), así como sus propuestas de estimación. Como la presencia de valores atípicos en las covariables funcionales puede afectar el procedimiento de estimación cuando se utilizan las componentes principales muestrales para reducir la dimensión y estimar los parámetros de la regresión, se definen estimadores robustos para el modelo cuadrático utilizando estimadores de las direcciones principales esféricas (Locantore et al., 1999; Gervini, 2008). Más específicamente, proponemos usar estimadores robustos de las direcciones principales para generar los espacios de dimensión finita que constituyen los posibles candidatos tanto para el parámetro de regresión funcional como el operador cuadrático, para luego usar MM−estimadores de regresión (Yohai, 1987). Se analiza la sensibilidad de estos estimadores ante la presencia de distintos porcentajes de datos atípicos, tanto en los residuos como en las covariables emulando las propuestas de simulación de Yao y Müller (2010) y Boente et al. (2020). Por último, se aplican estas técnicas a dos conjuntos de datos espectrales diferentes, ambos conocidos por presentar observaciones atípicas.
format Tesis de Maestría
author Parada, Daniela Laura
author_facet Parada, Daniela Laura
author_sort Parada, Daniela Laura
title Estimación robusta en modelos de regresión funcional
title_short Estimación robusta en modelos de regresión funcional
title_full Estimación robusta en modelos de regresión funcional
title_fullStr Estimación robusta en modelos de regresión funcional
title_full_unstemmed Estimación robusta en modelos de regresión funcional
title_sort estimación robusta en modelos de regresión funcional
publishDate Marz
url https://hdl.handle.net/20.500.12110/tesis_n7298_Parada
work_keys_str_mv AT paradadanielalaura estimacionrobustaenmodelosderegresionfuncional
AT paradadanielalaura robustestimatorsforfunctionalquadraticregressionmodels
_version_ 1782029464230690816
spelling todo:tesis_n7298_Parada2023-10-03T13:17:56Z Estimación robusta en modelos de regresión funcional Robust estimators for functional quadratic regression models Parada, Daniela Laura DATOS FUNCIONALES MODELO DE REGRESION FUNCIONAL ESTIMACION ROBUSTA DIRECCIONES PRINCIPALES ESFERICAS MM-ESTIMADORES FUNCTIONAL DATA FUNCTIONAL REGRESSION MODEL ROBUST ESTIMATION SPHERICAL PRINCIPALCOMPONENTS MM-ESTIMATORS La mayoría de los procedimientos estadísticos clásicos están basados en modelos con hipótesis rígidas, tales como errores normales u observaciones equidistribuídas, entre otros. Bajo estas hipótesis, se deducen procedimientos óptimos. Sin embargo, estos métodos son muy sensibles al incumplimiento de las hipótesis que los generaron. Los métodos estadísticos robustos tienen como objetivo permitir inferencias válidas cuando el modelo no se cumple exactamente y, al mismo tiempo, ser altamente eficientes bajo el modelo central. Por otra parte y en muchas aplicaciones, los datos observados provienen de fenómenos que son continuos en el tiempo o en el espacio y que pueden ser supuestos como curvas o funciones suaves más que como vectores de dimensión finita. El análisis de datos funcionales ha recibido considerable atención por su versatilidad en estos contextos. Cabe mencionar que el análisis de este tipo de datos requiere herramientas propias ya que, en muchas ocasiones, las extensiones naturales de las técnicas estadísticas multivariadas usuales no son adecuadas. El objetivo de esta tesis de maestría es hacer una revisión bibliográfica del tema, en particular, de los procedimientos existentes para estimar los parámetros en un modelo regresión funcional cuando las covariables son funcionales y cumplen un modelo lineal o cuadrático, a la vez que proponer estimadores robustos de los parámetros involucrados. En particular, se considera el modelo cuadrático dado en Yao y Müller (2010) y en Horváth y Reeder (2013), así como sus propuestas de estimación. Como la presencia de valores atípicos en las covariables funcionales puede afectar el procedimiento de estimación cuando se utilizan las componentes principales muestrales para reducir la dimensión y estimar los parámetros de la regresión, se definen estimadores robustos para el modelo cuadrático utilizando estimadores de las direcciones principales esféricas (Locantore et al., 1999; Gervini, 2008). Más específicamente, proponemos usar estimadores robustos de las direcciones principales para generar los espacios de dimensión finita que constituyen los posibles candidatos tanto para el parámetro de regresión funcional como el operador cuadrático, para luego usar MM−estimadores de regresión (Yohai, 1987). Se analiza la sensibilidad de estos estimadores ante la presencia de distintos porcentajes de datos atípicos, tanto en los residuos como en las covariables emulando las propuestas de simulación de Yao y Müller (2010) y Boente et al. (2020). Por último, se aplican estas técnicas a dos conjuntos de datos espectrales diferentes, ambos conocidos por presentar observaciones atípicas. Most classical statistical procedures rely on models with rigid assumptions, such as normal distributed errors or equidistributed observations, among others. Under these hypotheses, optimal procedures are obtained. However, these methods are very sensitive to non–compliance with the hypotheses that generated them. Robust statistical methods aim to allow benchmarks when the model does not hold exactly being, at the same time, highly efficient under the central model. On the other hand, in many applications the observed data come from phenomena that are continuous in time or space and can be assumed to be curves or smooth functions rather than fine–dimensional vectors. Functional data analysis has received considerable attention for its versatility in these contexts. In most situations, the analysis of these type of data requires proper tools since the natural extension of the usual multivariate statistical procedures fail. The purpose of this master’s thesis is to review the existing procedures to estimate the parameters under a functional regression model, that is, when the covariates are functional. We focus our attention on the linear and quadratic models and we propose robust estimators for the parameters involved. In particular, we consider the extension of the quadratic case as in Yao y Müller (2010) and in Horváth y Reeder (2013), as well as their estimation proposals. Since the presence of outliers in the functional covariates may affect the estimation procedure when the sample principal components are used to reduce dimensionality when estimating the regression parameters, we define robust estimators for the quadratic model using the spherical principal component basis (Locantore et al., 1999; Gervini, 2008). More specifically, we consider robust estimators for the principal directions to define a basis of possible candidates for the estimators of both the functional regression parameter and the quadratic operator, and then we use MM−regression estimators (Yohai, 1987). We analyze the sensitivity and performance of these estimators in the presence of atypical data, both in the residuals and in the covariates, emulating the simulation proposals of Yao y Müller (2010) and Boente et al. (2020). Finally, we apply these procedures on two datasets of different spectral data, both known to have outliers. Fil: Parada, Daniela Laura. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina. Marzo 2023 Tesis de Maestría PDF Español info:eu-repo/semantics/openAccess https://creativecommons.org/licenses/by-nc-sa/2.5/ar https://hdl.handle.net/20.500.12110/tesis_n7298_Parada