Algoritmos rápidos para computar estimadores robustos

El método más comunmente usado para estimar los coeficientes de una regresión lineal es el de mínimos cuadrados. Este método que es óptimo en el caso de errores distribuídos normalmente, es muy sensible a la presencia de outliers. Para remediar ese problema se han desarrollado otros métodos de estim...

Descripción completa

Guardado en:
Detalles Bibliográficos
Autor principal: Ambrosio, Beatriz
Otros Autores: Yohai, Victor
Formato: Tesis de maestría publishedVersion
Lenguaje:Español
Publicado: Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales 2004
Acceso en línea:https://hdl.handle.net/20.500.12110/tesis_n3765_Ambrosio
https://repositoriouba.sisbi.uba.ar/gsdl/cgi-bin/library.cgi?a=d&c=aextesis&d=tesis_n3765_Ambrosio_oai
Aporte de:
id I28-R145-tesis_n3765_Ambrosio_oai
record_format dspace
institution Universidad de Buenos Aires
institution_str I-28
repository_str R-145
collection Repositorio Digital de la Universidad de Buenos Aires (UBA)
language Español
orig_language_str_mv spa
description El método más comunmente usado para estimar los coeficientes de una regresión lineal es el de mínimos cuadrados. Este método que es óptimo en el caso de errores distribuídos normalmente, es muy sensible a la presencia de outliers. Para remediar ese problema se han desarrollado otros métodos de estimación llamados métodos robustos, los cuales se ven poco afectados por la presencia de datos atípicos. Una medida de la robustez de un estimador es su punto de ruptura. Entre los estimadores de regresión robustos se encuentran los LTS, LMS y los S estimadores. Estos estimadores son equivariantes por transformaciones afines, de regresión, y de escala y además tiene un alto punto de ruptura. El inconveniente que presenta su calculo es que requiere muchas horas de computadora. Rouseeuw y Van Driessen desarrollaron un algoritmo, llamado Fast -LTS, que mejora la velocidad de cálculo del estimador de mínimos cuadrados podados. El objetivo de este trabajo es desarrollar un nuevo algoritmo, análogo al Fast-LTS, para computar S estimadores. Del mismo modo que el algoritmo desarrollado por Rouseeuw, este nuevo algoritmo está basado en el mejoramiento local de los nuevos estimadores iniciales. Esto permite una significativa reducción del número de candidatos requeridos para obtener una buena aproximación de la solución óptima. Se ha realizado un estudio de simulación que ha mostrado que los S estimadores calculados con el algoritmo Fast-S, son comparativamente mejores a los estimadores LTS calculados con el algoritmo Fast-LTS. Algunas de las ventajas del nuevo algoritmo son: 1) Menor porcentaje de muestras afectadas por los datos atípicos. 2) Menor error cuadrático medio. 3) Menor tiempo de cómputo.
author2 Yohai, Victor
author_facet Yohai, Victor
Ambrosio, Beatriz
format Tesis de maestría
Tesis de maestría
publishedVersion
author Ambrosio, Beatriz
spellingShingle Ambrosio, Beatriz
Algoritmos rápidos para computar estimadores robustos
author_sort Ambrosio, Beatriz
title Algoritmos rápidos para computar estimadores robustos
title_short Algoritmos rápidos para computar estimadores robustos
title_full Algoritmos rápidos para computar estimadores robustos
title_fullStr Algoritmos rápidos para computar estimadores robustos
title_full_unstemmed Algoritmos rápidos para computar estimadores robustos
title_sort algoritmos rápidos para computar estimadores robustos
publisher Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales
publishDate 2004
url https://hdl.handle.net/20.500.12110/tesis_n3765_Ambrosio
https://repositoriouba.sisbi.uba.ar/gsdl/cgi-bin/library.cgi?a=d&c=aextesis&d=tesis_n3765_Ambrosio_oai
work_keys_str_mv AT ambrosiobeatriz algoritmosrapidosparacomputarestimadoresrobustos
_version_ 1824354976547209216
spelling I28-R145-tesis_n3765_Ambrosio_oai2024-09-02 Yohai, Victor Ambrosio, Beatriz 2004 El método más comunmente usado para estimar los coeficientes de una regresión lineal es el de mínimos cuadrados. Este método que es óptimo en el caso de errores distribuídos normalmente, es muy sensible a la presencia de outliers. Para remediar ese problema se han desarrollado otros métodos de estimación llamados métodos robustos, los cuales se ven poco afectados por la presencia de datos atípicos. Una medida de la robustez de un estimador es su punto de ruptura. Entre los estimadores de regresión robustos se encuentran los LTS, LMS y los S estimadores. Estos estimadores son equivariantes por transformaciones afines, de regresión, y de escala y además tiene un alto punto de ruptura. El inconveniente que presenta su calculo es que requiere muchas horas de computadora. Rouseeuw y Van Driessen desarrollaron un algoritmo, llamado Fast -LTS, que mejora la velocidad de cálculo del estimador de mínimos cuadrados podados. El objetivo de este trabajo es desarrollar un nuevo algoritmo, análogo al Fast-LTS, para computar S estimadores. Del mismo modo que el algoritmo desarrollado por Rouseeuw, este nuevo algoritmo está basado en el mejoramiento local de los nuevos estimadores iniciales. Esto permite una significativa reducción del número de candidatos requeridos para obtener una buena aproximación de la solución óptima. Se ha realizado un estudio de simulación que ha mostrado que los S estimadores calculados con el algoritmo Fast-S, son comparativamente mejores a los estimadores LTS calculados con el algoritmo Fast-LTS. Algunas de las ventajas del nuevo algoritmo son: 1) Menor porcentaje de muestras afectadas por los datos atípicos. 2) Menor error cuadrático medio. 3) Menor tiempo de cómputo. Regression analysis is an important statistical tool that is applied in most sciences. The purpose of regression analysis is to fit equations to observed variables. The most commonly regression technique is the least squares method, generally adopted because of tradition and easier computation. However these method is very sensitive to the presence of atypical points in the sample. An observation is an atypical point or outlier if it does not follow the model. To remedy this problem the robust mothods have been developed that are not so easuly affected by outliers. One mesure of robustness of an estimate is its breakdown point. Heuristically, the breakdown point is the minimun fraction of arbitrary outliers that can take the estimate beyond any limit. The breakdown point as an asymptotic concept has been introduced by Hampel (1971). Donoho and Huber (1983) gave the corresponding finite sample notion. A desirable property for regression estimates is that the estimate be equivariant with respect to affine, regression and scale transformations. Estimates are computationally expensive, and the corresponding algorithms become unfasible for moderately large number of regressors. In this thesis we propose an algorithm for computing S-estimates, analogous to the algorithm of Rousseeuw and Van Driessen (Fast-LTS) to improve the computational speed of the LTS-estimate. The new algorithm, that we call "fast-S", is based on a "local improvement" step of the re-sampling initial candidates. This allows a substantial reduction of the number of candidates requiered to obtain a good approximation to the optimal solution. We performed a simulation study wich shows that S-estimators computed with the fast-S algorithm compare favourably to the LTS estimator computed with the fast-LTS algorithm. Fil: Ambrosio, Beatriz. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina. application/pdf https://hdl.handle.net/20.500.12110/tesis_n3765_Ambrosio spa Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales info:eu-repo/semantics/openAccess https://creativecommons.org/licenses/by-nc-sa/2.5/ar Algoritmos rápidos para computar estimadores robustos info:eu-repo/semantics/masterThesis info:ar-repo/semantics/tesis de maestría info:eu-repo/semantics/publishedVersion https://repositoriouba.sisbi.uba.ar/gsdl/cgi-bin/library.cgi?a=d&c=aextesis&d=tesis_n3765_Ambrosio_oai