Escalado multidimensional métrico en problemas con grandes datos
En este trabajo describimos y aplicamos métodos de escalado multidimensional (MDS) para muestras con gran cantidad de datos. El escalado multidimensional es un conjunto de técnicas de representación de objetos basadas en las distancias, similaridades o disimilaridades entre ellos. Estos métodos tien...
Autor principal: | |
---|---|
Otros Autores: | |
Formato: | Tesis de maestría publishedVersion |
Lenguaje: | Español |
Publicado: |
Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales
2023
|
Materias: | |
Acceso en línea: | https://hdl.handle.net/20.500.12110/tesis_n7398_CosattoAmmann https://repositoriouba.sisbi.uba.ar/gsdl/cgi-bin/library.cgi?a=d&c=aextesis&d=tesis_n7398_CosattoAmmann_oai |
Aporte de: |
id |
I28-R145-tesis_n7398_CosattoAmmann_oai |
---|---|
record_format |
dspace |
spelling |
I28-R145-tesis_n7398_CosattoAmmann_oai2024-09-02 Rodríguez, Daniela Andrea Cosatto Ammann, Pedro Camilo 2023-07-31 En este trabajo describimos y aplicamos métodos de escalado multidimensional (MDS) para muestras con gran cantidad de datos. El escalado multidimensional es un conjunto de técnicas de representación de objetos basadas en las distancias, similaridades o disimilaridades entre ellos. Estos métodos tienen severas limitaciones cuando el tamaño de la muestra aumenta, debido a las dificultades de cómputo. Analizamos tres algoritmos distintos para sortear este problema: dos de ellos basados en la idea de división y conquista, y uno de ellos basado en un método de interpolación. Luego, aplicamos uno de ellos a un problema de agrupamiento. Los métodos estudiados logran reproducir con gran exactitud y precisión la solución que se obtendría con los métodos clásicos, aunque se descubrieron algunos aspectos a mejorar, especialmente con la aparición de datos atípicos. Por lo realizado en el problema de aplicación, creemos que estas variantes aportan ventajas al MDS como método de reducción de la dimensión, poniéndolo al mismo nivel que otras técnicas comúnmente usadas en el tratamiento de muestras grandes, como el análisis de Componentes Principales o t-SNE. In this work, we describe and apply multidimensional scaling (MDS) methods with large samples. Multidimensional scaling is a set of object representation techniques based on distances, similarities, or dissimilarities between them. These methods have severe limitations when the sample size increases, due to computational difficulties. We analyze three different algorithms to overcome this problem: two of them based on the idea of ’divide and conquer’, and one of them based on an interpolation method. Then, we apply one of them to a clustering problem. The studied methods accurately and precisely reproduce the solution that would be obtained with classic methods, although some aspects to improve were discovered, especially with the appearance of outliers. Based on the application problem, we believe that these variants provide advantages to MDS as a dimension reduction method, putting it at the same level as other techniques commonly used in the treatment of large samples, such as Principal Component Analysis or t-SNE. Fil: Cosatto Ammann, Pedro Camilo. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina. application/pdf https://hdl.handle.net/20.500.12110/tesis_n7398_CosattoAmmann spa Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales info:eu-repo/semantics/openAccess https://creativecommons.org/licenses/by-nc-sa/2.5/ar ESCALADO MULTIDIMENSIONAL ESCALADO CLASICO GRANDES DATOS REDUCCION DE LA DIMENSION TRANSFORMACIONES DE PROCRUSTES INTERPOLACION APRENDIZAJE NO SUPERVISADO MULTIDIMENSIONAL SCALING CLASSICAL SCALING BIG DATA DIMENSIONALITY REDUCCION PROCRSUTES TRANSFORMATIONS INTERPOLATION UNSUPERVISED LEARNING Escalado multidimensional métrico en problemas con grandes datos Multidimensional scaling in big data info:eu-repo/semantics/masterThesis info:ar-repo/semantics/tesis de maestría info:eu-repo/semantics/publishedVersion https://repositoriouba.sisbi.uba.ar/gsdl/cgi-bin/library.cgi?a=d&c=aextesis&d=tesis_n7398_CosattoAmmann_oai |
institution |
Universidad de Buenos Aires |
institution_str |
I-28 |
repository_str |
R-145 |
collection |
Repositorio Digital de la Universidad de Buenos Aires (UBA) |
language |
Español |
orig_language_str_mv |
spa |
topic |
ESCALADO MULTIDIMENSIONAL ESCALADO CLASICO GRANDES DATOS REDUCCION DE LA DIMENSION TRANSFORMACIONES DE PROCRUSTES INTERPOLACION APRENDIZAJE NO SUPERVISADO MULTIDIMENSIONAL SCALING CLASSICAL SCALING BIG DATA DIMENSIONALITY REDUCCION PROCRSUTES TRANSFORMATIONS INTERPOLATION UNSUPERVISED LEARNING |
spellingShingle |
ESCALADO MULTIDIMENSIONAL ESCALADO CLASICO GRANDES DATOS REDUCCION DE LA DIMENSION TRANSFORMACIONES DE PROCRUSTES INTERPOLACION APRENDIZAJE NO SUPERVISADO MULTIDIMENSIONAL SCALING CLASSICAL SCALING BIG DATA DIMENSIONALITY REDUCCION PROCRSUTES TRANSFORMATIONS INTERPOLATION UNSUPERVISED LEARNING Cosatto Ammann, Pedro Camilo Escalado multidimensional métrico en problemas con grandes datos |
topic_facet |
ESCALADO MULTIDIMENSIONAL ESCALADO CLASICO GRANDES DATOS REDUCCION DE LA DIMENSION TRANSFORMACIONES DE PROCRUSTES INTERPOLACION APRENDIZAJE NO SUPERVISADO MULTIDIMENSIONAL SCALING CLASSICAL SCALING BIG DATA DIMENSIONALITY REDUCCION PROCRSUTES TRANSFORMATIONS INTERPOLATION UNSUPERVISED LEARNING |
description |
En este trabajo describimos y aplicamos métodos de escalado multidimensional (MDS) para muestras con gran cantidad de datos. El escalado multidimensional es un conjunto de técnicas de representación de objetos basadas en las distancias, similaridades o disimilaridades entre ellos. Estos métodos tienen severas limitaciones cuando el tamaño de la muestra aumenta, debido a las dificultades de cómputo. Analizamos tres algoritmos distintos para sortear este problema: dos de ellos basados en la idea de división y conquista, y uno de ellos basado en un método de interpolación. Luego, aplicamos uno de ellos a un problema de agrupamiento. Los métodos estudiados logran reproducir con gran exactitud y precisión la solución que se obtendría con los métodos clásicos, aunque se descubrieron algunos aspectos a mejorar, especialmente con la aparición de datos atípicos. Por lo realizado en el problema de aplicación, creemos que estas variantes aportan ventajas al MDS como método de reducción de la dimensión, poniéndolo al mismo nivel que otras técnicas comúnmente usadas en el tratamiento de muestras grandes, como el análisis de Componentes Principales o t-SNE. |
author2 |
Rodríguez, Daniela Andrea |
author_facet |
Rodríguez, Daniela Andrea Cosatto Ammann, Pedro Camilo |
format |
Tesis de maestría Tesis de maestría publishedVersion |
author |
Cosatto Ammann, Pedro Camilo |
author_sort |
Cosatto Ammann, Pedro Camilo |
title |
Escalado multidimensional métrico en problemas con grandes datos |
title_short |
Escalado multidimensional métrico en problemas con grandes datos |
title_full |
Escalado multidimensional métrico en problemas con grandes datos |
title_fullStr |
Escalado multidimensional métrico en problemas con grandes datos |
title_full_unstemmed |
Escalado multidimensional métrico en problemas con grandes datos |
title_sort |
escalado multidimensional métrico en problemas con grandes datos |
publisher |
Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales |
publishDate |
2023 |
url |
https://hdl.handle.net/20.500.12110/tesis_n7398_CosattoAmmann https://repositoriouba.sisbi.uba.ar/gsdl/cgi-bin/library.cgi?a=d&c=aextesis&d=tesis_n7398_CosattoAmmann_oai |
work_keys_str_mv |
AT cosattoammannpedrocamilo escaladomultidimensionalmetricoenproblemascongrandesdatos AT cosattoammannpedrocamilo multidimensionalscalinginbigdata |
_version_ |
1824354897329389568 |