Escalado multidimensional métrico en problemas con grandes datos

En este trabajo describimos y aplicamos métodos de escalado multidimensional (MDS) para muestras con gran cantidad de datos. El escalado multidimensional es un conjunto de técnicas de representación de objetos basadas en las distancias, similaridades o disimilaridades entre ellos. Estos métodos tien...

Descripción completa

Detalles Bibliográficos
Autor principal: Cosatto Ammann, Pedro Camilo
Otros Autores: Rodríguez, Daniela Andrea
Formato: Tesis de maestría publishedVersion
Lenguaje:Español
Publicado: Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales 2023
Materias:
Acceso en línea:https://hdl.handle.net/20.500.12110/tesis_n7398_CosattoAmmann
https://repositoriouba.sisbi.uba.ar/gsdl/cgi-bin/library.cgi?a=d&c=aextesis&d=tesis_n7398_CosattoAmmann_oai
Aporte de:
id I28-R145-tesis_n7398_CosattoAmmann_oai
record_format dspace
spelling I28-R145-tesis_n7398_CosattoAmmann_oai2024-09-02 Rodríguez, Daniela Andrea Cosatto Ammann, Pedro Camilo 2023-07-31 En este trabajo describimos y aplicamos métodos de escalado multidimensional (MDS) para muestras con gran cantidad de datos. El escalado multidimensional es un conjunto de técnicas de representación de objetos basadas en las distancias, similaridades o disimilaridades entre ellos. Estos métodos tienen severas limitaciones cuando el tamaño de la muestra aumenta, debido a las dificultades de cómputo. Analizamos tres algoritmos distintos para sortear este problema: dos de ellos basados en la idea de división y conquista, y uno de ellos basado en un método de interpolación. Luego, aplicamos uno de ellos a un problema de agrupamiento. Los métodos estudiados logran reproducir con gran exactitud y precisión la solución que se obtendría con los métodos clásicos, aunque se descubrieron algunos aspectos a mejorar, especialmente con la aparición de datos atípicos. Por lo realizado en el problema de aplicación, creemos que estas variantes aportan ventajas al MDS como método de reducción de la dimensión, poniéndolo al mismo nivel que otras técnicas comúnmente usadas en el tratamiento de muestras grandes, como el análisis de Componentes Principales o t-SNE. In this work, we describe and apply multidimensional scaling (MDS) methods with large samples. Multidimensional scaling is a set of object representation techniques based on distances, similarities, or dissimilarities between them. These methods have severe limitations when the sample size increases, due to computational difficulties. We analyze three different algorithms to overcome this problem: two of them based on the idea of ’divide and conquer’, and one of them based on an interpolation method. Then, we apply one of them to a clustering problem. The studied methods accurately and precisely reproduce the solution that would be obtained with classic methods, although some aspects to improve were discovered, especially with the appearance of outliers. Based on the application problem, we believe that these variants provide advantages to MDS as a dimension reduction method, putting it at the same level as other techniques commonly used in the treatment of large samples, such as Principal Component Analysis or t-SNE. Fil: Cosatto Ammann, Pedro Camilo. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina. application/pdf https://hdl.handle.net/20.500.12110/tesis_n7398_CosattoAmmann spa Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales info:eu-repo/semantics/openAccess https://creativecommons.org/licenses/by-nc-sa/2.5/ar ESCALADO MULTIDIMENSIONAL ESCALADO CLASICO GRANDES DATOS REDUCCION DE LA DIMENSION TRANSFORMACIONES DE PROCRUSTES INTERPOLACION APRENDIZAJE NO SUPERVISADO MULTIDIMENSIONAL SCALING CLASSICAL SCALING BIG DATA DIMENSIONALITY REDUCCION PROCRSUTES TRANSFORMATIONS INTERPOLATION UNSUPERVISED LEARNING Escalado multidimensional métrico en problemas con grandes datos Multidimensional scaling in big data info:eu-repo/semantics/masterThesis info:ar-repo/semantics/tesis de maestría info:eu-repo/semantics/publishedVersion https://repositoriouba.sisbi.uba.ar/gsdl/cgi-bin/library.cgi?a=d&c=aextesis&d=tesis_n7398_CosattoAmmann_oai
institution Universidad de Buenos Aires
institution_str I-28
repository_str R-145
collection Repositorio Digital de la Universidad de Buenos Aires (UBA)
language Español
orig_language_str_mv spa
topic ESCALADO MULTIDIMENSIONAL
ESCALADO CLASICO
GRANDES DATOS
REDUCCION DE LA DIMENSION
TRANSFORMACIONES DE PROCRUSTES
INTERPOLACION
APRENDIZAJE NO SUPERVISADO
MULTIDIMENSIONAL SCALING
CLASSICAL SCALING
BIG DATA
DIMENSIONALITY REDUCCION
PROCRSUTES TRANSFORMATIONS
INTERPOLATION
UNSUPERVISED LEARNING
spellingShingle ESCALADO MULTIDIMENSIONAL
ESCALADO CLASICO
GRANDES DATOS
REDUCCION DE LA DIMENSION
TRANSFORMACIONES DE PROCRUSTES
INTERPOLACION
APRENDIZAJE NO SUPERVISADO
MULTIDIMENSIONAL SCALING
CLASSICAL SCALING
BIG DATA
DIMENSIONALITY REDUCCION
PROCRSUTES TRANSFORMATIONS
INTERPOLATION
UNSUPERVISED LEARNING
Cosatto Ammann, Pedro Camilo
Escalado multidimensional métrico en problemas con grandes datos
topic_facet ESCALADO MULTIDIMENSIONAL
ESCALADO CLASICO
GRANDES DATOS
REDUCCION DE LA DIMENSION
TRANSFORMACIONES DE PROCRUSTES
INTERPOLACION
APRENDIZAJE NO SUPERVISADO
MULTIDIMENSIONAL SCALING
CLASSICAL SCALING
BIG DATA
DIMENSIONALITY REDUCCION
PROCRSUTES TRANSFORMATIONS
INTERPOLATION
UNSUPERVISED LEARNING
description En este trabajo describimos y aplicamos métodos de escalado multidimensional (MDS) para muestras con gran cantidad de datos. El escalado multidimensional es un conjunto de técnicas de representación de objetos basadas en las distancias, similaridades o disimilaridades entre ellos. Estos métodos tienen severas limitaciones cuando el tamaño de la muestra aumenta, debido a las dificultades de cómputo. Analizamos tres algoritmos distintos para sortear este problema: dos de ellos basados en la idea de división y conquista, y uno de ellos basado en un método de interpolación. Luego, aplicamos uno de ellos a un problema de agrupamiento. Los métodos estudiados logran reproducir con gran exactitud y precisión la solución que se obtendría con los métodos clásicos, aunque se descubrieron algunos aspectos a mejorar, especialmente con la aparición de datos atípicos. Por lo realizado en el problema de aplicación, creemos que estas variantes aportan ventajas al MDS como método de reducción de la dimensión, poniéndolo al mismo nivel que otras técnicas comúnmente usadas en el tratamiento de muestras grandes, como el análisis de Componentes Principales o t-SNE.
author2 Rodríguez, Daniela Andrea
author_facet Rodríguez, Daniela Andrea
Cosatto Ammann, Pedro Camilo
format Tesis de maestría
Tesis de maestría
publishedVersion
author Cosatto Ammann, Pedro Camilo
author_sort Cosatto Ammann, Pedro Camilo
title Escalado multidimensional métrico en problemas con grandes datos
title_short Escalado multidimensional métrico en problemas con grandes datos
title_full Escalado multidimensional métrico en problemas con grandes datos
title_fullStr Escalado multidimensional métrico en problemas con grandes datos
title_full_unstemmed Escalado multidimensional métrico en problemas con grandes datos
title_sort escalado multidimensional métrico en problemas con grandes datos
publisher Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales
publishDate 2023
url https://hdl.handle.net/20.500.12110/tesis_n7398_CosattoAmmann
https://repositoriouba.sisbi.uba.ar/gsdl/cgi-bin/library.cgi?a=d&c=aextesis&d=tesis_n7398_CosattoAmmann_oai
work_keys_str_mv AT cosattoammannpedrocamilo escaladomultidimensionalmetricoenproblemascongrandesdatos
AT cosattoammannpedrocamilo multidimensionalscalinginbigdata
_version_ 1824354897329389568