Desarrollo de una plataforma web asistida por inteligencia artificial para descarga masiva de imágenes

La mejora en la eficacia de los algoritmos de aprendizaje profundo ha despertado un interés generalizado en esta tecnología. Uno de los campos donde ha tenido un impacto más significativo es la medicina, donde la capacidad de estos algoritmos para reconocer patrones se ha explotado con éxito para an...

Descripción completa

Guardado en:
Detalles Bibliográficos
Autor principal: Arellano, Franco Javier
Formato: Artículo revista
Lenguaje:Español
Publicado: Universidad Nacional del Centro de la Provincia de Buenos Aires. Facultad de Ciencias Exactas 2024
Materias:
Acceso en línea:Arellano, F. J. (2024). Desarrollo de una plataforma web asistida por inteligencia artificial para descarga masiva de imágenes [Tesis de grado]. Universidad Nacional del Centro de la Provincia de Buenos Aires, Argentina.
Aporte de:
id I21-R190-123456789-4414
record_format ojs
spelling I21-R190-123456789-44142025-04-21T11:23:18Z Desarrollo de una plataforma web asistida por inteligencia artificial para descarga masiva de imágenes Arellano, Franco Javier Orlando, José Ignacio Telesco, Lucas Gabriel Algoritmos de aprendizaje profundo Google Images Medicina Recolección de imágenes Inteligencia artificial La mejora en la eficacia de los algoritmos de aprendizaje profundo ha despertado un interés generalizado en esta tecnología. Uno de los campos donde ha tenido un impacto más significativo es la medicina, donde la capacidad de estos algoritmos para reconocer patrones se ha explotado con éxito para analizar imágenes de patologías complejas y proporcionar diagnósticos precisos. Para obtener buenos resultados, los algoritmos de aprendizaje profundo requieren ser entrenados con una gran cantidad de datos. Esto suele ser dificultoso en medicina, por ejemplo, donde la obtención de los estudios implica colaborar con diversos profesionales y pacientes y hacer uso de equipamiento complejo y costoso. En este trabajo se presenta el desarrollo de una plataforma diseñada para obtener imágenes mediante la extracción automática de la web, conocida como web scraping. Nuestro objetivo principal es recolectar un número importante de imágenes obtenidas a través del motor de búsqueda de Google Images para una consulta específica, y almacenarlas en un único repositorio para su posterior procesamiento y análisis. La solución propuesta, desarrollada íntegramente en Python, utiliza la biblioteca Selenium para interactuar con las interfaces web y realizar el scraping del contenido de forma eficiente. Se plantearon dos implementaciones, una secuencial y otra concurrente, y se analizaron los tiempos de descarga de cada una. Además, se propuso la integración de un módulo de detección de anomalías para el filtrado de imágenes no adecuadas al dominio esperado, a través de una API REST. A partir de esta incorporación, se plantearon dos alternativas adicionales, una basada en una regla heurística que prioriza búsquedas y recorridos en imágenes similares a las esperadas, y otra que poda las descargas de aquellas imágenes detectadas como anómalas. El algoritmo propuesto demostró ser capaz de obtener un gran número de imágenes en tiempos cortos, lo que favorecerá su aplicación para recolectar datos para entrenamiento de algoritmos auto-supervisados. Asimismo, la implementación concurrente combinada con la estrategia de poda mostró ser lo suficientemente robusta como para recolectar imágenes de utilidad para las aplicaciones posteriores. Fil: Arellano, Franco Javier. Universidad Nacional del Centro de la Provincia de Buenos Aires. Facultad de Ciencias Exactas; Argentina. Fil: Orlando, José Ignacio. Universidad Nacional del Centro de la Provincia de Buenos Aires. Facultad de Ciencias Exactas; Argentina. Fil: Telesco, Lucas Gabriel. Universidad Nacional del Centro de la Provincia de Buenos Aires. Facultad de Ciencias Exactas; Argentina. 2024-02 2025-04-21T11:22:27Z 2025-04-21T11:22:27Z info:eu-repo/semantics/bachelorThesis info:eu-repo/semantics/acceptedVersion info:ar-repo/semantics/tesis de grado Arellano, F. J. (2024). Desarrollo de una plataforma web asistida por inteligencia artificial para descarga masiva de imágenes [Tesis de grado]. Universidad Nacional del Centro de la Provincia de Buenos Aires, Argentina. https://www.ridaa.unicen.edu.ar/handle/123456789/4414 spa http://creativecommons.org/licenses/by-nc/2.5/ar/ info:eu-repo/semantics/openAccess application/pdf application/pdf Universidad Nacional del Centro de la Provincia de Buenos Aires. Facultad de Ciencias Exactas
institution Universidad Nacional del Centro
institution_str I-21
repository_str R-190
container_title_str Repositorio Institucional de Acceso Abierto (RIDAA)
language Español
format Artículo revista
topic Algoritmos de aprendizaje profundo
Google Images
Medicina
Recolección de imágenes
Inteligencia artificial
spellingShingle Algoritmos de aprendizaje profundo
Google Images
Medicina
Recolección de imágenes
Inteligencia artificial
Arellano, Franco Javier
Desarrollo de una plataforma web asistida por inteligencia artificial para descarga masiva de imágenes
topic_facet Algoritmos de aprendizaje profundo
Google Images
Medicina
Recolección de imágenes
Inteligencia artificial
author Arellano, Franco Javier
author_facet Arellano, Franco Javier
author_sort Arellano, Franco Javier
title Desarrollo de una plataforma web asistida por inteligencia artificial para descarga masiva de imágenes
title_short Desarrollo de una plataforma web asistida por inteligencia artificial para descarga masiva de imágenes
title_full Desarrollo de una plataforma web asistida por inteligencia artificial para descarga masiva de imágenes
title_fullStr Desarrollo de una plataforma web asistida por inteligencia artificial para descarga masiva de imágenes
title_full_unstemmed Desarrollo de una plataforma web asistida por inteligencia artificial para descarga masiva de imágenes
title_sort desarrollo de una plataforma web asistida por inteligencia artificial para descarga masiva de imágenes
description La mejora en la eficacia de los algoritmos de aprendizaje profundo ha despertado un interés generalizado en esta tecnología. Uno de los campos donde ha tenido un impacto más significativo es la medicina, donde la capacidad de estos algoritmos para reconocer patrones se ha explotado con éxito para analizar imágenes de patologías complejas y proporcionar diagnósticos precisos. Para obtener buenos resultados, los algoritmos de aprendizaje profundo requieren ser entrenados con una gran cantidad de datos. Esto suele ser dificultoso en medicina, por ejemplo, donde la obtención de los estudios implica colaborar con diversos profesionales y pacientes y hacer uso de equipamiento complejo y costoso. En este trabajo se presenta el desarrollo de una plataforma diseñada para obtener imágenes mediante la extracción automática de la web, conocida como web scraping. Nuestro objetivo principal es recolectar un número importante de imágenes obtenidas a través del motor de búsqueda de Google Images para una consulta específica, y almacenarlas en un único repositorio para su posterior procesamiento y análisis. La solución propuesta, desarrollada íntegramente en Python, utiliza la biblioteca Selenium para interactuar con las interfaces web y realizar el scraping del contenido de forma eficiente. Se plantearon dos implementaciones, una secuencial y otra concurrente, y se analizaron los tiempos de descarga de cada una. Además, se propuso la integración de un módulo de detección de anomalías para el filtrado de imágenes no adecuadas al dominio esperado, a través de una API REST. A partir de esta incorporación, se plantearon dos alternativas adicionales, una basada en una regla heurística que prioriza búsquedas y recorridos en imágenes similares a las esperadas, y otra que poda las descargas de aquellas imágenes detectadas como anómalas. El algoritmo propuesto demostró ser capaz de obtener un gran número de imágenes en tiempos cortos, lo que favorecerá su aplicación para recolectar datos para entrenamiento de algoritmos auto-supervisados. Asimismo, la implementación concurrente combinada con la estrategia de poda mostró ser lo suficientemente robusta como para recolectar imágenes de utilidad para las aplicaciones posteriores.
publisher Universidad Nacional del Centro de la Provincia de Buenos Aires. Facultad de Ciencias Exactas
publishDate 2024
url Arellano, F. J. (2024). Desarrollo de una plataforma web asistida por inteligencia artificial para descarga masiva de imágenes [Tesis de grado]. Universidad Nacional del Centro de la Provincia de Buenos Aires, Argentina.
work_keys_str_mv AT arellanofrancojavier desarrollodeunaplataformawebasistidaporinteligenciaartificialparadescargamasivadeimagenes
first_indexed 2025-06-05T05:01:51Z
last_indexed 2025-06-05T05:01:51Z
_version_ 1834063978878205952