Desarrollo de una plataforma web asistida por inteligencia artificial para descarga masiva de imágenes
La mejora en la eficacia de los algoritmos de aprendizaje profundo ha despertado un interés generalizado en esta tecnología. Uno de los campos donde ha tenido un impacto más significativo es la medicina, donde la capacidad de estos algoritmos para reconocer patrones se ha explotado con éxito para an...
Guardado en:
| Autor principal: | |
|---|---|
| Formato: | Artículo revista |
| Lenguaje: | Español |
| Publicado: |
Universidad Nacional del Centro de la Provincia de Buenos Aires. Facultad de Ciencias Exactas
2024
|
| Materias: | |
| Acceso en línea: | Arellano, F. J. (2024). Desarrollo de una plataforma web asistida por inteligencia artificial para descarga masiva de imágenes [Tesis de grado]. Universidad Nacional del Centro de la Provincia de Buenos Aires, Argentina. |
| Aporte de: |
| id |
I21-R190-123456789-4414 |
|---|---|
| record_format |
ojs |
| spelling |
I21-R190-123456789-44142025-04-21T11:23:18Z Desarrollo de una plataforma web asistida por inteligencia artificial para descarga masiva de imágenes Arellano, Franco Javier Orlando, José Ignacio Telesco, Lucas Gabriel Algoritmos de aprendizaje profundo Google Images Medicina Recolección de imágenes Inteligencia artificial La mejora en la eficacia de los algoritmos de aprendizaje profundo ha despertado un interés generalizado en esta tecnología. Uno de los campos donde ha tenido un impacto más significativo es la medicina, donde la capacidad de estos algoritmos para reconocer patrones se ha explotado con éxito para analizar imágenes de patologías complejas y proporcionar diagnósticos precisos. Para obtener buenos resultados, los algoritmos de aprendizaje profundo requieren ser entrenados con una gran cantidad de datos. Esto suele ser dificultoso en medicina, por ejemplo, donde la obtención de los estudios implica colaborar con diversos profesionales y pacientes y hacer uso de equipamiento complejo y costoso. En este trabajo se presenta el desarrollo de una plataforma diseñada para obtener imágenes mediante la extracción automática de la web, conocida como web scraping. Nuestro objetivo principal es recolectar un número importante de imágenes obtenidas a través del motor de búsqueda de Google Images para una consulta específica, y almacenarlas en un único repositorio para su posterior procesamiento y análisis. La solución propuesta, desarrollada íntegramente en Python, utiliza la biblioteca Selenium para interactuar con las interfaces web y realizar el scraping del contenido de forma eficiente. Se plantearon dos implementaciones, una secuencial y otra concurrente, y se analizaron los tiempos de descarga de cada una. Además, se propuso la integración de un módulo de detección de anomalías para el filtrado de imágenes no adecuadas al dominio esperado, a través de una API REST. A partir de esta incorporación, se plantearon dos alternativas adicionales, una basada en una regla heurística que prioriza búsquedas y recorridos en imágenes similares a las esperadas, y otra que poda las descargas de aquellas imágenes detectadas como anómalas. El algoritmo propuesto demostró ser capaz de obtener un gran número de imágenes en tiempos cortos, lo que favorecerá su aplicación para recolectar datos para entrenamiento de algoritmos auto-supervisados. Asimismo, la implementación concurrente combinada con la estrategia de poda mostró ser lo suficientemente robusta como para recolectar imágenes de utilidad para las aplicaciones posteriores. Fil: Arellano, Franco Javier. Universidad Nacional del Centro de la Provincia de Buenos Aires. Facultad de Ciencias Exactas; Argentina. Fil: Orlando, José Ignacio. Universidad Nacional del Centro de la Provincia de Buenos Aires. Facultad de Ciencias Exactas; Argentina. Fil: Telesco, Lucas Gabriel. Universidad Nacional del Centro de la Provincia de Buenos Aires. Facultad de Ciencias Exactas; Argentina. 2024-02 2025-04-21T11:22:27Z 2025-04-21T11:22:27Z info:eu-repo/semantics/bachelorThesis info:eu-repo/semantics/acceptedVersion info:ar-repo/semantics/tesis de grado Arellano, F. J. (2024). Desarrollo de una plataforma web asistida por inteligencia artificial para descarga masiva de imágenes [Tesis de grado]. Universidad Nacional del Centro de la Provincia de Buenos Aires, Argentina. https://www.ridaa.unicen.edu.ar/handle/123456789/4414 spa http://creativecommons.org/licenses/by-nc/2.5/ar/ info:eu-repo/semantics/openAccess application/pdf application/pdf Universidad Nacional del Centro de la Provincia de Buenos Aires. Facultad de Ciencias Exactas |
| institution |
Universidad Nacional del Centro |
| institution_str |
I-21 |
| repository_str |
R-190 |
| container_title_str |
Repositorio Institucional de Acceso Abierto (RIDAA) |
| language |
Español |
| format |
Artículo revista |
| topic |
Algoritmos de aprendizaje profundo Google Images Medicina Recolección de imágenes Inteligencia artificial |
| spellingShingle |
Algoritmos de aprendizaje profundo Google Images Medicina Recolección de imágenes Inteligencia artificial Arellano, Franco Javier Desarrollo de una plataforma web asistida por inteligencia artificial para descarga masiva de imágenes |
| topic_facet |
Algoritmos de aprendizaje profundo Google Images Medicina Recolección de imágenes Inteligencia artificial |
| author |
Arellano, Franco Javier |
| author_facet |
Arellano, Franco Javier |
| author_sort |
Arellano, Franco Javier |
| title |
Desarrollo de una plataforma web asistida por inteligencia artificial para descarga masiva de imágenes |
| title_short |
Desarrollo de una plataforma web asistida por inteligencia artificial para descarga masiva de imágenes |
| title_full |
Desarrollo de una plataforma web asistida por inteligencia artificial para descarga masiva de imágenes |
| title_fullStr |
Desarrollo de una plataforma web asistida por inteligencia artificial para descarga masiva de imágenes |
| title_full_unstemmed |
Desarrollo de una plataforma web asistida por inteligencia artificial para descarga masiva de imágenes |
| title_sort |
desarrollo de una plataforma web asistida por inteligencia artificial para descarga masiva de imágenes |
| description |
La mejora en la eficacia de los algoritmos de aprendizaje profundo ha despertado un interés generalizado en esta tecnología. Uno de los campos donde ha tenido un impacto más significativo es la medicina, donde la capacidad de estos algoritmos para reconocer patrones se ha explotado con éxito para analizar imágenes de patologías complejas y proporcionar diagnósticos precisos. Para obtener buenos resultados, los algoritmos de aprendizaje profundo requieren ser entrenados con una gran cantidad de datos. Esto suele ser dificultoso en medicina, por ejemplo, donde la obtención de los estudios implica colaborar con diversos profesionales y pacientes y hacer uso de equipamiento complejo y costoso. En este trabajo se presenta el desarrollo de una plataforma diseñada para obtener imágenes mediante la extracción automática de la web, conocida como web scraping. Nuestro objetivo principal es recolectar un número importante de imágenes obtenidas a través del motor de búsqueda de Google Images para una consulta específica, y almacenarlas en un único repositorio para su posterior procesamiento y análisis. La solución propuesta, desarrollada íntegramente en Python, utiliza la biblioteca Selenium para interactuar con las interfaces web y realizar el scraping del contenido de forma eficiente. Se plantearon dos implementaciones, una secuencial y otra concurrente, y se analizaron los tiempos de descarga de cada una. Además, se propuso la integración de un módulo de detección de anomalías para el filtrado de imágenes no adecuadas al dominio esperado, a través de una API REST. A partir de esta incorporación, se plantearon dos alternativas adicionales, una basada en una regla heurística que prioriza búsquedas y recorridos en imágenes similares a las esperadas, y otra que poda las descargas de aquellas imágenes detectadas como anómalas. El algoritmo propuesto demostró ser capaz de obtener un gran número de imágenes en tiempos cortos, lo que favorecerá su aplicación para recolectar datos para entrenamiento de algoritmos auto-supervisados. Asimismo, la implementación concurrente combinada con la estrategia de poda mostró ser lo suficientemente robusta como para recolectar imágenes de utilidad para las aplicaciones posteriores. |
| publisher |
Universidad Nacional del Centro de la Provincia de Buenos Aires. Facultad de Ciencias Exactas |
| publishDate |
2024 |
| url |
Arellano, F. J. (2024). Desarrollo de una plataforma web asistida por inteligencia artificial para descarga masiva de imágenes [Tesis de grado]. Universidad Nacional del Centro de la Provincia de Buenos Aires, Argentina. |
| work_keys_str_mv |
AT arellanofrancojavier desarrollodeunaplataformawebasistidaporinteligenciaartificialparadescargamasivadeimagenes |
| first_indexed |
2025-06-05T05:01:51Z |
| last_indexed |
2025-06-05T05:01:51Z |
| _version_ |
1834063978878205952 |