Desarrollo e implementación de un pipeline de transformación de datos transcriptómicos crudos en imágenes como entrada para redes neuronales convolucionales

"En el presente proyecto final de carrera, se plantea el diseño, desarrollo e implementación de un pipeline computacional capaz de cumplir con dos funciones principales: la conversión de datos transcriptómicos en imágenes y la clasificación de individuos en casos enfermos o sanos utilizando red...

Descripción completa

Guardado en:
Detalles Bibliográficos
Autor principal: Campisi, Valentina
Formato: Proyecto final de grado
Lenguaje:Español
Publicado: Instituto Tecnológico de Buenos Aires (ITBA) 2025
Materias:
Acceso en línea:https://hdl.handle.net/20.500.14769/5200
Aporte de:
Descripción
Sumario:"En el presente proyecto final de carrera, se plantea el diseño, desarrollo e implementación de un pipeline computacional capaz de cumplir con dos funciones principales: la conversión de datos transcriptómicos en imágenes y la clasificación de individuos en casos enfermos o sanos utilizando redes neuronales convolucionales (CNN). Si bien existen enfoques que aplican algoritmos de aprendizaje profundo a datos transcriptómicos, la mayoría no aborda directamente la transformación de secuencias en representaciones visuales, ni aprovecha, en simultáneo, las capacidades avanzadas de las CNN para detectar patrones complejos en dichos datos. Además, los métodos actuales suelen requerir procesos computacionales costosos y configuraciones experimentales poco flexibles, lo que dificulta su implementación en entornos con recursos limitados. En base a esto, se tienen las siguientes consideraciones para el desarrollo del pipeline: la creación de un método integral y eficiente que integre la extracción de características transcriptómicas y su visualización; la utilización de redes neuronales convolucionales para mejorar la precisión en la clasificación de casos enfermos o sanos; la adaptabilidad a diversas necesidades experimentales; y la implementación de un sistema de bajo costo computacional que permita su uso en contextos de diagnóstico de alta demanda y precisión. Este trabajo no solo busca abordar las limitaciones de los métodos actuales, sino también proponer una solución innovadora que contribuya al avance en el diagnóstico basado en datos de transcriptómica, combinando técnicas de bioinformática, aprendizaje profundo y generación y procesamiento de imágenes. Este desarrollo se lleva a cabo en MultiplAI Health, empresa que se propone ofrecer exámenes de muestras líquidas, en donde, utilizando secuenciación de ARN e inteligencia artificial, buscan poder detectar enfermedades complejas, con un principal enfoque en los trastornos cardiovasculares. Para una correcta comprensión del objetivo y el desarrollo del pipeline, se explican los fundamentos teóricos de las temáticas principales (biología molecular, bioinformática, inteligencia artificial), el pipeline y algoritmos propuestos, el proceso de testeo de la CNN y los resultados de procesamiento de las muestras y de performance de la CNN".