Identificación de biomarcadores genéticos asociados a diversos estreses en Glycine max (soja) utilizando datos públicos de RNA-Seq

La soja es uno de los cultivos más importantes a nivel global. En Argentina, ocupa un lugar preponderante en la matriz exportadora, siendo el tercer productor mundial y el principal exportador de aceite y harina de soja. Sin embargo, su producción enfrenta importantes desafíos ambientales. A partir...

Descripción completa

Guardado en:
Detalles Bibliográficos
Autor principal: Freire, Guido
Otros Autores: Rivarola, Máximo Lisandro
Formato: Tesis de grado publishedVersion
Lenguaje:Español
Publicado: Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales 2024
Materias:
RNA
SOY
Acceso en línea:https://hdl.handle.net/20.500.12110/seminario_nDAT000008_Freire
https://repositoriouba.sisbi.uba.ar/gsdl/cgi-bin/library.cgi?a=d&c=aextesisg&d=seminario_nDAT000008_Freire_oai
Aporte de:
id I28-R145-seminario_nDAT000008_Freire_oai
record_format dspace
spelling I28-R145-seminario_nDAT000008_Freire_oai2025-08-20 Rivarola, Máximo Lisandro Zavallo, Diego Freire, Guido 2024-12-19 La soja es uno de los cultivos más importantes a nivel global. En Argentina, ocupa un lugar preponderante en la matriz exportadora, siendo el tercer productor mundial y el principal exportador de aceite y harina de soja. Sin embargo, su producción enfrenta importantes desafíos ambientales. A partir de los años 2000, gracias al advenimiento de técnicas de secuenciación genética masiva (NGS en inglés por Next Generation Sequencing), se produjo un salto exponencial en el volumen de datos genómicos de soja disponibles. Se destaca el uso de estos en estudios comparativos y de variabilidad genética para identificar mutaciones asociadas a la resistencia de factores ambientales. Si bien la mayoría de estos datos son abiertos, nunca han sido explorados holísticamente hasta ahora. Esto se debe en parte a la falta de recursos humanos especializados en analizar integralmente esta información. Mas aún, la rigurosidad con la que se describe cada muestra subida a un repositorio público dista de ser óptima. En este trabajo categorizamos cada muestra por su estrés específico y tratamiento, y demostramos que se pueden utilizar técnicas de aprendizaje automático modernas para analizarlas, alcanzando resultados consistentes con la literatura existente. Soy is one of the most important crops worldwide. In Argentina, it plays a key role in the export economy, being the third largest producer and main exporter of soy oil and soy meal. However, its production faces important environmental challenges. Since the 2000s, owing to the usage of NGS (Next Generation Sequencing) technologies, the volume of available genomics data for soy grew exponentially. Its widespread usage in comparative and genetic variability studies has helped identify biomarkers associated to the resistance of environmental stresses. Despite the open nature of most of this data, they have not been explored as a whole until now. This is in part due to the lack of specialized human resources capable of exploring this information integrally. Moreover, the rigurosity with which each sample is described is far from optimal. In this work we categorize each sample according to its specific stress and treatment, and demonstrate that it is possible to use modern machine learning techniques to analyze them, reaching results that are consistent with the existing literature. Fil: Freire, Guido. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina. application/pdf https://hdl.handle.net/20.500.12110/seminario_nDAT000008_Freire spa Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales info:eu-repo/semantics/openAccess https://creativecommons.org/licenses/by-nc-sa/2.5/ar GENOMICA SOJA APRENDIZAJE AUTOMATICO DATOS ABIERTOS ESTRES RNA GENOMICS SOY MACHINE LEARNING OPEN DATA STRESS RNA Identificación de biomarcadores genéticos asociados a diversos estreses en Glycine max (soja) utilizando datos públicos de RNA-Seq Identifying genetic biomarkers in glycine max (soy) associated to different stresses using open info:eu-repo/semantics/bachelorThesis info:ar-repo/semantics/tesis de grado info:eu-repo/semantics/publishedVersion https://repositoriouba.sisbi.uba.ar/gsdl/cgi-bin/library.cgi?a=d&c=aextesisg&d=seminario_nDAT000008_Freire_oai
institution Universidad de Buenos Aires
institution_str I-28
repository_str R-145
collection Repositorio Digital de la Universidad de Buenos Aires (UBA)
language Español
orig_language_str_mv spa
topic GENOMICA
SOJA
APRENDIZAJE AUTOMATICO
DATOS ABIERTOS
ESTRES
RNA
GENOMICS
SOY
MACHINE LEARNING
OPEN DATA
STRESS
RNA
spellingShingle GENOMICA
SOJA
APRENDIZAJE AUTOMATICO
DATOS ABIERTOS
ESTRES
RNA
GENOMICS
SOY
MACHINE LEARNING
OPEN DATA
STRESS
RNA
Freire, Guido
Identificación de biomarcadores genéticos asociados a diversos estreses en Glycine max (soja) utilizando datos públicos de RNA-Seq
topic_facet GENOMICA
SOJA
APRENDIZAJE AUTOMATICO
DATOS ABIERTOS
ESTRES
RNA
GENOMICS
SOY
MACHINE LEARNING
OPEN DATA
STRESS
RNA
description La soja es uno de los cultivos más importantes a nivel global. En Argentina, ocupa un lugar preponderante en la matriz exportadora, siendo el tercer productor mundial y el principal exportador de aceite y harina de soja. Sin embargo, su producción enfrenta importantes desafíos ambientales. A partir de los años 2000, gracias al advenimiento de técnicas de secuenciación genética masiva (NGS en inglés por Next Generation Sequencing), se produjo un salto exponencial en el volumen de datos genómicos de soja disponibles. Se destaca el uso de estos en estudios comparativos y de variabilidad genética para identificar mutaciones asociadas a la resistencia de factores ambientales. Si bien la mayoría de estos datos son abiertos, nunca han sido explorados holísticamente hasta ahora. Esto se debe en parte a la falta de recursos humanos especializados en analizar integralmente esta información. Mas aún, la rigurosidad con la que se describe cada muestra subida a un repositorio público dista de ser óptima. En este trabajo categorizamos cada muestra por su estrés específico y tratamiento, y demostramos que se pueden utilizar técnicas de aprendizaje automático modernas para analizarlas, alcanzando resultados consistentes con la literatura existente.
author2 Rivarola, Máximo Lisandro
author_facet Rivarola, Máximo Lisandro
Freire, Guido
format Tesis de grado
Tesis de grado
publishedVersion
author Freire, Guido
author_sort Freire, Guido
title Identificación de biomarcadores genéticos asociados a diversos estreses en Glycine max (soja) utilizando datos públicos de RNA-Seq
title_short Identificación de biomarcadores genéticos asociados a diversos estreses en Glycine max (soja) utilizando datos públicos de RNA-Seq
title_full Identificación de biomarcadores genéticos asociados a diversos estreses en Glycine max (soja) utilizando datos públicos de RNA-Seq
title_fullStr Identificación de biomarcadores genéticos asociados a diversos estreses en Glycine max (soja) utilizando datos públicos de RNA-Seq
title_full_unstemmed Identificación de biomarcadores genéticos asociados a diversos estreses en Glycine max (soja) utilizando datos públicos de RNA-Seq
title_sort identificación de biomarcadores genéticos asociados a diversos estreses en glycine max (soja) utilizando datos públicos de rna-seq
publisher Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales
publishDate 2024
url https://hdl.handle.net/20.500.12110/seminario_nDAT000008_Freire
https://repositoriouba.sisbi.uba.ar/gsdl/cgi-bin/library.cgi?a=d&c=aextesisg&d=seminario_nDAT000008_Freire_oai
work_keys_str_mv AT freireguido identificaciondebiomarcadoresgeneticosasociadosadiversosestresesenglycinemaxsojautilizandodatospublicosdernaseq
AT freireguido identifyinggeneticbiomarkersinglycinemaxsoyassociatedtodifferentstressesusingopen
_version_ 1843126929661624320