Identificación de biomarcadores genéticos asociados a diversos estreses en Glycine max (soja) utilizando datos públicos de RNA-Seq
La soja es uno de los cultivos más importantes a nivel global. En Argentina, ocupa un lugar preponderante en la matriz exportadora, siendo el tercer productor mundial y el principal exportador de aceite y harina de soja. Sin embargo, su producción enfrenta importantes desafíos ambientales. A partir...
Guardado en:
Autor principal: | |
---|---|
Otros Autores: | |
Formato: | Tesis de grado publishedVersion |
Lenguaje: | Español |
Publicado: |
Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales
2024
|
Materias: | |
Acceso en línea: | https://hdl.handle.net/20.500.12110/seminario_nDAT000008_Freire https://repositoriouba.sisbi.uba.ar/gsdl/cgi-bin/library.cgi?a=d&c=aextesisg&d=seminario_nDAT000008_Freire_oai |
Aporte de: |
id |
I28-R145-seminario_nDAT000008_Freire_oai |
---|---|
record_format |
dspace |
spelling |
I28-R145-seminario_nDAT000008_Freire_oai2025-08-20 Rivarola, Máximo Lisandro Zavallo, Diego Freire, Guido 2024-12-19 La soja es uno de los cultivos más importantes a nivel global. En Argentina, ocupa un lugar preponderante en la matriz exportadora, siendo el tercer productor mundial y el principal exportador de aceite y harina de soja. Sin embargo, su producción enfrenta importantes desafíos ambientales. A partir de los años 2000, gracias al advenimiento de técnicas de secuenciación genética masiva (NGS en inglés por Next Generation Sequencing), se produjo un salto exponencial en el volumen de datos genómicos de soja disponibles. Se destaca el uso de estos en estudios comparativos y de variabilidad genética para identificar mutaciones asociadas a la resistencia de factores ambientales. Si bien la mayoría de estos datos son abiertos, nunca han sido explorados holísticamente hasta ahora. Esto se debe en parte a la falta de recursos humanos especializados en analizar integralmente esta información. Mas aún, la rigurosidad con la que se describe cada muestra subida a un repositorio público dista de ser óptima. En este trabajo categorizamos cada muestra por su estrés específico y tratamiento, y demostramos que se pueden utilizar técnicas de aprendizaje automático modernas para analizarlas, alcanzando resultados consistentes con la literatura existente. Soy is one of the most important crops worldwide. In Argentina, it plays a key role in the export economy, being the third largest producer and main exporter of soy oil and soy meal. However, its production faces important environmental challenges. Since the 2000s, owing to the usage of NGS (Next Generation Sequencing) technologies, the volume of available genomics data for soy grew exponentially. Its widespread usage in comparative and genetic variability studies has helped identify biomarkers associated to the resistance of environmental stresses. Despite the open nature of most of this data, they have not been explored as a whole until now. This is in part due to the lack of specialized human resources capable of exploring this information integrally. Moreover, the rigurosity with which each sample is described is far from optimal. In this work we categorize each sample according to its specific stress and treatment, and demonstrate that it is possible to use modern machine learning techniques to analyze them, reaching results that are consistent with the existing literature. Fil: Freire, Guido. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina. application/pdf https://hdl.handle.net/20.500.12110/seminario_nDAT000008_Freire spa Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales info:eu-repo/semantics/openAccess https://creativecommons.org/licenses/by-nc-sa/2.5/ar GENOMICA SOJA APRENDIZAJE AUTOMATICO DATOS ABIERTOS ESTRES RNA GENOMICS SOY MACHINE LEARNING OPEN DATA STRESS RNA Identificación de biomarcadores genéticos asociados a diversos estreses en Glycine max (soja) utilizando datos públicos de RNA-Seq Identifying genetic biomarkers in glycine max (soy) associated to different stresses using open info:eu-repo/semantics/bachelorThesis info:ar-repo/semantics/tesis de grado info:eu-repo/semantics/publishedVersion https://repositoriouba.sisbi.uba.ar/gsdl/cgi-bin/library.cgi?a=d&c=aextesisg&d=seminario_nDAT000008_Freire_oai |
institution |
Universidad de Buenos Aires |
institution_str |
I-28 |
repository_str |
R-145 |
collection |
Repositorio Digital de la Universidad de Buenos Aires (UBA) |
language |
Español |
orig_language_str_mv |
spa |
topic |
GENOMICA SOJA APRENDIZAJE AUTOMATICO DATOS ABIERTOS ESTRES RNA GENOMICS SOY MACHINE LEARNING OPEN DATA STRESS RNA |
spellingShingle |
GENOMICA SOJA APRENDIZAJE AUTOMATICO DATOS ABIERTOS ESTRES RNA GENOMICS SOY MACHINE LEARNING OPEN DATA STRESS RNA Freire, Guido Identificación de biomarcadores genéticos asociados a diversos estreses en Glycine max (soja) utilizando datos públicos de RNA-Seq |
topic_facet |
GENOMICA SOJA APRENDIZAJE AUTOMATICO DATOS ABIERTOS ESTRES RNA GENOMICS SOY MACHINE LEARNING OPEN DATA STRESS RNA |
description |
La soja es uno de los cultivos más importantes a nivel global. En Argentina, ocupa un lugar preponderante en la matriz exportadora, siendo el tercer productor mundial y el principal exportador de aceite y harina de soja. Sin embargo, su producción enfrenta importantes desafíos ambientales. A partir de los años 2000, gracias al advenimiento de técnicas de secuenciación genética masiva (NGS en inglés por Next Generation Sequencing), se produjo un salto exponencial en el volumen de datos genómicos de soja disponibles. Se destaca el uso de estos en estudios comparativos y de variabilidad genética para identificar mutaciones asociadas a la resistencia de factores ambientales. Si bien la mayoría de estos datos son abiertos, nunca han sido explorados holísticamente hasta ahora. Esto se debe en parte a la falta de recursos humanos especializados en analizar integralmente esta información. Mas aún, la rigurosidad con la que se describe cada muestra subida a un repositorio público dista de ser óptima. En este trabajo categorizamos cada muestra por su estrés específico y tratamiento, y demostramos que se pueden utilizar técnicas de aprendizaje automático modernas para analizarlas, alcanzando resultados consistentes con la literatura existente. |
author2 |
Rivarola, Máximo Lisandro |
author_facet |
Rivarola, Máximo Lisandro Freire, Guido |
format |
Tesis de grado Tesis de grado publishedVersion |
author |
Freire, Guido |
author_sort |
Freire, Guido |
title |
Identificación de biomarcadores genéticos asociados a diversos estreses en Glycine max (soja) utilizando datos públicos de RNA-Seq |
title_short |
Identificación de biomarcadores genéticos asociados a diversos estreses en Glycine max (soja) utilizando datos públicos de RNA-Seq |
title_full |
Identificación de biomarcadores genéticos asociados a diversos estreses en Glycine max (soja) utilizando datos públicos de RNA-Seq |
title_fullStr |
Identificación de biomarcadores genéticos asociados a diversos estreses en Glycine max (soja) utilizando datos públicos de RNA-Seq |
title_full_unstemmed |
Identificación de biomarcadores genéticos asociados a diversos estreses en Glycine max (soja) utilizando datos públicos de RNA-Seq |
title_sort |
identificación de biomarcadores genéticos asociados a diversos estreses en glycine max (soja) utilizando datos públicos de rna-seq |
publisher |
Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales |
publishDate |
2024 |
url |
https://hdl.handle.net/20.500.12110/seminario_nDAT000008_Freire https://repositoriouba.sisbi.uba.ar/gsdl/cgi-bin/library.cgi?a=d&c=aextesisg&d=seminario_nDAT000008_Freire_oai |
work_keys_str_mv |
AT freireguido identificaciondebiomarcadoresgeneticosasociadosadiversosestresesenglycinemaxsojautilizandodatospublicosdernaseq AT freireguido identifyinggeneticbiomarkersinglycinemaxsoyassociatedtodifferentstressesusingopen |
_version_ |
1843126929661624320 |