Selección de características en entornos Big data : Aplicación en gene signatures

En el área de la minería de datos y su aplicación con técnicas de machine learning, los algoritmos de selección de características juegan un papel muy importante. El objetivo de esos algoritmos es el de reducir las entradas a un tamaño apropiado para su procesamiento y análisis. Cuando el volumen de...

Descripción completa

Guardado en:
Detalles Bibliográficos
Autores principales: Camele, Genaro, Hasperué, Waldo
Formato: Articulo Comunicacion
Lenguaje:Español
Publicado: 2023
Materias:
Acceso en línea:http://sedici.unlp.edu.ar/handle/10915/170655
Aporte de:
id I19-R120-10915-170655
record_format dspace
spelling I19-R120-10915-1706552024-09-25T20:04:36Z http://sedici.unlp.edu.ar/handle/10915/170655 Selección de características en entornos Big data : Aplicación en gene signatures Feature selection in big data environments. Application in gene signatures Camele, Genaro Hasperué, Waldo 2023-09-27 2024-09-25T17:21:20Z es Ciencias Informáticas Gene signatures biomarcadores Big Data metaheurísticas En el área de la minería de datos y su aplicación con técnicas de machine learning, los algoritmos de selección de características juegan un papel muy importante. El objetivo de esos algoritmos es el de reducir las entradas a un tamaño apropiado para su procesamiento y análisis. Cuando el volumen de información a procesar crece hace que la ejecución de los algoritmos de extracción de características convencionales tenga un tiempo de procesamiento sumamente alto. Si bien puede considerarse la separación o el análisis independiente de cada característica, muchas veces resulta útil poder analizar correlaciones entre dos o más variables. La selección de características puede aplicarse a la medicina genómica, la cual ayuda a entender de forma más precisa por qué enfermamos, y el peso que tiene en una enfermedad la existencia de defectos genómicos frente a factores medioambientales que pueden desencadenar una enfermedad concreta. En el ámbito de la genómica funcional, se destaca el análisis de perfiles de expresión génica; éstos tienen como objetivo principal la identificación de un grupo de genes, cuyo patrón de expresión se encuentren asociados a un fenotipo en particular, concepto conocido como gene signature. Un objetivo particular de los signatures es su utilidad como biomarcador diagnóstico, pronóstico o predictivo de una patología en estudio. Los biomarcadores con valor pronóstico permiten una mejor estratificación de pacientes. Para llevar a cabo el descubrimiento de nuevos gene signatures es necesario un proceso de automatización que permita encontrar genes candidatos en base al conocimiento del experto. En la actualidad esta tarea es realizada de forma manual. Con la rápida acumulación de datos de expresión génica de diversas tecnologías los algoritmos automáticos de reducción de dimensiones pueden seleccionar aquellas que resulten más representativas del conjunto de características. Los resultados de esta selección podrían ser interpretados como un posible gene signature.El objetivo general de este plan de beca es el de contribuir con el desarrollo de algoritmos de extracción de características en entornos Big Data que permitan la identificación y la evaluación de gene signatures. Facultad de Ciencias Agrarias y Forestales Articulo Comunicacion http://creativecommons.org/licenses/by-nc-sa/4.0/ Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0) application/pdf 454-455
institution Universidad Nacional de La Plata
institution_str I-19
repository_str R-120
collection SEDICI (UNLP)
language Español
topic Ciencias Informáticas
Gene signatures
biomarcadores
Big Data
metaheurísticas
spellingShingle Ciencias Informáticas
Gene signatures
biomarcadores
Big Data
metaheurísticas
Camele, Genaro
Hasperué, Waldo
Selección de características en entornos Big data : Aplicación en gene signatures
topic_facet Ciencias Informáticas
Gene signatures
biomarcadores
Big Data
metaheurísticas
description En el área de la minería de datos y su aplicación con técnicas de machine learning, los algoritmos de selección de características juegan un papel muy importante. El objetivo de esos algoritmos es el de reducir las entradas a un tamaño apropiado para su procesamiento y análisis. Cuando el volumen de información a procesar crece hace que la ejecución de los algoritmos de extracción de características convencionales tenga un tiempo de procesamiento sumamente alto. Si bien puede considerarse la separación o el análisis independiente de cada característica, muchas veces resulta útil poder analizar correlaciones entre dos o más variables. La selección de características puede aplicarse a la medicina genómica, la cual ayuda a entender de forma más precisa por qué enfermamos, y el peso que tiene en una enfermedad la existencia de defectos genómicos frente a factores medioambientales que pueden desencadenar una enfermedad concreta. En el ámbito de la genómica funcional, se destaca el análisis de perfiles de expresión génica; éstos tienen como objetivo principal la identificación de un grupo de genes, cuyo patrón de expresión se encuentren asociados a un fenotipo en particular, concepto conocido como gene signature. Un objetivo particular de los signatures es su utilidad como biomarcador diagnóstico, pronóstico o predictivo de una patología en estudio. Los biomarcadores con valor pronóstico permiten una mejor estratificación de pacientes. Para llevar a cabo el descubrimiento de nuevos gene signatures es necesario un proceso de automatización que permita encontrar genes candidatos en base al conocimiento del experto. En la actualidad esta tarea es realizada de forma manual. Con la rápida acumulación de datos de expresión génica de diversas tecnologías los algoritmos automáticos de reducción de dimensiones pueden seleccionar aquellas que resulten más representativas del conjunto de características. Los resultados de esta selección podrían ser interpretados como un posible gene signature.El objetivo general de este plan de beca es el de contribuir con el desarrollo de algoritmos de extracción de características en entornos Big Data que permitan la identificación y la evaluación de gene signatures.
format Articulo
Comunicacion
author Camele, Genaro
Hasperué, Waldo
author_facet Camele, Genaro
Hasperué, Waldo
author_sort Camele, Genaro
title Selección de características en entornos Big data : Aplicación en gene signatures
title_short Selección de características en entornos Big data : Aplicación en gene signatures
title_full Selección de características en entornos Big data : Aplicación en gene signatures
title_fullStr Selección de características en entornos Big data : Aplicación en gene signatures
title_full_unstemmed Selección de características en entornos Big data : Aplicación en gene signatures
title_sort selección de características en entornos big data : aplicación en gene signatures
publishDate 2023
url http://sedici.unlp.edu.ar/handle/10915/170655
work_keys_str_mv AT camelegenaro selecciondecaracteristicasenentornosbigdataaplicacionengenesignatures
AT hasperuewaldo selecciondecaracteristicasenentornosbigdataaplicacionengenesignatures
AT camelegenaro featureselectioninbigdataenvironmentsapplicationingenesignatures
AT hasperuewaldo featureselectioninbigdataenvironmentsapplicationingenesignatures
_version_ 1824075773654335488