Selección de características en entornos Big data : Aplicación en gene signatures
En el área de la minería de datos y su aplicación con técnicas de machine learning, los algoritmos de selección de características juegan un papel muy importante. El objetivo de esos algoritmos es el de reducir las entradas a un tamaño apropiado para su procesamiento y análisis. Cuando el volumen de...
Guardado en:
| Autores principales: | , |
|---|---|
| Formato: | Articulo Comunicacion |
| Lenguaje: | Español |
| Publicado: |
2023
|
| Materias: | |
| Acceso en línea: | http://sedici.unlp.edu.ar/handle/10915/170655 |
| Aporte de: |
| id |
I19-R120-10915-170655 |
|---|---|
| record_format |
dspace |
| spelling |
I19-R120-10915-1706552024-09-25T20:04:36Z http://sedici.unlp.edu.ar/handle/10915/170655 Selección de características en entornos Big data : Aplicación en gene signatures Feature selection in big data environments. Application in gene signatures Camele, Genaro Hasperué, Waldo 2023-09-27 2024-09-25T17:21:20Z es Ciencias Informáticas Gene signatures biomarcadores Big Data metaheurísticas En el área de la minería de datos y su aplicación con técnicas de machine learning, los algoritmos de selección de características juegan un papel muy importante. El objetivo de esos algoritmos es el de reducir las entradas a un tamaño apropiado para su procesamiento y análisis. Cuando el volumen de información a procesar crece hace que la ejecución de los algoritmos de extracción de características convencionales tenga un tiempo de procesamiento sumamente alto. Si bien puede considerarse la separación o el análisis independiente de cada característica, muchas veces resulta útil poder analizar correlaciones entre dos o más variables. La selección de características puede aplicarse a la medicina genómica, la cual ayuda a entender de forma más precisa por qué enfermamos, y el peso que tiene en una enfermedad la existencia de defectos genómicos frente a factores medioambientales que pueden desencadenar una enfermedad concreta. En el ámbito de la genómica funcional, se destaca el análisis de perfiles de expresión génica; éstos tienen como objetivo principal la identificación de un grupo de genes, cuyo patrón de expresión se encuentren asociados a un fenotipo en particular, concepto conocido como gene signature. Un objetivo particular de los signatures es su utilidad como biomarcador diagnóstico, pronóstico o predictivo de una patología en estudio. Los biomarcadores con valor pronóstico permiten una mejor estratificación de pacientes. Para llevar a cabo el descubrimiento de nuevos gene signatures es necesario un proceso de automatización que permita encontrar genes candidatos en base al conocimiento del experto. En la actualidad esta tarea es realizada de forma manual. Con la rápida acumulación de datos de expresión génica de diversas tecnologías los algoritmos automáticos de reducción de dimensiones pueden seleccionar aquellas que resulten más representativas del conjunto de características. Los resultados de esta selección podrían ser interpretados como un posible gene signature.El objetivo general de este plan de beca es el de contribuir con el desarrollo de algoritmos de extracción de características en entornos Big Data que permitan la identificación y la evaluación de gene signatures. Facultad de Ciencias Agrarias y Forestales Articulo Comunicacion http://creativecommons.org/licenses/by-nc-sa/4.0/ Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0) application/pdf 454-455 |
| institution |
Universidad Nacional de La Plata |
| institution_str |
I-19 |
| repository_str |
R-120 |
| collection |
SEDICI (UNLP) |
| language |
Español |
| topic |
Ciencias Informáticas Gene signatures biomarcadores Big Data metaheurísticas |
| spellingShingle |
Ciencias Informáticas Gene signatures biomarcadores Big Data metaheurísticas Camele, Genaro Hasperué, Waldo Selección de características en entornos Big data : Aplicación en gene signatures |
| topic_facet |
Ciencias Informáticas Gene signatures biomarcadores Big Data metaheurísticas |
| description |
En el área de la minería de datos y su aplicación con técnicas de machine learning, los algoritmos de selección de características juegan un papel muy importante. El objetivo de esos algoritmos es el de reducir las entradas a un tamaño apropiado para su procesamiento y análisis. Cuando el volumen de información a procesar crece hace que la ejecución de los algoritmos de extracción de características convencionales tenga un tiempo de procesamiento sumamente alto. Si bien puede considerarse la separación o el análisis independiente de cada característica, muchas veces resulta útil poder analizar correlaciones entre dos o más variables. La selección de características puede aplicarse a la medicina genómica, la cual ayuda a entender de forma más precisa por qué enfermamos, y el peso que tiene en una enfermedad la existencia de defectos genómicos frente a factores medioambientales que pueden desencadenar una enfermedad concreta. En el ámbito de la genómica funcional, se destaca el análisis de perfiles de expresión génica; éstos tienen como objetivo principal la identificación de un grupo de genes, cuyo patrón de expresión se encuentren asociados a un fenotipo en particular, concepto conocido como gene signature. Un objetivo particular de los signatures es su utilidad como biomarcador diagnóstico, pronóstico o predictivo de una patología en estudio. Los biomarcadores con valor pronóstico permiten una mejor estratificación de pacientes. Para llevar a cabo el descubrimiento de nuevos gene signatures es necesario un proceso de automatización que permita encontrar genes candidatos en base al conocimiento del experto. En la actualidad esta tarea es realizada de forma manual. Con la rápida acumulación de datos de expresión génica de diversas tecnologías los algoritmos automáticos de reducción de dimensiones pueden seleccionar aquellas que resulten más representativas del conjunto de características. Los resultados de esta selección podrían ser interpretados como un posible gene signature.El objetivo general de este plan de beca es el de contribuir con el desarrollo de algoritmos de extracción de características en entornos Big Data que permitan la identificación y la evaluación de gene signatures. |
| format |
Articulo Comunicacion |
| author |
Camele, Genaro Hasperué, Waldo |
| author_facet |
Camele, Genaro Hasperué, Waldo |
| author_sort |
Camele, Genaro |
| title |
Selección de características en entornos Big data : Aplicación en gene signatures |
| title_short |
Selección de características en entornos Big data : Aplicación en gene signatures |
| title_full |
Selección de características en entornos Big data : Aplicación en gene signatures |
| title_fullStr |
Selección de características en entornos Big data : Aplicación en gene signatures |
| title_full_unstemmed |
Selección de características en entornos Big data : Aplicación en gene signatures |
| title_sort |
selección de características en entornos big data : aplicación en gene signatures |
| publishDate |
2023 |
| url |
http://sedici.unlp.edu.ar/handle/10915/170655 |
| work_keys_str_mv |
AT camelegenaro selecciondecaracteristicasenentornosbigdataaplicacionengenesignatures AT hasperuewaldo selecciondecaracteristicasenentornosbigdataaplicacionengenesignatures AT camelegenaro featureselectioninbigdataenvironmentsapplicationingenesignatures AT hasperuewaldo featureselectioninbigdataenvironmentsapplicationingenesignatures |
| _version_ |
1824075773654335488 |