Aplicaciones de data mining al estudio de la biodiversidad

El trabajo propone la utilización conjunta de técnicas de data mining y simulación para evaluar la riqueza y diversidad de comunidades microbianas. Se parte de una muestra formada por distintas secuencias de ADN que se alinean para luego ser agrupadas según su similaridad en clusters. Cada uno de es...

Descripción completa

Guardado en:
Detalles Bibliográficos
Autores principales: Santa María, Cristóbal, Soria, Marcelo A.
Formato: Objeto de conferencia
Lenguaje:Español
Publicado: 2011
Materias:
Acceso en línea:http://sedici.unlp.edu.ar/handle/10915/20030
Aporte de:
id I19-R120-10915-20030
record_format dspace
institution Universidad Nacional de La Plata
institution_str I-19
repository_str R-120
collection SEDICI (UNLP)
language Español
topic Ciencias Informáticas
base de datos
cluster
Data mining
riqueza
diversidad
rarefacción
simulación
cobertura
spellingShingle Ciencias Informáticas
base de datos
cluster
Data mining
riqueza
diversidad
rarefacción
simulación
cobertura
Santa María, Cristóbal
Soria, Marcelo A.
Aplicaciones de data mining al estudio de la biodiversidad
topic_facet Ciencias Informáticas
base de datos
cluster
Data mining
riqueza
diversidad
rarefacción
simulación
cobertura
description El trabajo propone la utilización conjunta de técnicas de data mining y simulación para evaluar la riqueza y diversidad de comunidades microbianas. Se parte de una muestra formada por distintas secuencias de ADN que se alinean para luego ser agrupadas según su similaridad en clusters. Cada uno de estos clusters es una especie y el propósito es estimar su número y distribución en la comunidad basándose en la información que da la muestra. La técnica de rarefacción, sustentada en el procedimiento bootstrap, permite construir una curva cuya tendencia asintótica es precisamente la riqueza de la comunidad. Para alcanzar tal asíntota, y a la vez para estimar la distribución estadística de las especies, se propone una simulación que utiliza la estimación de Turing sobre la probabilidad de nueva especie al seleccionar un individuo nuevo y la idea de cobertura para la porción de la distribución que cubre la muestra.
format Objeto de conferencia
Objeto de conferencia
author Santa María, Cristóbal
Soria, Marcelo A.
author_facet Santa María, Cristóbal
Soria, Marcelo A.
author_sort Santa María, Cristóbal
title Aplicaciones de data mining al estudio de la biodiversidad
title_short Aplicaciones de data mining al estudio de la biodiversidad
title_full Aplicaciones de data mining al estudio de la biodiversidad
title_fullStr Aplicaciones de data mining al estudio de la biodiversidad
title_full_unstemmed Aplicaciones de data mining al estudio de la biodiversidad
title_sort aplicaciones de data mining al estudio de la biodiversidad
publishDate 2011
url http://sedici.unlp.edu.ar/handle/10915/20030
work_keys_str_mv AT santamariacristobal aplicacionesdedataminingalestudiodelabiodiversidad
AT soriamarceloa aplicacionesdedataminingalestudiodelabiodiversidad
bdutipo_str Repositorios
_version_ 1764820464994091008