Análisis de similitud en documentos de texto mediante técnicas de ciencia de datos basadas en aprendizaje profundo (deep learning)

La presente propuesta pretende ingresar a un área de conocimiento actual y de creciente aplicabilidad en la extracción de conocimiento subyacente en datos de diferentes tipologías, cantidades y calidad, como es el aprendizaje profundo (Deep Learning –DL-). Aquí se propone una línea de investigación...

Descripción completa

Guardado en:
Detalles Bibliográficos
Autores principales: Calibar, Andrea Belén, Holleger, Jorge, Klenzi, Raúl Oscar
Formato: Objeto de conferencia
Lenguaje:Español
Publicado: 2018
Materias:
Acceso en línea:http://sedici.unlp.edu.ar/handle/10915/67284
Aporte de:
Descripción
Sumario:La presente propuesta pretende ingresar a un área de conocimiento actual y de creciente aplicabilidad en la extracción de conocimiento subyacente en datos de diferentes tipologías, cantidades y calidad, como es el aprendizaje profundo (Deep Learning –DL-). Aquí se propone una línea de investigación que habrá de contrastar los grados de similitud entre documentos de texto alcanzados, por medio de tres métodos y herramientas de software diferentes. Se considerará inicialmente el pluggin de aprendizaje profundo Deeplearning4J del entorno de software libre de aprendizaje de máquina (Machine Learning -ML-) KNIME ANALYTICS 3.5.2. Una segunda alternativa a utilizar será la biblioteca GENSIM de Python, para finalmente trabajar con una versión adaptada de red recurrente creada a partir de TENSORFLOW. Se comparará el rendimiento de estas herramientas sobre datos de reservorios existentes en internet con el fin de integrarlas y explotarlas simultáneamente en entornos de hardware con CPU multinúcleos y GPU computing.