Análisis de similitud en documentos de texto mediante técnicas de ciencia de datos basadas en aprendizaje profundo (deep learning)
La presente propuesta pretende ingresar a un área de conocimiento actual y de creciente aplicabilidad en la extracción de conocimiento subyacente en datos de diferentes tipologías, cantidades y calidad, como es el aprendizaje profundo (Deep Learning –DL-). Aquí se propone una línea de investigación...
Guardado en:
| Autores principales: | , , |
|---|---|
| Formato: | Objeto de conferencia |
| Lenguaje: | Español |
| Publicado: |
2018
|
| Materias: | |
| Acceso en línea: | http://sedici.unlp.edu.ar/handle/10915/67284 |
| Aporte de: |
| Sumario: | La presente propuesta pretende ingresar a un área de conocimiento actual y de creciente aplicabilidad en la extracción de conocimiento subyacente en datos de diferentes tipologías, cantidades y calidad, como es el aprendizaje profundo (Deep Learning –DL-). Aquí se propone una línea de investigación que habrá de contrastar los grados de similitud entre documentos de texto alcanzados, por medio de tres métodos y herramientas de software diferentes. Se considerará inicialmente el pluggin de aprendizaje profundo Deeplearning4J del entorno de software libre de aprendizaje de máquina (Machine Learning -ML-) KNIME ANALYTICS 3.5.2. Una segunda alternativa a utilizar será la biblioteca GENSIM de Python, para finalmente trabajar con una versión adaptada de red recurrente creada a partir de TENSORFLOW. Se comparará el rendimiento de estas herramientas sobre datos de reservorios existentes en internet con el fin de integrarlas y explotarlas simultáneamente en entornos de hardware con CPU multinúcleos y GPU computing. |
|---|