NLP aplicado a análisis de texto

El procesamiento de lenguaje natural o NLP (del inglés Natural Language Processing) es un campo de las ciencias de la computación. Si bien no fue concebido como una rama de la inteligencia computacional, las características del problema a resolver hicieron que paulatinamente se pasará de modelos bas...

Descripción completa

Detalles Bibliográficos
Autores principales: Alias, Gerardo, Cassanelli, Rodrigo
Otros Autores: Di Iorio, Ana Haydée
Formato: Tesis draft Tesis de grado
Lenguaje:Español
Publicado: Universidad Nacional de Mar del Plata. Facultad de Ingeniería. Argentina 2019
Materias:
NLP
Acceso en línea:http://rinfi.fi.mdp.edu.ar/handle/123456789/354
Aporte de:
id I29-R182-123456789-354
record_format dspace
spelling I29-R182-123456789-3542024-04-26T13:07:33Z NLP aplicado a análisis de texto Alias, Gerardo Cassanelli, Rodrigo Di Iorio, Ana Haydée InfoLab Seguridad ciudadana Procesamiento de lenguaje natural NLP Aplicaciones informática jurídica El procesamiento de lenguaje natural o NLP (del inglés Natural Language Processing) es un campo de las ciencias de la computación. Si bien no fue concebido como una rama de la inteligencia computacional, las características del problema a resolver hicieron que paulatinamente se pasará de modelos basados en reglas a modelos que utilizan redes neuronales. En la actualidad, la mayoría de los sistemas orientados al análisis de textos basan su funcionamiento en la utilización de redes neuronales. Este tipo de sistemas “aprende”, es decir se entrena, para luego inferir resultados basándose en el contexto en lugar de reglas particulares. El avance en las técnicas de procesamiento del lenguaje natural hace posible pensar en una solución informática a la problemática antes descripta. En el InFo-Lab , a principios del año 2018, se realizó una prueba de concepto o prototipo para analizar la factibilidad de la aplicación de estas técnicas a las investigaciones criminales. Dicho prototipo obtuvo buenos resultados detectando referencias a drogas o estupefacientes en diversos textos. El objetivo del presente proyecto es desarrollar un sistema informático orientado a la resolución de este tipo de problemas. Para ello se plantea un producto dividido en dos módulos principales. Se puede observar un esquema de alto nivel de la solución propuesta y de la interacción con cada uno de los componentes principales del sistema. El primero de ellos es un módulo de administración de modelos para el análisis de lenguaje natural. El mismo se orienta a los usuarios con conocimientos medios / avanzados de informática. Su objetivo es ofrecer interfaces para: Analizar los textos y, de este modo, permitir al investigador focalizar su atención sobre los fragmentos con mayor probabilidad de contener evidencia. Permitir al administrador del sistema administrar los diferentes modelos, orientados a temáticas particulares, con los que cuente el sistema. Permitir crear modelos especializados en distintas temáticas. Permitir administrar los datos de entrenamiento de cada modelo y, al mismo tiempo, ofrecer un mecanismo para aplicar los mismos a los modelos. El segundo módulo es una plataforma web que, utilizando las funcionalidades provistas por la librería de NLP, permite a distintos tipos de usuarios, tales como abogados, fiscales e investigadores utilizar modelos para analizar distintos documentos. Dado el tipo de usuario esperado, este sistema debe poder ser operado con conocimientos básicos de informática. Sus principales objetivos son: Permitir gestionar los documentos vinculados a investigaciones que lleva a cabo el Ministerio Público, en primera instancia, de manera sencilla y útil. Ofrecer al menos un modelo de análisis base orientado a una temática criminal particular. Permitir a los usuarios analizar, de forma amigable, los textos asociados a una investigación pertinente. Generar informes que muestren información considerada de importancia respecto de una investigación. Fil: Alias, Gerardo. Universidad Nacional de Mar del Plata. Facultad de Ingeniería; Argentina. Fil: Cassanelli, Rodrigo. Universidad Nacional de Mar del Plata. Facultad de Ingeniería; Argentina. 2019-08-12 Thesis info:eu-repo/semantics/draft info:ar-repo/semantics/tesis de grado info:eu-repo/semantics/bachelorThesis application/pdf http://rinfi.fi.mdp.edu.ar/handle/123456789/354 spa info:eu-repo/semantics/openAccess https://creativecommons.org/licenses/by/4.0/ Universidad Nacional de Mar del Plata. Facultad de Ingeniería. Argentina
institution Universidad Nacional de Mar del Plata (UNMdP)
institution_str I-29
repository_str R-182
collection RINFI - Facultad de Ingeniería (UNMdP)
language Español
topic InfoLab
Seguridad ciudadana
Procesamiento de lenguaje natural
NLP
Aplicaciones informática jurídica
spellingShingle InfoLab
Seguridad ciudadana
Procesamiento de lenguaje natural
NLP
Aplicaciones informática jurídica
Alias, Gerardo
Cassanelli, Rodrigo
NLP aplicado a análisis de texto
topic_facet InfoLab
Seguridad ciudadana
Procesamiento de lenguaje natural
NLP
Aplicaciones informática jurídica
description El procesamiento de lenguaje natural o NLP (del inglés Natural Language Processing) es un campo de las ciencias de la computación. Si bien no fue concebido como una rama de la inteligencia computacional, las características del problema a resolver hicieron que paulatinamente se pasará de modelos basados en reglas a modelos que utilizan redes neuronales. En la actualidad, la mayoría de los sistemas orientados al análisis de textos basan su funcionamiento en la utilización de redes neuronales. Este tipo de sistemas “aprende”, es decir se entrena, para luego inferir resultados basándose en el contexto en lugar de reglas particulares. El avance en las técnicas de procesamiento del lenguaje natural hace posible pensar en una solución informática a la problemática antes descripta. En el InFo-Lab , a principios del año 2018, se realizó una prueba de concepto o prototipo para analizar la factibilidad de la aplicación de estas técnicas a las investigaciones criminales. Dicho prototipo obtuvo buenos resultados detectando referencias a drogas o estupefacientes en diversos textos. El objetivo del presente proyecto es desarrollar un sistema informático orientado a la resolución de este tipo de problemas. Para ello se plantea un producto dividido en dos módulos principales. Se puede observar un esquema de alto nivel de la solución propuesta y de la interacción con cada uno de los componentes principales del sistema. El primero de ellos es un módulo de administración de modelos para el análisis de lenguaje natural. El mismo se orienta a los usuarios con conocimientos medios / avanzados de informática. Su objetivo es ofrecer interfaces para: Analizar los textos y, de este modo, permitir al investigador focalizar su atención sobre los fragmentos con mayor probabilidad de contener evidencia. Permitir al administrador del sistema administrar los diferentes modelos, orientados a temáticas particulares, con los que cuente el sistema. Permitir crear modelos especializados en distintas temáticas. Permitir administrar los datos de entrenamiento de cada modelo y, al mismo tiempo, ofrecer un mecanismo para aplicar los mismos a los modelos. El segundo módulo es una plataforma web que, utilizando las funcionalidades provistas por la librería de NLP, permite a distintos tipos de usuarios, tales como abogados, fiscales e investigadores utilizar modelos para analizar distintos documentos. Dado el tipo de usuario esperado, este sistema debe poder ser operado con conocimientos básicos de informática. Sus principales objetivos son: Permitir gestionar los documentos vinculados a investigaciones que lleva a cabo el Ministerio Público, en primera instancia, de manera sencilla y útil. Ofrecer al menos un modelo de análisis base orientado a una temática criminal particular. Permitir a los usuarios analizar, de forma amigable, los textos asociados a una investigación pertinente. Generar informes que muestren información considerada de importancia respecto de una investigación.
author2 Di Iorio, Ana Haydée
author_facet Di Iorio, Ana Haydée
Alias, Gerardo
Cassanelli, Rodrigo
format Thesis
draft
Tesis de grado
Tesis de grado
author Alias, Gerardo
Cassanelli, Rodrigo
author_sort Alias, Gerardo
title NLP aplicado a análisis de texto
title_short NLP aplicado a análisis de texto
title_full NLP aplicado a análisis de texto
title_fullStr NLP aplicado a análisis de texto
title_full_unstemmed NLP aplicado a análisis de texto
title_sort nlp aplicado a análisis de texto
publisher Universidad Nacional de Mar del Plata. Facultad de Ingeniería. Argentina
publishDate 2019
url http://rinfi.fi.mdp.edu.ar/handle/123456789/354
work_keys_str_mv AT aliasgerardo nlpaplicadoaanalisisdetexto
AT cassanellirodrigo nlpaplicadoaanalisisdetexto
_version_ 1807948735150292992