Propuesta para la construcción de un Corpus Jurídico utilizando Expresiones Regulares

En la última década, la construcción de corpus de distintas especialidades ha tenido un amplio desarrollo, debido en gran parte, por su incorporación en el proceso de recuperación de la información. Si bien, en el sistema jurídico argentino, existen varios buscadores de expedientes digitales, en est...

Descripción completa

Guardado en:
Detalles Bibliográficos
Autores principales: Spositto, Osvaldo Mario, Ryckeboer, Hugo Emilio, Ledesma, Viviana, Procopio, Gastón, Matteo, Lorena, Gargano, Cecilia, Bossero, Julio, Moreno, Edgardo J., Saizar, Victoria, Macias, Patricio, Ojeda, Juan, Quintana, Fabio, Conti, Laura, García, Sergio, Pérez Villar, Gustavo
Formato: Objeto de conferencia
Lenguaje:Español
Publicado: 2021
Materias:
Acceso en línea:http://sedici.unlp.edu.ar/handle/10915/130541
Aporte de:
Descripción
Sumario:En la última década, la construcción de corpus de distintas especialidades ha tenido un amplio desarrollo, debido en gran parte, por su incorporación en el proceso de recuperación de la información. Si bien, en el sistema jurídico argentino, existen varios buscadores de expedientes digitales, en este artículo se presenta una propuesta para incorporar, en un corpus jurídico, las fechas y las referencias de la norma jurídica, mediante el Reconocimiento de Entidades Nombradas (tales como Acordadas, Artículos, Leyes, entre otros), que componen los distintos documentos judiciales, utilizando Expresiones Regulares (ER). Estas cadenas de caracteres se utilizan para describir o encontrar patrones dentro de otros textos, empleando delimitadores y reglas de sintaxis. Se propone una metodología que permita identificar, clasificar y reemplazar estas entradas automáticamente, con el objetivo de ser normalizas. Por último, se presenta una propuesta para incorporar en un algoritmo de Lematización, la codificacion del proceso mencionado usando ER.