Comparación de sistemas para la detección de límites de oraciones
Se plantea la obtención de límites de oraciones (LO) mediante tres sistemas: -Mx terminator: modela las decisiones que se toman al recorrer un texto y clasificar los elementos de S{., ?, !} en LO o no (sistema estadístico). -SMORPH/MPS: distingue la separación de párrafos y de oraciones y la separ...
Guardado en:
| Autor principal: | |
|---|---|
| Formato: | article artículo publishedVersion |
| Lenguaje: | Español |
| Publicado: |
Grupo Infosur
2019
|
| Materias: | |
| Acceso en línea: | http://hdl.handle.net/2133/14277 http://hdl.handle.net/2133/14277 |
| Aporte de: |
| id |
I15-R121-2133-14277 |
|---|---|
| record_format |
dspace |
| institution |
Universidad Nacional de Rosario |
| institution_str |
I-15 |
| repository_str |
R-121 |
| collection |
Repositorio Hipermedial de la Universidad Nacional de Rosario (UNR) |
| language |
Español |
| orig_language_str_mv |
spa |
| topic |
oraciones limites estadístico |
| spellingShingle |
oraciones limites estadístico Beltrán, Celina Comparación de sistemas para la detección de límites de oraciones |
| topic_facet |
oraciones limites estadístico |
| description |
Se plantea la obtención de límites de oraciones (LO) mediante tres sistemas:
-Mx terminator: modela las decisiones que se toman al recorrer un texto y clasificar los elementos de S{., ?, !} en LO o no (sistema estadístico).
-SMORPH/MPS: distingue la separación de párrafos y de oraciones y la separación entre párrafos de la separación dada por nueva línea cuando no hay LO.
-XFST/Tokenize: agrega la detección de títulos a las funcionalidades del anterior.
Para evaluar los tres sistemas se utilizó un corpus de 277 oraciones.
Con el primero se obtiene 100% de cobertura y 96.9% de precisión en límite de oración (no discrimina final de párrafo y final de oración no final de párrafo). Con el segundo se obtiene 100% y 98,8% para precisión y cobertura de límites de párrafo, y 100% para precisión y cobertura de límites de oración que no finalizan párrafo. Con el tercero se detecta final de párrafo, final de oración no final de párrafo y títulos. Los valores de cobertura y precisión son 100% y 100% respectivamente para títulos, 100% y 100% para finales de párrafos y 100% y 99.5% para finales de oración no finales de párrafos. |
| format |
article artículo publishedVersion |
| author |
Beltrán, Celina |
| author_facet |
Beltrán, Celina |
| author_sort |
Beltrán, Celina |
| title |
Comparación de sistemas para la detección de límites de oraciones |
| title_short |
Comparación de sistemas para la detección de límites de oraciones |
| title_full |
Comparación de sistemas para la detección de límites de oraciones |
| title_fullStr |
Comparación de sistemas para la detección de límites de oraciones |
| title_full_unstemmed |
Comparación de sistemas para la detección de límites de oraciones |
| title_sort |
comparación de sistemas para la detección de límites de oraciones |
| publisher |
Grupo Infosur |
| publishDate |
2019 |
| url |
http://hdl.handle.net/2133/14277 http://hdl.handle.net/2133/14277 |
| work_keys_str_mv |
AT beltrancelina comparaciondesistemasparaladetecciondelimitesdeoraciones |
| bdutipo_str |
Repositorios |
| _version_ |
1764820408342675457 |