Desempeño de tareas de preprocesamiento sobre texto en español extraído de Facebook

El lenguaje utilizado en redes sociales, en general, difiere del que podríamos encontrar en otros medios, contiene errores ortográficos, palabras de uso cotidiano que no están formalmente aceptadas, emoticones, urls y otras construcciones que no suelen estar presentes en el lenguaje formal. Esto pod...

Descripción completa

Guardado en:
Detalles Bibliográficos
Autores principales: Esnaola, Leonardo, Tessore, Juan Pablo
Otros Autores: 0000-0001-6298-9019
Formato: Documento de conferencia acceptedVersion
Lenguaje:Español
Publicado: Universidad Nacional del Noroeste de la Provincia de Buenos Aires 2023
Materias:
Acceso en línea:http://repositorio.unnoba.edu.ar/xmlui/handle/23601/641
Aporte de:
Descripción
Sumario:El lenguaje utilizado en redes sociales, en general, difiere del que podríamos encontrar en otros medios, contiene errores ortográficos, palabras de uso cotidiano que no están formalmente aceptadas, emoticones, urls y otras construcciones que no suelen estar presentes en el lenguaje formal. Esto podría afectar el desempeño de los clasificadores de texto basados en aprendizaje automático. Para este trabajo se utilizaron comentarios extraídos de Facebook. Dichos comentarios corresponden a diversas publicaciones pertenecientes a los medios de comunicación más consumidos en el país.