Generación automática de código fuente a través de modelos preentrenados de lenguaje

Un Transformer es un modelo de Aprendizaje Profundo creado en 2017 con el objetivo de realizar traducciones entre lenguajes naturales. Las innovaciones que introdujo, particularmente la de auto-atención, han permitido construir prototipos que tienen una noción intuitiva del contexto, y comprenden el...

Descripción completa

Guardado en:
Detalles Bibliográficos
Autores principales: Bender, Adrián, Nicolet, Santiago, Folino, Pablo, Lopez, Juan José, Hansen, Gustavo
Formato: Articulo
Lenguaje:Español
Publicado: 2023
Materias:
Acceso en línea:http://sedici.unlp.edu.ar/handle/10915/156747
Aporte de:
id I19-R120-10915-156747
record_format dspace
spelling I19-R120-10915-1567472023-08-23T20:04:40Z http://sedici.unlp.edu.ar/handle/10915/156747 Generación automática de código fuente a través de modelos preentrenados de lenguaje Bender, Adrián Nicolet, Santiago Folino, Pablo Lopez, Juan José Hansen, Gustavo 2023-05 2023-08-23T17:43:35Z es Ciencias Informáticas Generación de código Transformers Modelos preentrenados Automatización Un Transformer es un modelo de Aprendizaje Profundo creado en 2017 con el objetivo de realizar traducciones entre lenguajes naturales. Las innovaciones que introdujo, particularmente la de auto-atención, han permitido construir prototipos que tienen una noción intuitiva del contexto, y comprenden el significado y los patrones subyacentes del lenguaje. En 2020 OpenAI hizo público GPT-3, un modelo preentrenado enfocado hacia la generación de lenguaje, que mostró resultados prometedores, creando textos con una calidad tal que se hace difícil distinguir si fueron escritos por un humano o por una máquina. Podemos afirmar que el código fuente es texto generado en un lenguaje formal, y por lo tanto podría ser generado con herramientas basadas en estos prototipos. Este trabajo presenta un estudio de la evolución y el estado del arte en este campo: la generación automática de código fuente a partir de especificaciones escritas en lenguaje natural. Recorremos diferentes casos, su éxito, las dificultades de encontrar mecanismos de evaluación y su posible implementación en un futuro por las empresas. A Transformer is a Deep Learning model created in 2017 with the aim of performing translations between natural languages. The innovations introduced, particularly the self-attention mechanism, made it possible to build prototypes that have an intuitive notion of context and understanding of the meaning and underlying patterns of the language. In 2020 OpenAI released GPT-3, a pretrained model focused on language generation, which showed promising results, creating text with a quality that made it difficult to distinguish whether they were written by a human or by a machine. As the source code is text generated in a formal language, it could be generated with tools based on these prototypes. This work presents a study of the evolution and the state of the art in this field: the automatic generation of source code from specifications written in a natural language. We navigate through different cases, their success, the difficulties of finding test mechanisms and their possible implementation in the future by companies. Sociedad Argentina de Informática e Investigación Operativa Articulo Articulo http://creativecommons.org/licenses/by-nc/4.0/ Creative Commons Attribution-NonCommercial 4.0 International (CC BY-NC 4.0) application/pdf 19-36
institution Universidad Nacional de La Plata
institution_str I-19
repository_str R-120
collection SEDICI (UNLP)
language Español
topic Ciencias Informáticas
Generación de código
Transformers
Modelos preentrenados
Automatización
spellingShingle Ciencias Informáticas
Generación de código
Transformers
Modelos preentrenados
Automatización
Bender, Adrián
Nicolet, Santiago
Folino, Pablo
Lopez, Juan José
Hansen, Gustavo
Generación automática de código fuente a través de modelos preentrenados de lenguaje
topic_facet Ciencias Informáticas
Generación de código
Transformers
Modelos preentrenados
Automatización
description Un Transformer es un modelo de Aprendizaje Profundo creado en 2017 con el objetivo de realizar traducciones entre lenguajes naturales. Las innovaciones que introdujo, particularmente la de auto-atención, han permitido construir prototipos que tienen una noción intuitiva del contexto, y comprenden el significado y los patrones subyacentes del lenguaje. En 2020 OpenAI hizo público GPT-3, un modelo preentrenado enfocado hacia la generación de lenguaje, que mostró resultados prometedores, creando textos con una calidad tal que se hace difícil distinguir si fueron escritos por un humano o por una máquina. Podemos afirmar que el código fuente es texto generado en un lenguaje formal, y por lo tanto podría ser generado con herramientas basadas en estos prototipos. Este trabajo presenta un estudio de la evolución y el estado del arte en este campo: la generación automática de código fuente a partir de especificaciones escritas en lenguaje natural. Recorremos diferentes casos, su éxito, las dificultades de encontrar mecanismos de evaluación y su posible implementación en un futuro por las empresas.
format Articulo
Articulo
author Bender, Adrián
Nicolet, Santiago
Folino, Pablo
Lopez, Juan José
Hansen, Gustavo
author_facet Bender, Adrián
Nicolet, Santiago
Folino, Pablo
Lopez, Juan José
Hansen, Gustavo
author_sort Bender, Adrián
title Generación automática de código fuente a través de modelos preentrenados de lenguaje
title_short Generación automática de código fuente a través de modelos preentrenados de lenguaje
title_full Generación automática de código fuente a través de modelos preentrenados de lenguaje
title_fullStr Generación automática de código fuente a través de modelos preentrenados de lenguaje
title_full_unstemmed Generación automática de código fuente a través de modelos preentrenados de lenguaje
title_sort generación automática de código fuente a través de modelos preentrenados de lenguaje
publishDate 2023
url http://sedici.unlp.edu.ar/handle/10915/156747
work_keys_str_mv AT benderadrian generacionautomaticadecodigofuenteatravesdemodelospreentrenadosdelenguaje
AT nicoletsantiago generacionautomaticadecodigofuenteatravesdemodelospreentrenadosdelenguaje
AT folinopablo generacionautomaticadecodigofuenteatravesdemodelospreentrenadosdelenguaje
AT lopezjuanjose generacionautomaticadecodigofuenteatravesdemodelospreentrenadosdelenguaje
AT hansengustavo generacionautomaticadecodigofuenteatravesdemodelospreentrenadosdelenguaje
_version_ 1807221077549514752