Preentrenamiento de un modelo GPT con arquitectura Transformer

Vallejo Monge, Stephano Luis Felipe

Preentrenamiento de un modelo GPT con arquitectura Transformer

https://repositorio.puce.edu.ec/handle/123456789/48273

Authors

Vallejo Monge, Stephano Luis Felipe

Files

Trabajo de Titulación - Grado / Vallejo Monge Stephano Luis Felipe (3.11 MB)

Date

2025

Publisher

PUCE - Quito

Abstract

Los modelos lingüísticos como GPT (Generative Pretrained Transformer) han transformado la forma en que se procesa la información. No obstante, su funcionamiento se basa en una arquitectura compleja que presenta desafíos de comprensión técnica. Este proyecto busca desglosar esa complejidad mediante la construcción de un modelo GPT, explorando paso a paso los fundamentos de la arquitectura Transformer. Al mismo tiempo, se propone aplicar este conocimiento a un caso práctico que demuestre su utilidad, como la generación de texto.

Keywords

Modelos GPT, Arquitectura de software, Lingüística computacional, Procesamiento de lenguaje natural (Computadores)

Collections

Tesis – Ingeniería en Sistemas de Información (Sin Restricción)

Full item page