Prototipo de Aplicación Web para la Exploración Práctica de Modelos Generativos Multimodales

Resumen

Este trabajo presenta un prototipo de aplicación web para experimentar con pipelines configurables de IA orientada a estudiantes de grado. Además cuenta con instancias de benchmark tales como GSM-Symbolic y MMLU. El prototipo provee una interfaz que permite a los usuarios interactuar con modelos de Lenguaje de Gran Escala (LLM) de forma encadenada y modelos de lenguaje de visión (VLM) o explorar los problemas contenidos dentro de los benchmarks para los diferentes LLMs. La ejecución de tareas de generación de texto, traducción, resumen, parafraseo, descripción de imágenes y su arquitectura permite el encadenamiento dinámico de modelos y funciones. Posee un componente de métricas que visualiza el rendimiento de cada etapa del pipeline, incluyendo latencia, polaridad, subjetividad, coherencia, nube de palabras, reconocimiento de entidades y estadísticas. Mediante esto busca evidenciar que estos modelos son propensos a cometer errores, mientras su respuesta parece ser correcta reproduciendo patrones aprendidos durante su fase de entrenamiento.

Ver publicación

Scroll al inicio
Skip to content