Modelo de inteligencia artificial en el borde basado en ollama para inferencia local en dispositivos de internet de las cosas

No Thumbnail Available
Date
2026
Journal Title
Journal ISSN
Volume Title
Publisher
PUCE - Esmeraldas
Abstract
El Internet de las Cosas (IoT) ha incrementado la dependencia de la computación en la nube para el procesamiento de datos y la toma de decisiones, introduciendo riesgos de latencia y seguridad, particularmente en dominios sensibles como la vida asistida y los hogares inteligentes. Este trabajo presenta la Arquitectura de Borde Integrada con Ollama (OLLiE), que permite el razonamiento local en dispositivos IoT embebidos mediante modelos de lenguaje de gran tamaño (LLM) cuantizados. Los experimentos realizados en un escenario de hogar inteligente asistido demuestran que los LLM desplegados localmente logran un rendimiento competitivo en razonamiento, preservando al mismo tiempo la privacidad de los datos. El modelo cuantizado phi-3.5-mini (Q2_K) alcanzó un F1-score de 0.45 y un recall de 0.69, superando a varias alternativas basadas en la nube. Aunque la inferencia en el borde presenta una latencia mayor que la ejecución en la nube(76–115 s frente a <5s), estos retrasos son aceptables para aplicaciones asistivas tolerantes a la latencia. En conjunto, los resultados muestran que la cuantización de modelos equilibra la precisión del razonamiento, las limitaciones de hardware y la preservación dela privacidad, posicionando a OLLiE como una arquitectura viable para entornos IoT de borde seguros y autónomos.
Description
Keywords
Internet de las cosas, Medidas de seguridad
Citation