Personalización de los modelos de Amazon Nova para mejorar el uso de herramientas

Elena Digital López

Los modelos de lenguaje de gran tamaño (LLMs) han demostrado ser excepcionales en el procesamiento del lenguaje, pero su capacidad se ve limitada por datos de entrenamiento estáticos. A medida que las industrias exigen una inteligencia artificial más adaptativa para la toma de decisiones, la integración de herramientas y APIs externas se ha vuelto esencial. Esto ha conducido a la evolución de los flujos de trabajo autónomos, donde los sistemas de IA pueden planificar, ejecutar y refinar tareas de manera autónoma. El uso preciso de herramientas es fundamental para mejorar la toma de decisiones y la eficiencia operativa de estos agentes autónomos.

Recientemente, se han introducido los modelos Amazon Nova en el AWS re:Invent de diciembre de 2024, optimizados para ofrecer un rendimiento excepcional a un bajo costo. Esta serie incluye variantes como Micro, Lite y Pro, cada una adaptada a diferentes necesidades de uso. Los modelos de Amazon Nova permiten la conexión con herramientas o servicios externos mediante lo que se conoce como «llamadas a herramientas». Esta integración expande enormemente las capacidades de los LLMs, permitiéndoles acceder a datos en tiempo real y realizar cómputos específicos del dominio.

Para la implementación de estos modelos, se utiliza la consola de Amazon Bedrock y APIs como Converse e Invoke. Esto permite a los desarrolladores afinar los modelos con datos multimodales o texto, aumentando la precisión y eficiencia en la utilización de herramientas. El uso correcto de herramientas en LLMs implica seleccionar adecuadamente la herramienta y extraer los argumentos necesarios para su funcionamiento.

Un dataset sintético fue creado para facilitar la llamada a herramientas, estructurado en pares clave-valor que definen consultas, el recurso necesario para responder y posibles restricciones. De un conjunto de entrenamiento de 560 preguntas y 120 preguntas en el conjunto de prueba, se desarrollaron ejemplos que ayudaron a evaluar la precisión y la efectividad de las herramientas.

Tras la preparación del dataset, se emprende un proceso de ajuste fino utilizando técnicas de personalización que permite adaptar los modelos a tareas específicas. Los resultados hasta ahora muestran mejoras significativas en la precisión de llamada a herramientas y en la argumentación, destacando que estos modelos ligeros pueden ser competidores fuertes en aplicaciones donde la precisión es crítica.

En resumen, la innovación en la integración de herramientas y la personalización de modelos a través de plataformas como Amazon Nova y Amazon Bedrock están revolucionando cómo las empresas utilizan la inteligencia artificial para abordar problemas complejos y mejorar la eficiencia operativa.

Scroll al inicio