Potencia tu Entrenamiento y Evaluación de LLM con Nuevas Herramientas de IA Generativa de SageMaker

Elena Digital López

Amazon ha anunciado nuevas mejoras en SageMaker AI con la incorporación de dos plantillas de interfaz de usuario: Text Ranking y Question and Answer. Estas herramientas se han diseñado para optimizar la calidad de los modelos de lenguaje mediante la obtención de comentarios estructurados de los usuarios.

La plantilla Text Ranking permite a los anotadores humanos evaluar respuestas generadas por un modelo de lenguaje grande (LLM) basándose en criterios como la relevancia, claridad o precisión. Este proceso de retroalimentación es crucial para mejorar los modelos a través del Reinforcement Learning from Human Feedback (RLHF), afinando las respuestas del modelo según las preferencias humanas.

Por su parte, la plantilla Question and Answer facilita la creación de pares de preguntas y respuestas de alta calidad desde textos. Estos datos actúan como base para el Supervised Fine-Tuning (SFT), enseñando a los modelos a responder con precisión a entradas similares.

Para utilizar estas plantillas, los usuarios deben ingresar a la consola de SageMaker AI, donde se ha añadido una nueva categoría llamada Generative AI en el tipo de tarea. Desde allí, pueden crear trabajos de etiquetado especificando la ubicación del manifiesto de entrada y la ruta de salida.

La plantilla Text Ranking requiere la provisión de un archivo JSON con el contenido a clasificar, permitiendo una evaluación estructurada. Las respuestas anotadas se guardan en un bucket de S3 especificado, facilitando una evaluación continua.

Asimismo, la plantilla Question and Answer permite generar preguntas y respuestas relevantes desde pasajes de texto, con un formato flexible y una función de coincidencia codificada por colores para identificar rápidamente las secciones relevantes.

Además de la interfaz gráfica, se ofrece una API de Creación de Trabajos de Etiquetado, que permite configurar estos trabajos de manera programática, integrándose en flujos de trabajo existentes.

Con estas novedades, Amazon SageMaker AI busca empoderar a sus usuarios para generar conjuntos de datos de alta calidad de forma eficiente, facilitando así el entrenamiento y evaluación de modelos de lenguaje alineados con las necesidades de los usuarios.

Scroll al inicio