Migración De Servidores De Seguimiento MLflow A Amazon SageMaker AI Con MLflow Sin Servidores

Elena Digital López

Operar un servidor de seguimiento de MLflow autogestionado implica una considerable carga administrativa, incluyendo el mantenimiento del servidor y la escalabilidad de los recursos. Con el crecimiento de los experimentos de aprendizaje automático, gestionar efectivamente los recursos durante periodos de alta demanda se convierte en un verdadero desafío. Las organizaciones que utilizan MLflow en Amazon EC2 o en servidores locales pueden optimizar costos y recursos al migrar a Amazon SageMaker AI con MLflow sin servidor.

Recientemente, se ha publicado una guía que ofrece un camino claro para trasladar un servidor de seguimiento MLflow autogestionado a una solución sin servidor en SageMaker AI. Esta nueva aplicación ajusta automáticamente los recursos según la demanda y elimina la gestión de servidores y almacenamiento sin coste adicional. La guía incluye instrucciones sobre cómo utilizar la herramienta MLflow Export Import para transferir elementos como experimentos, ejecuciones y modelos, junto con pasos para validar el éxito de la migración.

Aunque el enfoque principal es la migración de servidores autogestionados, la herramienta MLflow Export Import tiene aplicaciones más amplias, como la migración de servidores administrados de SageMaker a la capacidad sin servidor de MLflow. También facilita las actualizaciones de versiones y los planes de respaldo para la recuperación ante desastres.

La migración se lleva a cabo en tres fases: exportar los artefactos de MLflow, configurar una aplicación MLflow y finalmente importar los artefactos. Este proceso puede realizarse desde una instancia de EC2, un ordenador personal o un cuaderno de SageMaker, asegurando conectividad con el servidor de origen y de destino.

Es esencial verificar la compatibilidad de la versión de MLflow antes de comenzar, asegurando versiones soportadas tanto en el servidor original como en el nuevo entorno en SageMaker. Se recomienda contar con la última versión de MLflow para facilitar la migración.

Tras crear una nueva aplicación MLflow en SageMaker, el siguiente paso es instalar MLflow y el plugin de SageMaker en el entorno de ejecución para establecer la conexión. Luego, se instala la herramienta MLflow Export Import para proceder con la transferencia e importación de los recursos.

Es crucial validar que todos los recursos han sido transferidos correctamente, asegurando que experimentos y ejecuciones estén completos y que los artefactos de modelos sean accesibles. En grandes migraciones, se aconseja realizar el proceso en lotes más pequeños.

Finalmente, es importante considerar que un servidor administrado por SageMaker generará costos mientras esté activo. Se sugiere detener los servidores cuando no estén en uso para evitar gastos innecesarios.

La adopción de una aplicación MLflow sin servidor en Amazon SageMaker AI reduce la carga operativa del mantenimiento de la infraestructura de MLflow y ofrece una integración fluida con los diversos servicios de AI/ML de SageMaker. Se invita a los interesados a seguir la guía y consultar la documentación para detalles adicionales.

Scroll al inicio