Amazon SageMaker Inference ha emergido como una herramienta preferida para el despliegue de modelos de aprendizaje automático (ML) e inteligencia artificial generativa a gran escala. A medida que las aplicaciones de IA aumentan en complejidad, los usuarios requieren despliegues coordinados de múltiples modelos para procesar solicitudes de inferencia colectivamente. La creciente complejidad de las aplicaciones de IA generativa ha subrayado la necesidad de ofertas de inferencia más sofisticadas.
Para atender esta necesidad, se ha implementado una nueva capacidad en el SageMaker Python SDK, mejorando significativamente la construcción y despliegue de flujos de trabajo de inferencia. Por ejemplo, a través de Amazon Search, esta función facilita la creación de estos flujos, proporcionando una experiencia simplificada que abstrae las complejidades del empaquetado y despliegue de modelos, permitiendo a los desarrolladores concentrarse en la lógica de negocio e integraciones.
Entre las mejoras clave del nuevo SDK se encuentra el despliegue de múltiples modelos como componentes de inferencia dentro de un único punto final de SageMaker. Esto crea un flujo de trabajo unificado, reduciendo el número de puntos finales a gestionar, mejorando la eficiencia operativa y reduciendo potencialmente costos.
Otra innovación destacada es el modo de flujo de trabajo, que amplía las capacidades del Model Builder. Los usuarios pueden definir flujos de trabajo de inferencia utilizando código en Python, facilitando la creación de flujos de múltiples pasos y conexiones entre modelos. Esta flexibilidad se refleja en nuevas opciones de desarrollo y despliegue, permitiendo un despliegue más rápido en entornos experimentales.
El enfoque en la gestión eficiente de dependencias permite usar los contenedores de aprendizaje profundo de SageMaker, ya configurados con bibliotecas y herramientas de servicio de modelos, proporcionando un punto de partida para casos comunes.
La posibilidad de invocar modelos individuales o flujos de trabajo completos ofrece flexibilidad para adaptarse a necesidades específicas, ideal en escenarios que requieren interacción específica sin comprometer todo el sistema.
Amazon Search, un pionero en adoptar estas mejoras, ha señalado cómo el nuevo SDK se alinea con sus necesidades para flujos de clasificación, permitiendo la reutilización de modelos compartidos y adaptando la lógica para distintas categorías de productos. Esta funcionalidad optimiza su infraestructura de búsqueda, permitiendo iteraciones rápidas en algoritmos de coincidencia y clasificación.
En resumen, las mejoras en el SageMaker Python SDK representan un avance significativo en el desarrollo y despliegue de flujos de trabajo complejos de IA, permitiendo a los usuarios centrarse en la innovación en lugar de la gestión de infraestructuras.