Amazon ha lanzado una función muy esperada en su servicio SageMaker HyperPod: el escalado automático gestionado de nodos mediante Karpenter. Esta incorporación permitirá a las empresas ajustar eficazmente sus clústeres de SageMaker HyperPod para satisfacer las demandas de inferencia y entrenamiento en tiempo real, especialmente en situaciones donde el tráfico es impredecible.
Esta funcionalidad de escalado automático es esencial para cumplir con las garantías de nivel de servicio (SLA) en entornos de producción. En estos contextos, las demandas pueden aumentar significativamente, y contar con una solución de SageMaker que gestiona el proceso operativo simplifica las tareas. De este modo, se elimina la necesidad de que los usuarios instalen y mantengan los controladores de Karpenter, lo que incrementa la eficiencia y reduce costos.
Actualmente, empresas como Perplexity, HippocraticAI, H.AI y Articul8 ya utilizan SageMaker HyperPod. Con la evolución de muchas organizaciones que pasan de entrenar modelos fundamentales a ejecutar inferencias a gran escala, el escalado automático de nodos GPU se torna esencial para manejar el tráfico real en producción.
La integración de Karpenter, un conocido administrador del ciclo de vida de nodos en Kubernetes, con SageMaker HyperPod, ofrece una infraestructura resiliente y unifica la gestión de nodos. Esta combinación trae múltiples ventajas, como el aprovisionamiento justo a tiempo, la selección de nodos basada en la carga de trabajo y la escala a cero, optimizando así el uso de recursos sin necesitar infraestructura dedicada para los controladores.
Las nuevas capacidades permiten que los clústeres de SageMaker HyperPod se transformen en infraestructuras dinámicas y optimizadas por costos que se ajustan a la demanda, asegurando que las cargas de trabajo se gestionen eficazmente. Además, el monitoreo constante del rendimiento garantiza que los clústeres mantengan una utilización óptima de recursos, ajustando la capacidad de forma automática cuando sea necesario.
Con esta innovadora capacidad de escalado automático, SageMaker HyperPod se posiciona como una solución eficiente y alineada con las actuales necesidades del mercado para la gestión de cargas de trabajo de machine learning en entornos complejos y en constante cambio.