Nueva Infraestructura de IA en AWS con NVIDIA Blackwell: Soluciones de Cálculo para la Próxima Frontera

Elena Digital López

Un nuevo avance en el ámbito de la inteligencia artificial ha sido anunciado con la disponibilidad general de los P6e-GB200 UltraServers de AWS, una solución potente que promete transformar el entrenamiento y despliegue de modelos de inteligencia artificial a gran escala. Estos servidores, potenciados por los innovadores chip NVIDIA Grace Blackwell, están diseñados específicamente para satisfacer las crecientes demandas computacionales de aplicaciones que van desde el descubrimiento de medicamentos hasta el desarrollo de software.

Los P6e-GB200 UltraServers se presentan como la oferta de GPU más potente de AWS hasta la fecha y permiten la interconexión de hasta 72 GPUs NVIDIA Blackwell, ofreciendo una capacidad de cómputo de 360 petaflops y 13.4 TB de memoria GPU de alta velocidad. Esta arquitectura permite que todos los GPUs operen como una única unidad de cómputo, optimizando la eficiencia en el entrenamiento distribuido al reducir la sobrecarga de comunicación entre nodos.

Por otro lado, AWS también ha lanzado instancias P6-B200, que presentan una configuración más versátil para cargas de trabajo de inteligencia artificial medianas a grandes. Estas instancias están equipadas con 8 GPUs NVIDIA Blackwell y están diseñadas para facilitar la migración de cargas de trabajo existentes, ofreciendo un rendimiento mejorado en comparación con generaciones anteriores.

La innovación no se limita a la capacidad de cómputo; también incluye un enfoque en la seguridad y estabilidad del sistema. El sistema Nitro de AWS, que gestiona funciones de seguridad y optimización, asegura que las cargas de trabajo de inteligencia artificial estén protegidas y sean confiables, lo cual es fundamental en un entorno donde cualquier interrupción puede afectar significativamente los plazos de producción.

Además, AWS ha integrado soluciones de enfriamiento líquido en los P6e-GB200, permitiendo una mayor densidad de cómputo y rendimiento en comparación con el sistema de aire enfriado utilizado en los P6-B200. Este tipo de innovación no solo mejora la eficiencia energética, sino que también reduce considerablemente el riesgo de fallos en el sistema.

Para facilitar la adopción de estas nuevas instancias, AWS ofrece múltiples vías de implementación, incluyendo Amazon SageMaker HyperPod, que proporciona infraestructura gestionada para optimizar el desarrollo de la inteligencia artificial. Asimismo, los usuarios de Kubernetes pueden gestionar sus cargas de trabajo a gran escala a través del Servicio de Kubernetes de Amazon, que integra las nuevas instancias de manera eficiente.

Este lanzamiento representa un hito en la infraestructura de inteligencia artificial y marca un nuevo capítulo en la evolución del sector tecnológico, brindando las herramientas necesarias para explorar un futuro lleno de posibilidades. Con los P6e-GB200 UltraServers y P6-B200, AWS se posiciona como un líder en la habilitación de la innovación y la escalabilidad en el campo de la inteligencia artificial.

Scroll al inicio