Hoy se anunciaron los últimos desarrollos en inteligencia artificial de NVIDIA con el lanzamiento de sus nuevos modelos de razonamiento, Llama 3.3 Nemotron Super 49B V1 y Llama 3.1 Nemotron Nano 8B V1. Estos modelos están ahora disponibles para los usuarios a través del Amazon Bedrock Marketplace y Amazon SageMaker JumpStart. Diseñados para transformar las aplicaciones de inteligencia artificial generativa, estas innovaciones permiten a las organizaciones crear, experimentar y escalar sus proyectos de IA de manera responsable en la plataforma AWS.
Una de las características más destacadas es la integración de los micronservicios de inferencia NVIDIA NIM, que simplifican el despliegue de los modelos de IA generativa. Esto se logra aprovechando los servicios gestionados de AWS, lo que acelera la implementación y permite a los desarrolladores incorporar aplicaciones de IA generativa con facilidad, utilizando solo un comando o unas pocas líneas de código.
El modelo Llama 3.3 Nemotron Super 49B V1 se destaca por su versión optimizada, que utiliza un enfoque de Búsqueda de Arquitectura Neuronal (NAS) para reducir su huella de memoria y mejorar la eficiencia. Con soporte para contextos de hasta 128,000 tokens, este modelo facilita tareas complejas como la generación aumentada de datos y la integración de herramientas. En paralelo, el modelo Llama 3.1 Nemotron Nano 8B V1, aunque más compacto, ofrece capacidades mejoradas para uso local.
Amazon Bedrock Marketplace proporciona acceso unificado y seguro a estos modelos de IA, permitiendo a las organizaciones personalizar su elección según sus necesidades específicas. Los modelos pueden ser utilizados en diversas aplicaciones, desde la redacción de contenidos hasta la clasificación de información.
Para comenzar a utilizar estos modelos, los usuarios deben suscribirse en Amazon Bedrock y seguir procedimientos sencillos para su implementación. Una vez suscritos, pueden realizar inferencias directamente a través de la consola de Bedrock o el SDK de SageMaker.
La llegada de los modelos Llama 3.3 y Llama 3.1 representa un avance significativo en la implementación de soluciones de IA avanzadas por parte de las empresas. Gracias a la infraestructura escalable de AWS, estas organizaciones pueden desplegar estos modelos de manera fácil y rápida, transformando sus aplicaciones de inteligencia artificial con tecnología de vanguardia.