Meta ha presentado hoy Llama 4, una nueva serie de modelos multimodales que prometen revolucionar la forma en que interactuamos con la inteligencia artificial. Estos modelos, que estarán disponibles a través de Amazon SageMaker JumpStart y próximamente en Amazon Bedrock, representan el avance más significativo de la compañía en este ámbito. Con su innovadora arquitectura de mezcla de expertos (MoE) y una notable ventana de contexto de hasta 10 millones de tokens, Llama 4 está diseñado para manejar tareas complejas que van desde el procesamiento de texto hasta la visión por computadora.
Dentro de la oferta de Llama 4, se encuentran tres variantes de modelos: Scout, que proporciona capacidades multimodales avanzadas; Maverick, optimizado para ofrecer un rendimiento de alta calidad a un costo reducido; y una opción adicional, Behemoth, que se encuentra en fase de previsualización. El modelo Llama 4 Maverick cuenta con 17 mil millones de parámetros activos y 128 expertos, diseñado específicamente para aplicaciones de asistencia general y chat. Por su parte, Llama 4 Scout, más compacto, también con 17 mil millones de parámetros activos, ha sido optimizado para tareas de comprensión de texto e imagen y soporta 12 idiomas, facilitando la creación de aplicaciones de IA que cruzan barreras lingüísticas.
A través de SageMaker JumpStart, los desarrolladores pueden implementar estos modelos en un entorno seguro y personalizar su uso para adaptarse a necesidades específicas. La plataforma permite una integración sin complicaciones de modelos preentrenados en el ciclo de vida del desarrollo de inteligencia artificial, proporcionando acceso a una amplia variedad de arquitecturas sin necesidad de construir desde cero.
Meta ha subrayado que Llama 4 ofrece un incremento notable en la longitud del contexto que puede manejar en comparación con su predecesor, Llama 3, lo que permite tareas más complejas, como la creación de resúmenes a partir de múltiples documentos y razonamiento sobre extensos códigos fuente. Las aplicaciones de estos modelos son vastas, y su capacidad para procesar información de manera eficiente está diseñada no solo para tareas específicas, sino también para la automatización y mejora del rendimiento en entornos de trabajo.
A través de un enfoque en la facilidad de uso y la integración de múltiples modalidades, desde texto hasta imágenes, Llama 4 promete ser una herramienta valiosa para científicos de datos e ingenieros de ML que buscan soluciones innovadoras para problemas complejos. Con esta nueva oferta, Meta está estableciendo un precedente en la forma en que la inteligencia artificial puede intuir y reaccionar dentro de contextos variados, proporcionando a los usuarios una experiencia más rica y eficaz.