La inteligencia artificial generativa está revolucionando la forma en que las empresas abordan la innovación y la resolución de problemas. A medida que más compañías pasan de experimentaciones iniciales a implementaciones a gran escala, se observa una integración cada vez mayor de estas tecnologías en los procesos esenciales de las organizaciones. Este avance abarca distintas líneas de negocio, equipos y proveedores de software como servicio (SaaS). No obstante, con la creciente adopción de estas tecnologías por parte de los clientes de AWS, surgen nuevos desafíos relacionados con la gestión efectiva y la escalabilidad de las implementaciones.
Entre los principales retos se destaca la necesidad de abstraer y reutilizar aspectos comunes como la multi-tenencia, la autenticación, la autorización y la seguridad de la red. Para los proveedores de SaaS que atienden a múltiples clientes empresariales y organizaciones con requisitos de cumplimiento rigurosos, una arquitectura de múltiples cuentas es altamente beneficiosa. Esta no solo mejora la organización y seguridad del entorno de AWS, sino que también permite gestionar de forma más eficiente las inquietudes comunes a medida que se expanden las implementaciones de inteligencia artificial generativa.
En una serie de dos publicaciones, se presenta un patrón de arquitectura de hub y spoke para desarrollar un sistema multi-tenant y multi-cuenta. La primera parte describe un hub centralizado para las abstracciones de servicios de inteligencia artificial generativa, con «spokes» específicos para cada inquilino, usando AWS Transit Gateway para la interoperabilidad entre cuentas. Esta cuenta central actúa como punto de entrada para las solicitudes de los usuarios, centralizando funciones cruciales como la autenticación y el enrutamiento.
La segunda parte explorará una variación de esta arquitectura utilizando AWS PrivateLink, permitiendo compartir de forma segura el punto de acceso centralizado en la cuenta hub con equipos internos o socios externos. Ambas publicaciones se enfocan en la centralización de la autenticación, autorización y acceso a modelos, junto con redes seguras entre múltiples cuentas para facilitar la incorporación y escalado de casos de uso de inteligencia artificial generativa.
Esta solución se basa en una arquitectura de hub y spoke que proporciona un sistema seguro y escalable para gestionar implementaciones de inteligencia artificial generativa a través de múltiples cuentas. La cuenta hub, actuando como núcleo central, ofrece servicios comunes a todos los inquilinos, sirviendo como punto de entrada para las solicitudes de los usuarios finales. Las cuentas spoke, por otro lado, contienen recursos específicos para cada inquilino, como roles de permisos y recursos de Amazon Bedrock. Esta configuración permite un flujo de solicitudes centralizado mientras se mantiene la separación entre inquilinos.
En las consideraciones de diseño, destaca la utilización de funciones Lambda en la cuenta hub para la validación de tokens y la lógica de enrutamiento, facilitando así la centralización de la gestión de la lógica empresarial, así como la monitorización y el registro. Esta flexibilidad permite a las organizaciones adaptar la arquitectura a sus necesidades específicas y posibles futuras extensiones.
Con el incremento en la adopción de arquitecturas multi-tenant y nuevas capacidades de AWS, las organizaciones tienen la oportunidad de crear soluciones robustas que maximicen el potencial de la inteligencia artificial generativa, abordando simultáneamente los desafíos de escalabilidad y seguridad inherentes a su implementación.