Las empresas de Software como Servicio (SaaS) que gestionan múltiples inquilinos enfrentan un desafío crucial: extraer eficientemente información significativa de vastas colecciones de documentos mientras controlan los costos. Los enfoques tradicionales a menudo resultan en gastos innecesarios en recursos de almacenamiento y procesamiento no utilizados, lo que afecta tanto la eficiencia operativa como la rentabilidad. Por ello, las organizaciones necesitan soluciones que escalen inteligentemente los recursos de procesamiento y almacenamiento según los patrones de uso de los inquilinos, asegurando el aislamiento de los datos.
Los sistemas tradicionales de Recuperación Aumentada por Generación (RAG) consumen recursos valiosos al mantener embeddings de documentos que pueden nunca ser consultados. Esto genera costos de almacenamiento innecesarios y disminuye la eficiencia del sistema. Además, los sistemas diseñados para manejar numerosos inquilinos pequeños a medianos pueden sobrepasar los límites de estructuras de costos e infraestructura, o necesitar implementaciones en silos para separar la información y uso de cada inquilino. A esto se suma la naturaleza transitoria de muchos proyectos, donde los datos ocupan espacio innecesario, limitando el uso de sistemas activos.
Para enfrentar estos desafíos, se ha presentado una solución de base de conocimiento justo a tiempo, que optimiza el procesamiento de documentos solo cuando es necesario y elimina los recursos no utilizados. Esta solución permite a las organizaciones escalar sus repositorios de documentos sin incrementar los costos de infraestructura de manera proporcional.
Con una arquitectura multi-inquilino y límites personalizables, los proveedores pueden ofrecer modelos de precios escalonados manteniendo una separación estricta de datos. La expiración automática de documentos mediante la función de Tiempo de Vida (TTL) asegura un sistema ágil y centrado en contenido relevante, mientras que la actualización del TTL para documentos frecuentemente accedidos optimiza el rendimiento. Además, la arquitectura permite limitar la cantidad de archivos que un inquilino puede ingresar y la tasa de consulta a un conjunto de archivos.
Diseñada con tecnologías sin servidor, esta solución busca aliviar la carga operativa y ofrecer escalado automático, permitiendo que los equipos se enfoquen en la lógica de negocio en vez de la gestión de infraestructura. Al organizar documentos en grupos con filtrado basado en metadatos, el sistema facilita consultas contextuales que proporcionan resultados más relevantes sin comprometer la seguridad entre inquilinos. La flexibilidad de la arquitectura permite personalizar configuraciones de inquilinos, tasas de consulta y políticas de retención, adaptándose a las necesidades empresariales en evolución sin una reestructuración significativa.
En resumen, la solución de base de conocimiento justo a tiempo revoluciona la gestión de documentos al procesarlos solo cuando son requeridos, eliminando el consumo innecesario asociado con sistemas RAG tradicionales. Utilizando Amazon Bedrock, OpenSearch Serverless y la función TTL de DynamoDB, se ha creado un sistema ágil con gestión inteligente del ciclo de vida de documentos, límites configurables para inquilinos y una separación de datos esencial para proveedores SaaS que ofrecen modelos de precios escalonados.