Automatización de la Creación de Notas Informativas con Amazon Bedrock

Elena Digital López

Las empresas de diversos sectores enfrentan crecientes desafíos para transformar grabaciones de reuniones y presentaciones en documentos estructurados. La tarea de convertir estos materiales requiere un significativo esfuerzo manual, ya que se debe revisar grabaciones, transcribir contenido hablado, capturar pantallas, sincronizar elementos visuales con notas y formatear el contenido. Estos procesos no solo son exhaustivos sino que afectan la productividad y la escalabilidad, particularmente en la gestión de múltiples grabaciones, sesiones de conferencias o materiales educativos.

Para optimizar este complejo proceso, Amazon ha introducido una solución automatizada y sin servidor que promete ser altamente efectiva. Utilizando la automatización de datos de Amazon Bedrock, es posible convertir grabaciones de seminarios web en minutas detalladas. Esta innovadora implementación permite transcribir diálogos, detectar cambios de diapositivas y refinar transcripciones mediante modelos de base de Amazon Bedrock. Todo el procedimiento es orquestado por funciones personalizadas de AWS Lambda y AWS Step Functions.

La automatización de Amazon Bedrock emplea inteligencia artificial generativa para convertir datos multimodales, como imágenes y videos, en formatos estructurados personalizables que incluyen resúmenes de escenas en videos y detección de contenido explícito. Esto facilita la extracción de segmentos de audio y diferentes planos de video.

El flujo de trabajo automatizado comienza al subir un video a Amazon Simple Storage Service (S3), lo cual desencadena un evento a través de Amazon EventBridge que inicia el procesamiento. Amazon Bedrock Data Automation realiza un trabajo de transformación para identificar cambios. Al completarse, sincroniza el contenido hablado con las imágenes. Luego, se ejecuta un paso paralelo para crear capturas de pantalla de las diapositivas y refina las transcripciones eliminando disfluencias.

Finalmente, se generan las minutas usando la biblioteca Python-PPTX, combinando las transcripciones refinadas con las imágenes generadas. Los materiales resultantes se almacenan en Amazon S3, listos para ser distribuidos. Esta solución no solo reduce significativamente el esfuerzo manual, sino que también mejora la integración y escalabilidad para organizaciones de cualquier tamaño y sector.

Scroll al inicio