Recientemente, las organizaciones han enfrentado el desafío de gestionar enormes conjuntos de datos que abarcan diversos sectores, como las finanzas, recursos humanos y seguridad. Estos datos están a menudo almacenados en distintas plataformas y requieren un profundo conocimiento para su extracción. Sin embargo, con los avances en inteligencia artificial generativa, se ha desarrollado una tecnología que convierte lenguaje natural en consultas SQL (NL2SQL), simplificando el acceso a estas bases de datos complejas. A pesar de este progreso, sigue siendo un reto la conversión precisa de consultas en lenguaje natural a SQL avanzado.
Este desafío se debe principalmente a los esquemas de bases de datos, que suelen estar optimizados más para el almacenamiento que para la recuperación, lo que hace que las consultas sean complejas, con estructuras anidadas y datos multidimensionales. Para enfrentar este problema, equipos de AWS y Cisco han creado un enfoque que simplifica el proceso necesario para generar SQL, utilizando modelos generativos más simples y económicos, mejorando así el acceso a datos empresariales.
Las dificultades de NL2SQL a nivel empresarial incluyen la complejidad de los esquemas de bases de datos, la diversidad de consultas en lenguaje natural y las limitaciones en el conocimiento de los modelos de lenguaje. Además, la atención requerida por estos modelos puede aumentar el tiempo de latencia, lo que empeora la inexactitud de los resultados. Por ello, la metodología de AWS y Cisco se enfoca en restringir el enfoque a dominios de datos específicos, facilitando la construcción de prompts para los modelos generativos.
Con este enfoque, se pretende optimizar el uso de recursos de la base de datos identificando correctamente las entidades mencionadas en las consultas y transformándolas en identificadores únicos. Esto facilita la generación de consultas SQL más precisas y menos complicadas. A través de pruebas realizadas con esta metodología, se han logrado altos niveles de precisión y consistencia en la generación de SQL y una mejor escalabilidad.
Este avance es significativo para las empresas, ya que mejora su capacidad para manejar y recuperar datos valiosos de forma eficiente. En conclusión, el desarrollo de esta metodología podría revolucionar la manera en que las organizaciones acceden a sus datos, haciéndolo más seguro y eficaz.