Explorando la Nueva Frontera en la IA

Elena Digital López

Durante la cumbre de NYC AIAI, Joseph Nelson, CEO y cofundador de Roboflow, llamó la atención sobre un aspecto crucial de la inteligencia artificial: la visión. Aunque los modelos de lenguaje suelen ser el centro de atención, Nelson destacó que la interpretación visual de las máquinas es igualmente esencial para desarrollar sistemas inteligentes que funcionen en entornos reales.

Nelson mostró cómo la IA visual ya está revolucionando varias industrias, desde la reactivación instantánea en eventos deportivos como Wimbledon hasta el control de calidad en fábricas de vehículos eléctricos. Según explicó, Roboflow cuenta con una comunidad de un millón de desarrolladores que están implementando aplicaciones de IA visual tanto en producción como en proyectos de código abierto, demostrando que la comprensión visual está avanzando a gran escala.

En su presentación, Nelson abordó tres temas clave sobre la IA visual:

  1. Casos extremos en visión por computadora: Estas situaciones raras o impredecibles limitan la capacidad de los modelos para comprender completamente el mundo real.

  2. Futuro de los modelos visuales: Se debate si un único modelo dominará o si el futuro está en una colección de modelos más pequeños y especializados para tareas concretas.

  3. IA visual en tiempo real en el borde: Nelson enfatizó la importancia de que los sistemas operen en tiempo real y con datos propios, lo que es crucial para la implementación efectiva de la IA visual.

Nelson también señaló que la vista es uno de los sentidos principales del ser humano. Con ejemplos prácticos, mostró cómo dotar de percepción visual a los sistemas de software permite responder preguntas específicas, como cuántas personas hay en una sala o cómo se fabrica un producto de manera correcta.

Roboflow se presenta como un actor clave, ofreciendo herramientas que facilitan a las empresas la implementación de IA visual. Nelson compartió que más de la mitad de las empresas Fortune 100 están utilizando Roboflow, especialmente aquellas que dependen de la precisión en el mundo físico.

Con vistas al futuro, Nelson subrayó que el compromiso de Roboflow con el código abierto es vital para avanzar en la comprensión visual. La compañía ofrece un paquete llamado Supervision, diseñado para ayudar a los desarrolladores a integrar detecciones en sistemas más grandes. Además, busca simplificar el proceso completo de la IA visual con herramientas de código abierto.

En cuanto a la implementación, empresas como Rivian usan modelos de Roboflow para asegurar la calidad del producto. De manera similar, los quioscos de autoescaneo de Walmart utilizan cámaras para detectar automáticamente los productos en los carritos, gracias a sus desarrollos.

Nelson concluyó con un mensaje claro: para que la IA cumpla su promesa en el mundo real, debe ser capaz de ver y comprender ese mundo. La comprensión visual es una acción crucial en el camino hacia la inteligencia visual, y los desarrolladores juegan un papel fundamental en el avance de esta tecnología.

Scroll al inicio