Forjando IA Especializada Sin Perder Inteligencia: La Magia de Nova Forge en Acción

Por Notas Incubaweb

X (Twitter) Facebook Pinterest LinkedIn Email WhatsApp

Los modelos de lenguaje grandes han demostrado ser efectivos en tareas generales, pero enfrentan dificultades cuando se trata de trabajos especializados que requieren comprensión de datos internos y terminología específica del sector. Para adaptar estos modelos a contextos organizacionales, se utiliza un proceso conocido como ajuste fino supervisado (SFT). Este puede llevarse a cabo mediante dos metodologías: el ajuste de parámetros eficientes (PEFT), que actualiza solo un subconjunto de parámetros, y el SFT de rango completo, que ajusta todos los parámetros del modelo.

Sin embargo, el SFT de rango completo enfrenta el desafío del «olvido catastrófico». Esto ocurre cuando los modelos aprenden patrones específicos de un dominio y pierden capacidades generales, lo que obliga a las organizaciones a elegir entre especialización e inteligencia general, limitando así su utilidad.

Amazon ha presentado una solución con Nova Forge, un servicio que permite a los usuarios construir sus propios modelos mediante el uso de Nova. Los clientes pueden empezar el desarrollo desde modelos tempranos y combinar datos propios con datos curados por Amazon, alojando sus modelos personalizados en AWS de manera segura.

Un equipo de AWS China evaluó Nova Forge en una tarea compleja de clasificación de la Voz del Cliente (VOC), trabajando con más de 16,000 comentarios y una jerarquía de etiquetas con 1,420 categorías. Se demostró que el enfoque de mezcla de datos de Nova Forge ofrece un aumento del 17% en el puntaje F1 en rendimiento en dominios específicos, manteniendo además capacidades generales y habilidades de seguimiento de instrucciones tras el ajuste.

La clasificación de comentarios de clientes es típica en grandes empresas de comercio electrónico, donde se recibe una gran cantidad de comentarios diariamente. Necesitan un modelo que clasifique cada comentario con alta precisión y genere respuestas adecuadas, además de realizar análisis de datos.

La evaluación incluyó un marco dual que mide el rendimiento específico del dominio usando un conjunto de datos real de VOC. Se observaron mejoras significativas en el F1-score, resaltando la efectividad de la mezcla de datos de Nova en mitigar el olvido catastrófico.

Los resultados indican que al mezclar datos durante el ajuste, se puede mantener un alto rendimiento en tareas específicas sin sacrificar las habilidades generales. Se recomienda utilizar el SFT supervisado para maximizar el rendimiento en el dominio y aplicar la mezcla de datos de Nova para múltiples flujos de trabajo en producción.

En conclusión, Nova Forge muestra cómo las organizaciones pueden construir modelos de IA especializados sin renunciar a la inteligencia general, ofreciendo beneficios adicionales en el desarrollo e implementación de soluciones de IA generativa en entornos empresariales.

X (Twitter) Facebook Pinterest LinkedIn Email WhatsApp

Notas Incubaweb

Content and Social Media Director de Color Vivo. Escribo sobre emprendedores, startups, comunicaciÃ³n, marketing, redes sociales, blogs, apps mÃ³viles, SEO, SEM y mÃ¡s â†’ Web

Forjando IA Especializada Sin Perder Inteligencia: La Magia de Nova Forge en Acción

Notas Incubaweb

Últimos artículos

Forjando IA Especializada Sin Perder Inteligencia: La Magia de Nova Forge en Acción

Tipos de MacBook: lo que debes saber para elegir el que mejor se adapte a ti

Protegiendo la Cadena de Suministro de Software IA: Resultados de Seguridad en 67 Proyectos de Código Abierto

Directivas Pendientes: La Necesidad Urgente de Reducir Residuos Electrónicos en la UE

Eviden Completa Innovador Sistema de Monitoreo Satelital para la EETT

Artículos relacionados

Molmatric Finaliza Con Éxito Su Colaboración en el Proyecto Safe-Air de Estructuras Aéreas Sostenibles

Tipos de MacBook: lo que debes saber para elegir el que mejor se adapte a ti

Protegiendo la Cadena de Suministro de Software IA: Resultados de Seguridad en 67 Proyectos de Código Abierto

Directivas Pendientes: La Necesidad Urgente de Reducir Residuos Electrónicos en la UE

Eviden Completa Innovador Sistema de Monitoreo Satelital para la EETT

Internxt Logra la Certificación ENS de Nivel Alto

Lecciones Aprendidas de la Modernización de COBOL en el Mundo Real

ONLYOFFICE 9.3: más músculo para PDF, vista multipágina y un Solver para hojas de cálculo

DECORACIÓN

TECNOLOGÍA

LIFESTYLE

MIX

MEDIOS LOCALES