¿Por qué la precisión y la gobernanza son esenciales en Agentic AI?
A fines de los años ’90, los fundadores de Google intentaron vender su algoritmo a Yahoo por una suma relativamente pequeña (según diversas crónicas, entre 1 y 2 millones de dólares). Este rechazó la oferta y la calificó de “mejora marginal” respecto a su tecnología. Hoy resulta históricamente significativo: ese “poco más” marcó la diferencia del futuro de la búsqueda.
La carrera tecnológica por desplegar sistemas agentic de IA podría llevarnos a repetir ese error: centrarnos en modelos más grandes o en la conectividad con APIs y perder de vista que lo puede marcar la diferencia es la precisión contextual, la gobernanza del sistema y su capacidad para operar con eficacia en entornos reales. Aquí entra el concepto de LLMOps.
¿Qué es LLMOps y por qué importa?
LLMOps abarca todo el ciclo de vida de una solución de agentic AI en empresas:
- Desarrollo y validación: diseño de casos de uso, pilotos, medición e iteración.
 - Despliegue y operación: implementación en entornos reales, monitoreo y gestión de alertas.
 - Medición y mejora continua: análisis de métricas, ajuste de prompts, redefinición de objetivos y optimización de costos.
 
Las 5 dimensiones clave del context management
Dentro del context management destacan cinco dimensiones que considero críticas:
- Base de conocimiento: las PoC de GenAI son rápidas porque partimos del modelo fundacional desde el primer momento. Incluir la información del propio negocio requiere de un modelado de datos en bases de datos vectoriales o de grafos, los llamados RAG. Estructuración, chunking, embeddings y diseño eficiente del repositorio son esenciales con grandes volúmenes de datos.
 - Seguridad y confiabilidad: las alucinaciones o respuestas fuera del marco de tolerancia definido para el caso de uso pueden arruinar una implementación. Es necesario hacer una gestión de guardarraíles con base en las políticas de seguridad, límites operacionales, trazabilidad y cumplimiento normativo.
 - Reglas de negocio: cuando explicamos casos de uso de agentic surge una pregunta recurrente: dónde están las reglas de negocio. En su mayoría, en los prompts. Por eso son esenciales los templates de los prompts y las técnicas de prompt management para gobernarlos como un activo más: versionado, auditable, adaptable al aprendizaje continuo.
 - Memoria: en los primeros casos de GenAI, las soluciones con enfoques más de asistentes, se limitaban a una gestión de memoria de corto plazo. El mundo agéntico, en el que varios agentes intervienen en una jornada, necesita gestión de memoria de largo plazo para dar continuidad en la funcionalidad.
 - Inteligencia: elegir el LLM más adecuado por dominio, valorar SLM o incluso VideoLM, explorar fine-tuning, modelos abiertos o enfoques de private AI son opciones a considerar para escoger la mejor para nuestro caso.
 
¿Qué papel juegan las plataformas low-code y no-code?
En mi opinión, las plataformas low-code y no-code juegan un papel valioso y creciente en este ecosistema.
Son ideales para casos horizontales como asistentes de productividad o automatización de tareas. Sin embargo, al escalar en entornos complejos, se requiere:
- Robustez del dato
 - Gobernanza del conocimiento
 - Seguridad
 - Precisión en procesos críticos
 
Recomendación estratégica
El futuro de agentic AI no lo decide quien conecte más rápido un modelo a una API, sino quién domine la disciplina del LLMOps. Mi recomendación a CIOs, CDOs y responsables de transformación digital:
- Tratar LLMOps como una nueva disciplina organizacional.
 - Formar equipos especializados.
 - Aplicar metodologías y aceleradores propios.
 
Solo así podremos garantizar que un agente se desarrolla en línea con un caso de negocio concreto, se valida con rigor, se despliega con control, se opera de forma fiable y se evalúa con métricas de impacto.
Conclusión
Despreciar una “mejora marginal” puede significar perder la oportunidad de liderar una transformación global. La clave está en dominar el contexto, no solo en conectar modelos.
Más información sobre NTT DATA y Agentic AI.