Evaluación, seguridad y gobernanzaW1539 min de lectura

Síntesis y direcciones futuras

Síntesis del stack agéntico completo y de cómo unas capas condicionan a otras. Problemas abiertos: razonamiento de largo plazo, uso fiable de herramientas, coordinación escalable, verificación formal. Trayectorias profesionales y responsabilidades éticas.

Conceptos núcleoStack agénticoRetos abiertosFronteras de investigación

Duración: 2 horas de clase + 1 hora de discusión/presentaciones Prerrequisitos: Semanas 1-14 (curso completo)

01Objetivos de aprendizaje

Al finalizar esta clase, los estudiantes serán capaces de:

Articular la pila completa de la IA agéntica y explicar cómo cada componente contribuye a las capacidades del agente
Sintetizar conceptos de todo el curso en una comprensión coherente de los sistemas agénticos
Identificar las limitaciones actuales de la IA agéntica y formularlas como problemas de investigación
Evaluar las tendencias emergentes en IA agéntica y valorar su impacto potencial
Proporcionar una evaluación realista del camino desde los agentes actuales hacia una IA más general
Identificar oportunidades profesionales en el ecosistema de IA agéntica
Reflexionar sobre las responsabilidades éticas de los profesionales de la IA agéntica

021. Síntesis: la pila de la IA agéntica

1.1 Mirar atrás para mirar adelante

A lo largo de las últimas catorce semanas, hemos construido una comprensión integral de los sistemas de IA agéntica, capa a capa, como construir un edificio desde los cimientos hasta el tejado. Cada semana añadió nuevos conceptos, pero es solo ahora, al final, cuando podemos dar un paso atrás y ver la arquitectura completa.

Esta última clase tiene un carácter diferente de las anteriores. En lugar de introducir material técnico nuevo, vamos a hacer tres cosas: (1) sintetizar todo lo que hemos aprendido en una imagen unificada, (2) identificar lo que aún no podemos hacer y por qué, y (3) mirar hacia dónde se dirige el campo.

Empecemos poniendo la pila completa en un solo lugar.

1.2 La imagen completa

Interactive · La pila de la IA agéntica

Visión sistémica

Las siete capas de la IA agéntica

Las capas superiores se apoyan en las inferiores; las inferiores quedan condicionadas por las superiores. La gobernanza no es un anexo: es la capa que cierra el sistema.

Las siete capas de la IA agéntica

Esta pila no es solo un resumen; es un plano arquitectónico. Todo sistema agéntico del mundo real, desde un chatbot simple con acceso a herramientas hasta un sistema de investigación multi-agente complejo, puede describirse en términos de qué capas utiliza y qué decisiones toma en cada capa.

1.3 Cómo interactúan las capas

La pila no es estrictamente jerárquica. Las capas interactúan bidireccionalmente, y esta interacción bidireccional es lo que hace que los sistemas agénticos sean tanto potentes como complejos.

Flujo ascendente (capacidad). Los modelos fundacionales proporcionan comprensión y generación de lenguaje. Las herramientas extienden las capacidades más allá del texto al mundo real. La memoria permite la persistencia y el aprendizaje. La planificación orquesta comportamiento complejo en múltiples pasos. La coordinación multi-agente permite la inteligencia colectiva. La interacción humana ancla el sistema en las necesidades del mundo real. La gobernanza asegura una operación segura.

Cada capa se construye sobre la anterior. Sin modelos fundacionales (Capa 1), no puedes tener uso de herramientas (Capa 2). Sin memoria (Capa 3), la planificación (Capa 4) no puede aprender de intentos pasados. Sin planificación, la coordinación multi-agente (Capa 5) no tiene nada que coordinar.

Flujo descendente (restricción). La gobernanza define lo qué el agente puede hacer. La supervisión humana moldea el comportamiento del agente a través de retroalimentación y aprobación. Los protocolos de coordinación restringen cómo interactúan los agentes. La planificación determina qué herramientas usar y cuándo. La memoria proporciona contexto para la selección de herramientas. Las herramientas anclan las salidas del modelo en la realidad.

Cada capa restringe a las inferiores. La gobernanza (Capa 7) limita qué herramientas pueden usarse (Capa 2). La supervisión humana (Capa 6) moldea qué planes son aceptables (Capa 4). Este flujo descendente es lo que hace que los agentes sean seguros, no solo capaces.

Interacciones entre capas. Los guardrails de seguridad (Capa 7) operan en todas las demás capas: filtrando entradas al modelo (Capa 1), restringiendo el acceso a herramientas (Capa 2), limitando lo que el agente puede recordar (Capa 3), validando planes (Capa 4), gobernando la comunicación entre agentes (Capa 5) y mediando la interacción humana (Capa 6). La memoria (Capa 3) informa la planificación (Capa 4) y se enriquece con las salidas de herramientas (Capa 2) y la retroalimentación humana (Capa 6).

Idea clave: El error arquitectónico más común en IA agéntica es invertir en las capas 1-4 (lo "interesante") sin invertir adecuadamente en las capas 5-7 (lo "aburrido"). Un agente capaz sin gobernanza, interacción humana y coordinación es un riesgo, no un activo.

1.4 El espacio de diseño

Todo sistema agéntico toma decisiones en cada capa. Estas decisiones definen la posición del sistema en un espacio de diseño multidimensional:

Dimensión de diseño	Espectro
Modelo	Pequeño/rápido/barato ... Grande/capaz/caro
Herramientas	Sin herramientas (LLM puro) ... Muchas herramientas (entorno rico)
Memoria	Efímera (sesión única) ... Persistente (a largo plazo)
Planificación	Reactiva (responder a entradas) ... Deliberativa (planes multi-paso)
Coordinación	Agente único ... Enjambre multi-agente
Autonomía	Human-in-the-loop ... Totalmente autónomo
Seguridad	Guardrails mínimos ... Defensa en profundidad

No hay una configuración "mejor" única. Un chatbot de atención al cliente necesita decisiones de diseño diferentes que un agente de investigación autónomo, que necesita decisiones diferentes que un asistente de programación. La configuración adecuada depende del dominio de aplicación, la tolerancia al riesgo, los requisitos de rendimiento y las restricciones de cóste.

Inténtalo tú mismo: mapea tu proyecto a la pila

Toma el agente que construiste para tu proyecto final (o cualquier agente con el que hayas trabajado). Para cada capa de la pila, identifica:

¿Qué decisión tomaste en esta capa?
¿Por qué tomaste esa decisión?
¿Qué cambiarías si tuvieras más tiempo?
¿Cuáles son los riesgos de tu decisión actual?

Este ejercicio hace concreta la pila abstracta conectándola con tu propia experiencia.

032. Qué hemos cubierto y cómo se conecta

2.1 Arco del curso

El curso siguió una progresión deliberada, diseñada para que cada semana construyera naturalmente sobre las anteriores:

Semanas 1-4: Fundamentos. Establecimos qué son los agentes, cómo funcionan los LLM como su núcleo cognitivo, y cómo el prompting y el ajuste fino moldean su comportamiento. Esto nos dio el vocabulario y los fundamentos conceptuales para todo lo que siguió.

El concepto clave de esta sección: los agentes son sistemas que perciben, razonan y actúan en un bucle. Todo lo demás en el curso trata de hacer ese bucle más capaz, más fiable y más seguro.

Semanas 5-7: Capacidades. Añadimos los componentes que transforman un modelo de lenguaje en un agente: uso de herramientas (actuar en el mundo), recuperación (acceder a conocimiento externo) y memoria (aprender y persistir estado). Estas son las capacidades que distinguen a los agentes de los chatbots.

El concepto clave de esta sección: anclaje (grounding). Un modelo de lenguaje sin herramientas está generando texto. Un modelo de lenguaje con herramientas está realizando acciones. El cambio de generar a actuar es el cambio fundamental de un chatbot a un agente.

Semanas 8-10: Inteligencia. Exploramos cómo los agentes piensan y trabajan juntos: planificación y razonamiento para tareas complejas, evaluación y testing para fiabilidad, y sistemas multi-agente para resolución colectiva de problemas. Estas son las arquitecturas cognitivas que permiten comportamiento sofisticado.

El concepto clave de esta sección: gestión de la complejidad. Las tareas del mundo real son demasiado complejas para un único paso de razonamiento. Planificación, descomposición, reflexión y coordinación son cómo los agentes gestionan la complejidad.

Semanas 11-14: Responsabilidad. Abordamos los desafíos de desplegar agentes de forma responsable: seguridad y alineamiento (prevenir daños), interacción humana (mantener a los humanos en control), aplicaciones prácticas (ingeniería de software) y gobernanza (cumplir requisitos legales y éticos). Estos son los guardrails que hacen que los agentes sean dignos de confianza.

El concepto clave de esta sección: los agentes son sistemas sociotécnicos. Existen en un contexto de usuarios humanos, marcos legales, políticas organizacionales y normas sociales. La excelencia técnica sin responsabilidad social es insuficiente.

Semana 15: Síntesis. Lo unimos todo y miramos hacia adelante.

2.2 Temas clave a lo largo del curso

Varios temas reaparecieron a lo largo de todo el curso, apareciendo en diferentes formas en diferentes capas:

El compromiso capacidad-seguridad. Los agentes más capaces pueden hacer más bien pero también más daño. Cada aumento de capacidad exige una mejora correspondiente de seguridad. Este tema apareció en la Semana 5 (el acceso a herramientas crea nuevos riesgos), la Semana 8 (una planificación más sofisticada puede perseguir objetivos mal especificados de forma más efectiva), la Semana 10 (los sistemas multi-agente pueden amplificar los fallos de agentes individuales) y la Semana 11 (toda la clase sobre seguridad).

La importancia del anclaje. Los modelos de lenguaje puros generan texto de apariencia plausible. Las herramientas, la recuperación y la memoria anclan el comportamiento del agente en la realidad. El anclaje es lo que hace que los agentes sean útiles en lugar de solo fluidos. Sin anclaje, un agente es como una persona segura de sí misma que ha leído muchos libros pero nunca ha salido de su casa: articulada pero potencialmente desconectada de la realidad.

El papel del humano. A pesar de la etiqueta de "autónomo", los humanos siguen siendo esenciales en la IA agéntica: como diseñadores, supervisores, proveedores de retroalimentación y tomadores de decisiones finales. La pregunta no es si los humanos están involucrados sino cómo. Este tema apareció explícitamente en la Semana 12 pero estuvo presente en cada semana.

El desafío de ingeniería. Construir agentes fiables requiere resolver problemas difíciles de ingeniería: gestionar estado, manejar fallos, asegurar consistencia, mantener la seguridad, registrar todo, recuperarse de errores. La IA agéntica es tanto ingeniería de software como investigación en IA. La arquitectura de agente más brillante es inútil si se cae en producción.

043. Limitaciones actuales y problemas abiertos de investigación

3.1 Fiabilidad y consistencia

El problema. Los agentes actuales son poco fiables. El mismo prompt puede producir diferentes planes y diferentes resultados entre ejecuciones. Un agente puede tener éxito en una tarea el 70 % de las veces pero fallar de forma impredecible en el 30 % restante. Para sistemas en producción, esta falta de fiabilidad es una barrera importante. Se espera que el software tradicional funcione correctamente el 99,999 % del tiempo. Los agentes están muy lejos de ese estándar.

Para poner esto en perspectiva con una analogía: imagina un coche que arranca el 70 % de las veces. Nunca lo comprarías. Ahora imagina un desarrollador de software que escribe código correcto el 70 % de las veces. Nunca lo contratarías. Sin embargo, estamos construyendo agentes con aproximadamente esa fiabilidad y esperando que sean útiles. Sí son útiles, pero solo porque la supervisión humana detecta muchos de los fallos. El camino hacia un despliegue más amplio requiere mejorar dramáticamente esta cifra.

La falta de fiabilidad no es simplemente ruido aleatorio. Es estructurada: los agentes tienden a fallar en tipos específicos de entradas, tipos específicos de tareas o combinaciones específicas de condiciones. Pero estas condiciones de fallo son difíciles de caracterizar de antemano, lo que hace difícil saber cuándo confiar en el agente y cuándo no. Un agente de programación podría tener un 95 % de fiabilidad en tareas de Python pero solo un 60 % en tareas de Rust, y puede que no lo sepas hasta que hayas ejecutado cientos de tareas.