Por: Dan McNamara, Senior Vice President and General Manager, Compute & Enterprise AI
Actualmente, en muchas reuniones de planificación de infraestructura se está generando una conversación que suele plantearse de la siguiente manera: “La IA agéntica cambiará la relación CPU/GPU. Entonces, simplemente necesitamos agregar más CPU a nuestros servidores con GPU, ¿verdad?”.
Suena lógico. Sin embargo, es precisamente ahí donde muchas organizaciones están interpretando de manera incorrecta la evolución de la infraestructura.
El cambio de la IA basada en chatbots hacia la IA agéntica no consiste únicamente en añadir algunas CPU adicionales al mismo diseño de racks centrado en GPU. Es mucho más profundo. Representa un cambio estructural en la arquitectura de los centros de datos. La IA agéntica está impulsando la demanda de nuevos racks de servidores basados en CPU que trabajan junto a la infraestructura de GPU y permiten ejecutar las cargas de trabajo necesarias para impulsar estos agentes.
Para los líderes de TI empresariales, la principal lección es clara: la IA agéntica está redefiniendo la ecuación de infraestructura de IA.
En AMD hemos seguido de cerca esta evolución. Si anteriormente proyectábamos un mercado de CPU para servidores con un crecimiento anual del 18%, el incremento estructural de los requerimientos de cómputo impulsados por los agentes cambia esta perspectiva. Ahora esperamos que el mercado total direccionable de CPU para servidores crezca más de 35% anual, superando los 120 mil millones de dólares para 2030.
Primera ola: la IA basada en chatbots se centraba principalmente en respuestas generadas por modelos
La primera ola de la IA generativa se construyó alrededor de un patrón relativamente simple: un usuario realizaba una consulta; la aplicación enviaba un prompt a un modelo; el modelo generaba una respuesta; y la aplicación la entregaba al usuario.
Esta arquitectura impulsó naturalmente diseños centrados en GPU. En estos entornos, una CPU funcionaba como nodo principal de un servidor equipado con entre cuatro y ocho GPU. Esta CPU gestionaba la planificación, las operaciones de entrada/salida (I/O) y la administración del sistema, mientras que las GPU realizaban las operaciones matemáticas intensivas.
La IA agéntica no es simplemente “chat con herramientas”
Actualmente estamos en las primeras etapas de la era de la IA agéntica. En este nuevo escenario, la naturaleza de las cargas de trabajo cambia completamente. En lugar de responder una sola consulta, un agente divide un objetivo en múltiples pasos, determina las siguientes acciones, utiliza diversos modelos, consulta bases de datos, se conecta con APIs, ejecuta aplicaciones empresariales, valida permisos, recupera información almacenada, verifica resultados y vuelve a ejecutar el proceso cuando es necesario.
Este perfil de infraestructura es muy diferente al modelo tradicional de IA basada en chatbots, donde la interacción seguía el esquema: solicitud de entrada y respuesta de salida.
Las GPU continúan siendo fundamentales para la ejecución de modelos, pero las cargas de trabajo en producción ahora requieren una participación mucho mayor de CPU. Las CPU son responsables de:
Orquestación: administrar el motor que divide tareas complejas en múltiples procesos.
Ejecución de agentes y llamadas a herramientas: activar APIs y aplicaciones empresariales existentes.
Políticas y seguridad: ejecutar validaciones del mundo real sobre cada acción autónoma.
La respuesta al cambio CPU/GPU no es simplemente “agregar más CPU”
Mientras que la IA basada en chatbots utilizaba anteriormente una relación CPU/GPU de 1:4-8, estamos observando que la IA agéntica evoluciona hacia una relación 1:1 y, en algunos casos, incluso una proporción mayor del lado de la CPU.
El punto clave es que esto no se consigue simplemente incorporando más CPU dentro de un servidor diseñado alrededor de GPU. Se logra mediante la incorporación de una nueva capa de cómputo basada en CPU, diseñada específicamente para estas necesidades.
Para los líderes de TI empresariales, este es el momento en que la planificación debe evolucionar.
El sistema de IA predominante de los próximos años no será una única “caja de IA”. Será más parecido a un sistema distribuido. Incluirá racks de GPU para cargas intensivas de procesamiento de modelos, redes de alta velocidad y una capa de software capaz de mantener todo el entorno visible, seguro y eficiente.
Además, contará con racks de CPU orientados a la IA agéntica para la orquestación, procesamiento de datos y ejecución de herramientas.
En este contexto, una arquitectura equilibrada será más importante que nunca. Si la capa de CPU es insuficiente, las GPU permanecerán esperando. Si la red no recibe la atención necesaria, los agentes perderán capacidad de respuesta. Si la ruta de datos es compleja, la latencia aumentará. Si la capa de orquestación no está diseñada para manejar múltiples procesos simultáneos, los costos y la complejidad crecerán.
¿Dónde encaja AMD?
Los procesadores AMD EPYC ofrecen a los clientes un portafolio de opciones de CPU optimizadas para diferentes etapas del flujo de trabajo de IA, desde soluciones de alta frecuencia para cargas sensibles a la latencia hasta arquitecturas de alta densidad de núcleos orientadas a maximizar el rendimiento a escala.
AMD continúa ampliando esta posición con su hoja de ruta actual, que incluye los productos “Venice”, diseñados para expandir aún más el portafolio de CPU optimizadas para IA.
En última instancia, AMD proporciona el silicio especializado necesario para equipar cada rack del centro de datos —y cada instancia de cómputo en la nube— con las capacidades específicas que requiere.
Recomendación práctica para líderes de TI
Lo reitero: la IA agéntica está cambiando la ecuación de infraestructura.
Mi recomendación para los responsables de decisión de TI empresarial es la siguiente: a medida que la IA agéntica evoluciona desde pruebas piloto hacia entornos de producción, no dimensionen la infraestructura como si simplemente estuvieran incorporando un chatbot a la organización. Piensen en ella como la incorporación de una nueva clase de fuerza laboral digital: una que necesita planificar, actuar, validar, recuperar información, utilizar herramientas y ejecutar flujos de trabajo durante todo el día.
Esto implica planificar una mayor capacidad de CPU de la que sugerían las primeras aproximaciones de IA. También significa mirar más allá del servidor GPU y considerar racks, redes, software y equilibrio operativo. En la era de la IA agéntica, el rendimiento no dependerá de un único procesador capaz de hacerlo todo. Dependerá de la arquitectura adecuada: CPU y GPU trabajando juntas para llevar la inteligencia artificial desde la generación de respuestas hacia la ejecución de acciones.










