AMD y HP explican por qué la IA agéntica no vivirá solo en la nube: tokens caros, PCs con 128 GB y el regreso del cómputo local

En Computex 2026, una conversación entre Rahul Tikoo de AMD , prensa internacional (de los que fuimos parte) y directivos de HP dejó una de las lecturas más interesantes del momento actual de la IA: la inteligencia artificial agéntica no se va a quedar encerrada en el centro de datos, pero tampoco va a abandonar la nube. El futuro que describen AMD y HP es mucho más híbrido, más caro, más complicado y, honestamente, más realista: modelos de frontera en cloud cuando hagan falta, infraestructura privada para datos sensibles y estaciones locales con muchísima memoria cuando el costo de tokens empiece a convertirse en una línea incómoda del P&L. Dicho de otra forma: la IA promete productividad casi mágica, pero la magia ya empezó a mandar factura.

La conversación parte de una pregunta sencilla: ¿quién adoptará primero la IA agéntica de forma masiva? ¿Enterprise, luego SMBs (PyMEs) y al final consumidores? La respuesta no fue tan lineal. Desde la perspectiva de HP, la empresa grande será naturalmente una de las primeras en adoptarla por escala, presupuesto y capacidad de integración, pero las pequeñas y medianas empresas también tienen un incentivo enorme porque la IA puede nivelar parte del terreno competitivo. Si una PyME puede automatizar agenda, seguimiento de pacientes, facturación, documentación, ventas, atención y back office sin contratar equipos completos, de pronto puede acceder a capacidades que antes solo tenían compañías grandes. El obstáculo no es el deseo, sino la implementación: las SMBs no van a montar data centers propios ni equipos internos de científicos de datos; necesitarán canales, integradores y soluciones que reduzcan brutalmente el tiempo de despliegue.

Screenshot 2026 06 04 235358

La idea más potente de la mesa fue esta: la IA agéntica puede darle a un empleado el equivalente funcional de 10, 20 o 30 personas digitales trabajando alrededor. La frase suena a pitch corporativo de esos que normalmente te hacen sospechar, pero los ejemplos aterrizan el concepto. Se habló de un dentista que ya usa automatización agéntica con herramientas tipo n8n corriendo localmente para integrar procesos de oficina: citas, seguimiento a pacientes, seguros y facturación. Antes eso implicaba varias personas y al propio doctor interviniendo en tareas administrativas; ahora puede operar con un flujo automatizado y una sola persona supervisando. Y ahí está el punto: para muchos negocios, la primera revolución de la IA no será escribir poemas ni generar imágenes bonitas, sino quitar trabajo repetitivo que nadie quería hacer, pero que consumía horas todos los días.

ADOPCIÓN DE IA AGÉNTICA POR SEGMENTO

Segmento	Velocidad probable de adopción	Principal incentivo	Principal obstáculo	Lectura DD
Enterprise	Alta y temprana	Productividad, escala, automatización, reducción de tiempos de desarrollo	Gobernanza, seguridad, costos de tokens, integración con datos internos	Tienen presupuesto, pero también tienen más cosas que romper
SMB / PyME	Alta en deseo, gradual en ejecución	Nivelar capacidades frente a empresas grandes	Falta de equipos internos, dependencia de canal e integradores	La IA puede ser su back office invisible, si alguien se las empaqueta bien
Consumidor / prosumer	Irregular, pero potencialmente rápida	Experimentación, desarrollo, hobbies, herramientas locales	Seguridad, configuración, madurez de software	Los entusiastas no esperan permiso; rompen cosas primero y documentan después
Desarrolladores	Muy alta	Prototipado rápido, agentes de código, tokens locales “infinitos”	Tool calling, seguridad, compatibilidad de stack	Son el laboratorio real de esta transición
Sectores regulados	Selectiva, pero urgente	Soberanía de datos, ambientes air-gapped, privacidad	Cumplimiento, validación, infraestructura privada	Quieren IA, pero no pueden mandar todo a la nube
Defensa / gobierno	Alta en casos concretos	Tiempo real, datos sensibles, operación aislada	Seguridad extrema, modelos propios, conectividad limitada	Aquí la nube no siempre es opción, ni aunque prometa magia

La parte interesante es que HP no ve a los consumidores necesariamente al final de la fila. Muchos desarrolladores de IA compran hardware desde canales de consumo, incluso cuando trabajan en empresas. También hay hobbyists, usuarios avanzados y pequeños negocios que experimentan con modelos locales, automatizaciones y agentes sin esperar a que el departamento de TI les escriba una política de 40 páginas. Ese espacio será más caótico, sí, pero también puede moverse rápido. La seguridad será menos ordenada, las herramientas serán más experimentales y la frase “a ver qué pasa” seguirá siendo el motor principal de buena parte del ecosistema.

EL COSTO DE TOKENS: LA FACTURA QUE ESTÁ FORZANDO A REPENSAR LA INFRAESTRUCTURA

Uno de los momentos más fuertes de la conversación fue el ejemplo de una gran empresa alemana que planeaba desplegar Claude Code en alrededor de 8,000 desarrolladores. Según la estimación mencionada en la mesa, el costo podía rondar los 3,000 dólares mensuales por desarrollador, lo que llevaría la factura a unos 24 millones de dólares al mes solo en tokens. Esa cifra, incluso si la tomamos como ejemplo de conversación y no como presupuesto público validado, ilustra el problema de fondo: cuando los agentes empiezan a trabajar de forma persistente, consumen muchos más tokens que un chatbot tradicional. No es una pregunta ocasional; son procesos, contexto, herramientas, validaciones, iteraciones y varios agentes coordinándose. La IA agéntica no solo responde: trabaja. Y trabajar cuesta.

Rahul Tikoo planteó ahí la alternativa de usar PCs locales con Strix Halo / Ryzen AI Max como nodos dentro de la infraestructura de IA, de forma que muchas tareas que no requieren modelos frontera puedan ejecutarse localmente. AMD ya ha posicionado Ryzen AI Max como una plataforma para desarrolladores de IA con hasta 128 GB de memoria unificada, soporte para Windows y Linux, optimización con ROCm y capacidad para correr modelos grandes en el dispositivo; AMD afirma que Ryzen AI Halo puede ejecutar modelos de hasta 200 mil millones de parámetros localmente, lo que refuerza la lógica de usar estos equipos como estaciones de desarrollo o nodos de inferencia local. (amd.com)

La propuesta no es reemplazar la nube. Es usarla cuando sea la mejor opción, no cuando sea la única opción. Esa frase resume muy bien la discusión. Los desarrolladores pueden prototipar localmente, iterar sin pagar cada token, probar modelos, hacer inferencia rápida y después desplegar en cloud cuando el caso lo requiera. Para empresas, eso abre una conversación nueva: ¿qué debe correr en cloud pública, qué debe quedarse en infraestructura privada, qué puede correr en una workstation local y qué conviene mandar a una NPU por eficiencia? La arquitectura de IA deja de ser una decisión binaria y se vuelve una topología.

CUATRO RAZONES PARA LLEVAR IA AL DISPOSITIVO O A INFRAESTRUCTURA LOCAL

Razón	Qué significa	Ejemplo práctico	Impacto
Ambientes air-gapped	Sistemas sin conectividad externa por seguridad o regulación	Defensa, laboratorios, infraestructura crítica	La nube simplemente no es opción
Soberanía y gravedad de datos	Datos que no deben o no pueden moverse fácilmente	Salud, banca, gobierno, manufactura	El cómputo debe acercarse al dato
Respuesta en tiempo real	Aplicaciones donde la latencia importa demasiado	Visión computacional, defensa, finanzas, traducción en vivo	Mandar todo al cloud puede ser demasiado lento
Costo de tokens	El gasto crece con agentes persistentes y uso masivo	Desarrollo de software, soporte, back office, automatización	Ejecutar localmente puede pagar el hardware en meses

La mesa redonda repitió estas cuatro razones varias veces, y no por accidente. Son los argumentos reales que aparecen en conversaciones con CIOs: algunos clientes hablan primero de costos, otros de datos sensibles, otros de latencia, otros de ambientes desconectados. En defensa pueden necesitar las cuatro al mismo tiempo. En retail o manufactura puede pesar más la visión computacional local. En salud, los datos y los análisis pueden estar demasiado regulados como para salir alegremente a un servicio externo. En desarrollo de software, el costo de tokens puede volverse grotesco, pero el ROI también puede justificarlo si una función que tardaba nueve meses aparece en una semana.

IA AGÉNTICA EN DESARROLLO: DE NUEVE MESES A UNA SEMANA, PERO CON UNA FACTURA BRUTAL

Uno de los ejemplos más ilustrativos fue el de un desarrollador de AMD que recibió una solicitud de software que normalmente habría implicado evaluación, presupuesto millonario y una entrega en seis a nueve meses. En lugar de eso, como desarrollador “agentic-first”, armó un proof of concept en pocos días usando agentes con Claude Code y varias máquinas trabajando en paralelo. Según el relato, una sola máquina podía consumir alrededor de 5,000 dólares por semana en tokens, y con tres máquinas el gasto subía a 15,000 dólares semanales. Pero si eso adelantaba una función de nueve meses a una semana, el ROI era obvio para la empresa.

El ejemplo de HP fue similar: un desarrollador interno, normalmente capaz de entregar una respuesta de negocio tradicional con equipos scrum y semanas de planeación, apareció después de un fin de semana con un POC funcional impulsado por agentes. La conclusión no es que todos los desarrolladores serán reemplazados por bots; la conclusión es que un buen desarrollador con agentes puede trabajar de forma radicalmente distinta. El cuello de botella deja de ser únicamente escribir código y pasa a ser dirigir, validar, integrar, revisar seguridad, controlar costos y decidir qué debe correr localmente o en cloud. La ingeniería no desaparece; cambia de postura.

amd y hp explican por que la ia agentica no vivira solo en l m3268

CASOS DE USO MENCIONADOS EN LA MESA REDONDA

Caso de uso	Dónde encaja mejor	Por qué importa
Desarrollo de software agéntico	Enterprise, startups, desarrolladores avanzados	Reduce tiempos de prototipado y acelera features
Back office automatizado	SMBs, clínicas, retail, servicios profesionales	Quita trabajo repetitivo y reduce personal administrativo requerido
Atención a clientes / soporte	Enterprise y PyME	Puede automatizar flujos internos y externos
Pricing tools / marketing tools	Corporativo	Los agentes pueden iterar análisis y contenidos a escala
Visión computacional	Retail, manufactura, salud, defensa	Requiere respuesta local y procesamiento cerca del dato
Análisis médico / reportes / scans	Salud e investigación	Maneja datos sensibles y cargas analíticas pesadas
Traducción en tiempo real con voz	Enterprise global, colaboración remota	Necesita baja latencia y preservación de identidad vocal
Seguridad endpoint	Enterprise	Agentes y modelos ligeros pueden correr en NPU en segundo plano
Gestión de dispositivos	Enterprise IT	Offload de agentes de administración para liberar CPU/GPU
IA en gobiernos locales	Gobierno, servicios públicos	Automatización y análisis con restricciones de datos

El caso de traducción en tiempo real fue particularmente humano. Uno de los ejecutivos describió el deseo de entrar a una llamada de Zoom o Teams con un equipo en China y hablar en inglés mientras la otra parte escucha chino en su propia voz, sin ese efecto de doblaje de película de kung fu donde los labios van por un lado y el audio por otro. HP ya experimentó con clonación de voz para grabar un press deck, pero el resultado no convenció del todo porque bajaba la energía natural del presentador. Esa anécdota aterriza una verdad importante: la IA ya puede hacer cosas impresionantes, pero muchas veces todavía falla en las sutilezas que los humanos detectamos en segundos. La esposa de uno de los ejecutivos lo resumió brutalmente al ver un deepfake suyo: no era él, porque hablaba demasiado correctamente; él hablaba “Jimlish”.

MODELOS LOCALES: 9B, 35B, 100B Y EL CAMINO HACIA 300B EN NOTEBOOKS

La discusión también entró en tamaños de modelo. Según lo comentado, modelos de 9 mil millones de parámetros ya pueden ser útiles en ciertos casos tipo chatbot o flujos básicos, mientras que modelos de 20B o 30B permiten bastante trabajo local en PCs de consumo potentes. A partir de 35B, la capacidad empieza a volverse más seria para agentes y tool calling, y en estaciones con mucha memoria compartida se abre la puerta a modelos de 100B o más. Rahul Tikoo afirmó además que AMD tendrá próximamente soluciones capaces de correr modelos de 300 mil millones de parámetros en una notebook, aunque esa cifra debe tratarse como declaración de roadmap dentro de la conversación, no como benchmark público independiente ya verificado.

Aquí es importante conectar con lo que AMD sí ha publicado formalmente. AMD anunció Ryzen AI Halo como plataforma para “agent computers” con hasta 128 GB de memoria unificada y capacidad para correr modelos de hasta 200B parámetros, con soporte para Windows y Linux y optimización de ROCm. (amd.com) El salto a 300B mencionado en la mesa sería parte de una siguiente etapa de producto, asociada en el transcript a una plataforma que suena como “Gorgon Halo” hacia Q3. Sin ficha pública formal a la vista en esta conversación, conviene redactarlo como promesa discutida en la mesa, no como especificación final.

MAPA DE HARDWARE Y CAPACIDADES MENCIONADAS

Plataforma / equipo mencionado	Memoria / capacidad destacada	Uso sugerido	Estado en la conversación
HP “Cashmere”	Modelos pequeños locales, alrededor de 9B–10B	Flujos agénticos básicos y tareas locales	Mencionado como equipo visible en demos
AMD “Chiron” / Strix Halo	128 GB de memoria compartida	Modelos de 35B+, desarrollo local, agentes, prototipado	Usado como máquina personal en la mesa
Ryzen AI Max / Strix Halo	Hasta 128 GB de memoria unificada	IA local, desarrollo, Windows/Linux, ROCm	Ya presente en mercado en múltiples productos, según AMD/HP
Ryzen AI Halo	Hasta 128 GB de memoria unificada; AMD habla de modelos hasta 200B	“Agent computers” y desarrollo local	Anunciado por AMD en 2026
Plataforma futura “Gorgon Halo”	Mencionada con capacidad de hasta 300B	Modelos mucho más grandes en notebook/desktop compacto	Declaración de roadmap en la conversación
NVIDIA RTX Spark	Hasta 128 GB de memoria unificada, 20 núcleos Arm, Blackwell GPU	Agentes locales en Windows, dev boxes y laptops	Anunciada en Computex 2026

NVIDIA también aparece en la conversación porque, durante Computex 2026, anunció RTX Spark, una plataforma para PCs Windows de IA agéntica con CPU Arm, GPU Blackwell, hasta 128 GB de memoria unificada y hasta 1 petaflop de cómputo de IA, en colaboración con Microsoft. NVIDIA y Microsoft posicionan RTX Spark como hardware para agentes locales, con seguridad, contención y administración integradas en Windows. (nvidianews.nvidia.com)

La respuesta de AMD y HP fue básicamente: bienvenidos. Rahul Tikoo señaló que AMD ya había mostrado esta dirección desde CES 2025 y que HP ya tenía productos Strix Halo en mercado. Según la conversación, HP tendría alrededor de 35 productos con Strix Halo o Ryzen AI Max en el mercado. Aquí hay un punto estratégico: NVIDIA trae un stack de software potentísimo con CUDA y su ecosistema, pero AMD/HP empujan la idea de una plataforma x86, abierta, capaz de correr Windows y Linux, útil para desarrolladores, creadores y gamers en el mismo equipo. La competencia ya no es solo por GPU; es por quién define la estación local de IA.

NVIDIA RTX SPARK VS AMD RYZEN AI MAX / HALO: LA BATALLA POR LA IA LOCAL

Apartado	NVIDIA RTX Spark	AMD Ryzen AI Max / Halo
Arquitectura CPU	Arm, en colaboración con MediaTek según reportes	x86 AMD
GPU	NVIDIA Blackwell	Radeon integrada de alto rendimiento 8060S
Memoria	Hasta 128 GB unificada	Hasta 128 GB unificada
Cómputo IA	Hasta 1 petaflop, según NVIDIA/Microsoft	AMD posiciona Ryzen AI Halo para modelos grandes locales
Software	CUDA, stack NVIDIA, Windows agentic PC con Microsoft	ROCm, Windows/Linux, open source como apuesta
Ecosistema	Muy fuerte en IA por CUDA y NVIDIA AI stack	Más abierto, x86 y con integración CPU/GPU/NPU
Disponibilidad	Anunciada en Computex 2026; productos esperados más adelante	AMD/HP afirman tener equipos Strix Halo ya en mercado
Diferenciador	Stack AI maduro y fuerte respaldo Microsoft/NVIDIA	Plataforma x86, Windows/Linux, gaming/creación/desarrollo en un mismo sistema
Riesgo	Precio alto y productos aún por tocar/probar	ROCm aún debe cerrar brechas frente al dominio CUDA

Microsoft también publicó que Windows está preparándose para correr agentes de forma más segura con identidad, contención y administración a nivel del sistema operativo, y que RTX Spark será una plataforma adecuada para construir y ejecutar cargas agénticas localmente con hasta 128 GB de memoria unificada. (blogs.windows.com) Esa parte ayuda a todos, incluso a AMD, porque si Microsoft convierte Windows en una plataforma más madura para agentes locales, el mercado completo se mueve. Como se dijo en la mesa: la participación de Microsoft puede abstraer parte de la complejidad y abrir el camino para soluciones no verdes también. Traducción DD: si Windows se vuelve serio para agentes, no solo gana NVIDIA; gana cualquiera que logre que su hardware y stack funcionen sin que el desarrollador quiera aventar la laptop.

ROCm, NPUs Y EL PROBLEMA REAL: SOFTWARE, SOFTWARE Y MÁS SOFTWARE

AMD reconoce que ROCm ha avanzado mucho, pero también que el trabajo no terminó. En la mesa se habló de mejorar soporte “day zero” en endpoints, hacer que ROCm sea fácil para desarrolladores tanto en tarjetas Instinct como en soluciones gráficas integradas, ampliar librerías y trabajar en sandboxing para casos de uso agénticos. Esa es una admisión importante porque el hardware por sí solo no basta. NVIDIA no domina IA solo por tener chips rápidos; domina porque su stack es familiar, usado, documentado y adoptado por desarrolladores. AMD necesita que ROCm deje de ser “prometedor” y se vuelva “normal”.

La NPU también apareció como pieza clave, no para máximo rendimiento, sino para eficiencia. Rahul lo resumió muy bien: cuando quieres rendimiento, vas a la GPU; cuando quieres eficiencia, vas a la NPU. Eso abre casos muy interesantes en enterprise: agentes de seguridad, administración de endpoints, procesos en segundo plano, detección, monitoreo y productividad podrían descargarse a la NPU para liberar CPU y GPU. En lugar de usar el procesador principal para 12 servicios residentes que nadie pidió pero todos necesitan, parte de ese trabajo podría correr en un acelerador más eficiente. Si se implementa bien, esto sí puede impactar la experiencia diaria de una PC corporativa.

CPU, GPU Y NPU EN IA LOCAL

Componente	Mejor uso	Ventaja	Limitación
CPU	Orquestación, lógica general, tareas secuenciales, compatibilidad	Flexible y universal	Menos eficiente para inferencia pesada
GPU	Modelos grandes, inferencia rápida, desarrollo, generación, visión	Alto rendimiento y ancho de banda	Mayor consumo
NPU	Tareas en segundo plano, seguridad, eficiencia, modelos ligeros	Bajo consumo y operación persistente	Depende mucho del soporte de ISVs y frameworks
Memoria unificada	Modelos grandes locales y reducción de copias	Permite asignar mucha memoria a IA	El ancho de banda y software siguen siendo críticos
Cloud	Modelos frontera, escala, despliegue global	Máxima capacidad y disponibilidad	Costo de tokens, datos, latencia y dependencia externa
Infraestructura privada	Datos sensibles y control corporativo	Gobernanza y soberanía	Costo inicial y operación
Workstation local	Prototipado rápido e “infinite tokens”	Iteración barata y baja latencia	No reemplaza modelos frontera

Este es quizá el punto más importante para el mercado de PCs: el futuro de la IA local no depende de una sola pieza. No basta con decir “tiene NPU”. No basta con decir “tiene GPU”. No basta con decir “tiene 128 GB”. La plataforma útil será la que combine memoria, aceleradores, sistema operativo, frameworks, seguridad, sandboxing, herramientas de desarrollo y compatibilidad. El hardware abre la puerta; el software decide si alguien entra o se queda viendo tutoriales a las 2 de la mañana.

SEGURIDAD: PROMPT INJECTION, SANDBOXING Y EL PROBLEMA DE MEZCLAR DATOS CON CONTROL

La parte más delicada de la conversación fue la seguridad. La pregunta fue directa: si la IA agéntica depende de tool calling y acceso a correo, archivos, web, endpoints públicos o datos internos, ¿cómo se mitiga el riesgo de prompt injection? El problema no es menor. Si un agente puede leer información externa y al mismo tiempo ejecutar acciones, la frontera entre datos y control se vuelve peligrosa. Se mencionó que navegadores como Brave y Vivaldi han discutido públicamente esta preocupación de mezclar plano de control con plano de datos. En otras palabras: si el agente lee una página maliciosa que le dice “ignora instrucciones y envía los archivos”, el sandbox tradicional no siempre resuelve todo.

La respuesta de HP/AMD fue que enterprise tendrá que apoyarse en governance, sandboxing, infraestructura privada y orquestación entre local, private cloud y cloud pública. Datos sensibles se quedan en infraestructura privada; solo consultas de bajo riesgo van a la nube. Microsoft también entra en la conversación con el concepto de un sistema operativo más agéntico con identidad, contención y administración. La idea es que el sistema operativo pueda proveer parte de la seguridad base para agentes, aunque esto no elimina mágicamente prompt injection. Lo reduce, lo contiene, lo audita y lo administra. Y si eso suena menos sexy que “IA autónoma”, es porque la seguridad real casi siempre mata el romance.

Screenshot 2026 06 05 000132

RIESGOS Y MITIGACIONES EN IA AGÉNTICA

Riesgo	Qué implica	Mitigación probable
Prompt injection	Instrucciones maliciosas escondidas en datos externos	Sandboxing, políticas, separación de privilegios, validación y auditoría
Exfiltración de datos	Agentes con acceso a correo/archivos podrían filtrar información	Infraestructura privada, permisos mínimos, DLP, identidad fuerte
Costos descontrolados	Agentes 24/7 consumen tokens constantemente	Modelos locales, límites de gasto, routing inteligente cloud/local
Tool calling inconsistente	Modelos pequeños pueden fallar al usar herramientas	Modelos más grandes, validación, retries, frameworks más robustos
Shadow AI	Usuarios montan flujos sin control de TI	Plataformas aprobadas, herramientas internas, políticas claras
Dependencia de cloud	Latencia, privacidad y costo	Arquitectura híbrida con local/private/cloud
Vulnerabilidades de agentes	Herramientas enthusiast no siempre priorizan seguridad	Versiones enterprise, hardening, revisión de código, sandboxing
Datos regulados	No pueden salir a servicios externos	On-prem, edge, air-gapped, modelos privados

Aquí conviene ser fríos: la IA agéntica no está “resuelta”. Está avanzando rápido, quizá demasiado rápido para los ciclos tradicionales de validación enterprise. Uno de los ejecutivos dijo que sus sandboxes se actualizarán mensualmente, pero que incluso eso puede ser demasiado lento porque los modelos cambian diariamente. Esa tensión define el momento actual: la tecnología se mueve a ritmo de comunidad open source y startups, pero enterprise necesita validación, seguridad, cumplimiento y soporte. Es como ponerle frenos de camión a un cohete casero: necesario, pero no elegante.

EL MERCADO NO SERÁ SOLO DE KNOWLEDGE WORKERS

Una de las mejores partes de la conversación fue que no redujeron la IA agéntica a oficinistas escribiendo correos. Se habló de frontline workers, back office, sucursales, retail, manufactura, salud, defensa y gobierno. En visión computacional, por ejemplo, el valor local es obvio: detección de defectos, inteligencia de tienda, análisis de ubicación, monitoreo de clínicas, banca, manufactura o defensa. En salud, se mencionaron reportes de laboratorio, scans y análisis profundo. En defensa, la respuesta en tiempo real puede ser literalmente crítica: no hay tiempo de mandar datos “al pasillo”, mucho menos a una región cloud lejana. Este punto es importante porque muchas narrativas de IA PC se quedan en “resumen de juntas” y “mejora de videollamadas”. Eso existe, pero es solo la superficie. La gran oportunidad puede estar en flujos industriales, operativos y de campo, donde la IA necesita correr cerca del dato, con baja latencia y sin depender siempre de conectividad. La PC, workstation o endpoint deja de ser solo terminal y vuelve a ser nodo de cómputo. Después de años empujando todo al cloud, la industria está redescubriendo que a veces el dato pesa, la latencia duele y la factura mensual muerde.

LA IA LOCAL NO ES MODA, ES CONSECUENCIA DE QUE LA NUBE SE VOLVIÓ DEMASIADO CARA PARA USARLA COMO BASURERO

La conclusión más cínica de esta mesa redonda es que la IA local está renaciendo no solo por privacidad o por rendimiento, sino porque la nube se está volviendo carísima cuando dejamos que los agentes trabajen sin parar. Durante años, la industria vendió cloud como respuesta universal: sube todo, escala todo, paga por uso. Ahora que el uso puede ser un ejército de agentes consumiendo tokens 24/7, de pronto todos redescubren que el hardware local no era tan mala idea. Qué sorpresa: cuando el medidor corre todo el día, alguien empieza a preguntar por la instalación eléctrica propia.

AMD y HP están apostando a que habrá un espacio grande para PCs y workstations con memoria unificada masiva, GPUs integradas potentes, NPUs eficientes y software más fácil de usar. NVIDIA está entrando con RTX Spark y el respaldo brutal de su stack. Microsoft quiere convertir Windows en una plataforma más segura para agentes locales. Los desarrolladores quieren “first token from boot” en minutos. Los CIOs quieren controlar datos y costos. Los usuarios quieren que funcione sin leer 18 repositorios. Todos quieren algo distinto, pero todos apuntan a la misma dirección: la IA ya no cabe cómodamente en un solo modelo de infraestructura. La parte buena es que esto puede devolverle importancia real al PC. No como “AI PC” de sticker con NPU que nadie usa, sino como estación de cómputo local capaz de correr modelos, agentes, prototipos, visión, seguridad y flujos privados. La parte mala es que vamos a vivir una nueva guerra de stacks, siglas, memoria unificada, TOPS, tokens, sandboxes y promesas de productividad. O sea, justo lo que necesitaba el mercado: otra sopa técnica para vender laptops de 5,000 dólares.

CONCLUSIÓN: LA IA AGÉNTICA SERÁ HÍBRIDA O SERÁ ECONÓMICAMENTE INSOSTENIBLE

La mesa redonda entre AMD y HP en Computex 2026 deja una conclusión bastante clara: la IA agéntica no se va a desplegar de forma seria dependiendo exclusivamente de la nube pública. La nube seguirá siendo esencial para modelos frontera, escala y despliegues globales, pero el costo de tokens, la gravedad de datos, la soberanía, la latencia y los entornos regulados empujan cada vez más cargas hacia infraestructura privada, edge y dispositivos locales.

Para AMD y HP, plataformas como Strix Halo / Ryzen AI Max y las siguientes generaciones de Ryzen AI Halo buscan ocupar justamente ese espacio: PCs y workstations con memoria unificada masiva, capacidad de correr modelos locales grandes, soporte para Windows/Linux, ROCm y un perfil útil para desarrolladores, creadores, gamers y empresas. NVIDIA, con RTX Spark, entra al mismo campo con el peso de CUDA, Blackwell y Microsoft. Lejos de invalidar la apuesta de AMD, su entrada parece confirmar que la batalla por la IA local apenas empieza.

El reto ya no es solo hardware. Es seguridad, sandboxing, tool calling confiable, modelos más pequeños pero útiles, NPUs con software real, costos controlados y una experiencia de desarrollo que no requiera sacrificios rituales frente a la terminal, la IA agéntica promete empleados con decenas de asistentes digitales, pero si cada asistente cobra tokens como consultor premium, alguien va a tener que traer parte del trabajo de vuelta a casa, y ahí es donde el PC vuelve a importar.

Screenshot 2026 06 04 235358

ADOPCIÓN DE IA AGÉNTICA POR SEGMENTO

Segmento	Velocidad probable de adopción	Principal incentivo	Principal obstáculo	Lectura DD
Enterprise	Alta y temprana	Productividad, escala, automatización, reducción de tiempos de desarrollo	Gobernanza, seguridad, costos de tokens, integración con datos internos	Tienen presupuesto, pero también tienen más cosas que romper
SMB / PyME	Alta en deseo, gradual en ejecución	Nivelar capacidades frente a empresas grandes	Falta de equipos internos, dependencia de canal e integradores	La IA puede ser su back office invisible, si alguien se las empaqueta bien
Consumidor / prosumer	Irregular, pero potencialmente rápida	Experimentación, desarrollo, hobbies, herramientas locales	Seguridad, configuración, madurez de software	Los entusiastas no esperan permiso; rompen cosas primero y documentan después
Desarrolladores	Muy alta	Prototipado rápido, agentes de código, tokens locales “infinitos”	Tool calling, seguridad, compatibilidad de stack	Son el laboratorio real de esta transición
Sectores regulados	Selectiva, pero urgente	Soberanía de datos, ambientes air-gapped, privacidad	Cumplimiento, validación, infraestructura privada	Quieren IA, pero no pueden mandar todo a la nube
Defensa / gobierno	Alta en casos concretos	Tiempo real, datos sensibles, operación aislada	Seguridad extrema, modelos propios, conectividad limitada	Aquí la nube no siempre es opción, ni aunque prometa magia

EL COSTO DE TOKENS: LA FACTURA QUE ESTÁ FORZANDO A REPENSAR LA INFRAESTRUCTURA

CUATRO RAZONES PARA LLEVAR IA AL DISPOSITIVO O A INFRAESTRUCTURA LOCAL

Razón	Qué significa	Ejemplo práctico	Impacto
Ambientes air-gapped	Sistemas sin conectividad externa por seguridad o regulación	Defensa, laboratorios, infraestructura crítica	La nube simplemente no es opción
Soberanía y gravedad de datos	Datos que no deben o no pueden moverse fácilmente	Salud, banca, gobierno, manufactura	El cómputo debe acercarse al dato
Respuesta en tiempo real	Aplicaciones donde la latencia importa demasiado	Visión computacional, defensa, finanzas, traducción en vivo	Mandar todo al cloud puede ser demasiado lento
Costo de tokens	El gasto crece con agentes persistentes y uso masivo	Desarrollo de software, soporte, back office, automatización	Ejecutar localmente puede pagar el hardware en meses

IA AGÉNTICA EN DESARROLLO: DE NUEVE MESES A UNA SEMANA, PERO CON UNA FACTURA BRUTAL

amd y hp explican por que la ia agentica no vivira solo en l m3268

CASOS DE USO MENCIONADOS EN LA MESA REDONDA

Caso de uso	Dónde encaja mejor	Por qué importa
Desarrollo de software agéntico	Enterprise, startups, desarrolladores avanzados	Reduce tiempos de prototipado y acelera features
Back office automatizado	SMBs, clínicas, retail, servicios profesionales	Quita trabajo repetitivo y reduce personal administrativo requerido
Atención a clientes / soporte	Enterprise y PyME	Puede automatizar flujos internos y externos
Pricing tools / marketing tools	Corporativo	Los agentes pueden iterar análisis y contenidos a escala
Visión computacional	Retail, manufactura, salud, defensa	Requiere respuesta local y procesamiento cerca del dato
Análisis médico / reportes / scans	Salud e investigación	Maneja datos sensibles y cargas analíticas pesadas
Traducción en tiempo real con voz	Enterprise global, colaboración remota	Necesita baja latencia y preservación de identidad vocal
Seguridad endpoint	Enterprise	Agentes y modelos ligeros pueden correr en NPU en segundo plano
Gestión de dispositivos	Enterprise IT	Offload de agentes de administración para liberar CPU/GPU
IA en gobiernos locales	Gobierno, servicios públicos	Automatización y análisis con restricciones de datos

MODELOS LOCALES: 9B, 35B, 100B Y EL CAMINO HACIA 300B EN NOTEBOOKS

MAPA DE HARDWARE Y CAPACIDADES MENCIONADAS

Plataforma / equipo mencionado	Memoria / capacidad destacada	Uso sugerido	Estado en la conversación
HP “Cashmere”	Modelos pequeños locales, alrededor de 9B–10B	Flujos agénticos básicos y tareas locales	Mencionado como equipo visible en demos
AMD “Chiron” / Strix Halo	128 GB de memoria compartida	Modelos de 35B+, desarrollo local, agentes, prototipado	Usado como máquina personal en la mesa
Ryzen AI Max / Strix Halo	Hasta 128 GB de memoria unificada	IA local, desarrollo, Windows/Linux, ROCm	Ya presente en mercado en múltiples productos, según AMD/HP
Ryzen AI Halo	Hasta 128 GB de memoria unificada; AMD habla de modelos hasta 200B	“Agent computers” y desarrollo local	Anunciado por AMD en 2026
Plataforma futura “Gorgon Halo”	Mencionada con capacidad de hasta 300B	Modelos mucho más grandes en notebook/desktop compacto	Declaración de roadmap en la conversación
NVIDIA RTX Spark	Hasta 128 GB de memoria unificada, 20 núcleos Arm, Blackwell GPU	Agentes locales en Windows, dev boxes y laptops	Anunciada en Computex 2026

NVIDIA RTX SPARK VS AMD RYZEN AI MAX / HALO: LA BATALLA POR LA IA LOCAL

Apartado	NVIDIA RTX Spark	AMD Ryzen AI Max / Halo
Arquitectura CPU	Arm, en colaboración con MediaTek según reportes	x86 AMD
GPU	NVIDIA Blackwell	Radeon integrada de alto rendimiento 8060S
Memoria	Hasta 128 GB unificada	Hasta 128 GB unificada
Cómputo IA	Hasta 1 petaflop, según NVIDIA/Microsoft	AMD posiciona Ryzen AI Halo para modelos grandes locales
Software	CUDA, stack NVIDIA, Windows agentic PC con Microsoft	ROCm, Windows/Linux, open source como apuesta
Ecosistema	Muy fuerte en IA por CUDA y NVIDIA AI stack	Más abierto, x86 y con integración CPU/GPU/NPU
Disponibilidad	Anunciada en Computex 2026; productos esperados más adelante	AMD/HP afirman tener equipos Strix Halo ya en mercado
Diferenciador	Stack AI maduro y fuerte respaldo Microsoft/NVIDIA	Plataforma x86, Windows/Linux, gaming/creación/desarrollo en un mismo sistema
Riesgo	Precio alto y productos aún por tocar/probar	ROCm aún debe cerrar brechas frente al dominio CUDA

ROCm, NPUs Y EL PROBLEMA REAL: SOFTWARE, SOFTWARE Y MÁS SOFTWARE

CPU, GPU Y NPU EN IA LOCAL

Componente	Mejor uso	Ventaja	Limitación
CPU	Orquestación, lógica general, tareas secuenciales, compatibilidad	Flexible y universal	Menos eficiente para inferencia pesada
GPU	Modelos grandes, inferencia rápida, desarrollo, generación, visión	Alto rendimiento y ancho de banda	Mayor consumo
NPU	Tareas en segundo plano, seguridad, eficiencia, modelos ligeros	Bajo consumo y operación persistente	Depende mucho del soporte de ISVs y frameworks
Memoria unificada	Modelos grandes locales y reducción de copias	Permite asignar mucha memoria a IA	El ancho de banda y software siguen siendo críticos
Cloud	Modelos frontera, escala, despliegue global	Máxima capacidad y disponibilidad	Costo de tokens, datos, latencia y dependencia externa
Infraestructura privada	Datos sensibles y control corporativo	Gobernanza y soberanía	Costo inicial y operación
Workstation local	Prototipado rápido e “infinite tokens”	Iteración barata y baja latencia	No reemplaza modelos frontera

SEGURIDAD: PROMPT INJECTION, SANDBOXING Y EL PROBLEMA DE MEZCLAR DATOS CON CONTROL

Screenshot 2026 06 05 000132

RIESGOS Y MITIGACIONES EN IA AGÉNTICA

Riesgo	Qué implica	Mitigación probable
Prompt injection	Instrucciones maliciosas escondidas en datos externos	Sandboxing, políticas, separación de privilegios, validación y auditoría
Exfiltración de datos	Agentes con acceso a correo/archivos podrían filtrar información	Infraestructura privada, permisos mínimos, DLP, identidad fuerte
Costos descontrolados	Agentes 24/7 consumen tokens constantemente	Modelos locales, límites de gasto, routing inteligente cloud/local
Tool calling inconsistente	Modelos pequeños pueden fallar al usar herramientas	Modelos más grandes, validación, retries, frameworks más robustos
Shadow AI	Usuarios montan flujos sin control de TI	Plataformas aprobadas, herramientas internas, políticas claras
Dependencia de cloud	Latencia, privacidad y costo	Arquitectura híbrida con local/private/cloud
Vulnerabilidades de agentes	Herramientas enthusiast no siempre priorizan seguridad	Versiones enterprise, hardening, revisión de código, sandboxing
Datos regulados	No pueden salir a servicios externos	On-prem, edge, air-gapped, modelos privados

AMD y HP explican por qué la IA agéntica no vivirá solo en la nube: tokens caros, PCs con 128 GB y el regreso del cómputo local

ADOPCIÓN DE IA AGÉNTICA POR SEGMENTO

EL COSTO DE TOKENS: LA FACTURA QUE ESTÁ FORZANDO A REPENSAR LA INFRAESTRUCTURA

CUATRO RAZONES PARA LLEVAR IA AL DISPOSITIVO O A INFRAESTRUCTURA LOCAL

IA AGÉNTICA EN DESARROLLO: DE NUEVE MESES A UNA SEMANA, PERO CON UNA FACTURA BRUTAL

CASOS DE USO MENCIONADOS EN LA MESA REDONDA

MODELOS LOCALES: 9B, 35B, 100B Y EL CAMINO HACIA 300B EN NOTEBOOKS

MAPA DE HARDWARE Y CAPACIDADES MENCIONADAS

NVIDIA RTX SPARK VS AMD RYZEN AI MAX / HALO: LA BATALLA POR LA IA LOCAL

ROCm, NPUs Y EL PROBLEMA REAL: SOFTWARE, SOFTWARE Y MÁS SOFTWARE

CPU, GPU Y NPU EN IA LOCAL

SEGURIDAD: PROMPT INJECTION, SANDBOXING Y EL PROBLEMA DE MEZCLAR DATOS CON CONTROL

RIESGOS Y MITIGACIONES EN IA AGÉNTICA

EL MERCADO NO SERÁ SOLO DE KNOWLEDGE WORKERS

LA IA LOCAL NO ES MODA, ES CONSECUENCIA DE QUE LA NUBE SE VOLVIÓ DEMASIADO CARA PARA USARLA COMO BASURERO

CONCLUSIÓN: LA IA AGÉNTICA SERÁ HÍBRIDA O SERÁ ECONÓMICAMENTE INSOSTENIBLE

Galería de imágenes

Etiquetas

Comentarios

Deja tu comentario

Artículos relacionados

AMD lanza GPU con 144GB de VRAM HBM3E y 600W de consumo

La IA como infraestructura: la verdadera carrera tecnológica ya no es por el modelo, sino por el cómputo

Los robotaxis de Waymo recurren a asistencia humana de personas en Filipinas

AMD y HP explican por qué la IA agéntica no vivirá solo en la nube: tokens caros, PCs con 128 GB y el regreso del cómputo local

ADOPCIÓN DE IA AGÉNTICA POR SEGMENTO

EL COSTO DE TOKENS: LA FACTURA QUE ESTÁ FORZANDO A REPENSAR LA INFRAESTRUCTURA

CUATRO RAZONES PARA LLEVAR IA AL DISPOSITIVO O A INFRAESTRUCTURA LOCAL

IA AGÉNTICA EN DESARROLLO: DE NUEVE MESES A UNA SEMANA, PERO CON UNA FACTURA BRUTAL

CASOS DE USO MENCIONADOS EN LA MESA REDONDA

MODELOS LOCALES: 9B, 35B, 100B Y EL CAMINO HACIA 300B EN NOTEBOOKS

MAPA DE HARDWARE Y CAPACIDADES MENCIONADAS

NVIDIA RTX SPARK VS AMD RYZEN AI MAX / HALO: LA BATALLA POR LA IA LOCAL

ROCm, NPUs Y EL PROBLEMA REAL: SOFTWARE, SOFTWARE Y MÁS SOFTWARE

CPU, GPU Y NPU EN IA LOCAL

SEGURIDAD: PROMPT INJECTION, SANDBOXING Y EL PROBLEMA DE MEZCLAR DATOS CON CONTROL

RIESGOS Y MITIGACIONES EN IA AGÉNTICA

EL MERCADO NO SERÁ SOLO DE KNOWLEDGE WORKERS

LA IA LOCAL NO ES MODA, ES CONSECUENCIA DE QUE LA NUBE SE VOLVIÓ DEMASIADO CARA PARA USARLA COMO BASURERO

CONCLUSIÓN: LA IA AGÉNTICA SERÁ HÍBRIDA O SERÁ ECONÓMICAMENTE INSOSTENIBLE

Galería de imágenes

Etiquetas

Comentarios

Deja tu comentario

Artículos relacionados

AMD lanza GPU con 144GB de VRAM HBM3E y 600W de consumo

La IA como infraestructura: la verdadera carrera tecnológica ya no es por el modelo, sino por el cómputo

Los robotaxis de Waymo recurren a asistencia humana de personas en Filipinas