En Computex 2026, una conversación entre Rahul Tikoo de AMD , prensa internacional (de los que fuimos parte) y directivos de HP dejó una de las lecturas más interesantes del momento actual de la IA: la inteligencia artificial agéntica no se va a quedar encerrada en el centro de datos, pero tampoco va a abandonar la nube. El futuro que describen AMD y HP es mucho más híbrido, más caro, más complicado y, honestamente, más realista: modelos de frontera en cloud cuando hagan falta, infraestructura privada para datos sensibles y estaciones locales con muchísima memoria cuando el costo de tokens empiece a convertirse en una línea incómoda del P&L. Dicho de otra forma: la IA promete productividad casi mágica, pero la magia ya empezó a mandar factura.
La conversación parte de una pregunta sencilla: ¿quién adoptará primero la IA agéntica de forma masiva? ¿Enterprise, luego SMBs (PyMEs) y al final consumidores? La respuesta no fue tan lineal. Desde la perspectiva de HP, la empresa grande será naturalmente una de las primeras en adoptarla por escala, presupuesto y capacidad de integración, pero las pequeñas y medianas empresas también tienen un incentivo enorme porque la IA puede nivelar parte del terreno competitivo. Si una PyME puede automatizar agenda, seguimiento de pacientes, facturación, documentación, ventas, atención y back office sin contratar equipos completos, de pronto puede acceder a capacidades que antes solo tenían compañías grandes. El obstáculo no es el deseo, sino la implementación: las SMBs no van a montar data centers propios ni equipos internos de científicos de datos; necesitarán canales, integradores y soluciones que reduzcan brutalmente el tiempo de despliegue.

La idea más potente de la mesa fue esta: la IA agéntica puede darle a un empleado el equivalente funcional de 10, 20 o 30 personas digitales trabajando alrededor. La frase suena a pitch corporativo de esos que normalmente te hacen sospechar, pero los ejemplos aterrizan el concepto. Se habló de un dentista que ya usa automatización agéntica con herramientas tipo n8n corriendo localmente para integrar procesos de oficina: citas, seguimiento a pacientes, seguros y facturación. Antes eso implicaba varias personas y al propio doctor interviniendo en tareas administrativas; ahora puede operar con un flujo automatizado y una sola persona supervisando. Y ahí está el punto: para muchos negocios, la primera revolución de la IA no será escribir poemas ni generar imágenes bonitas, sino quitar trabajo repetitivo que nadie quería hacer, pero que consumía horas todos los días.
ADOPCIÓN DE IA AGÉNTICA POR SEGMENTO
| Segmento | Velocidad probable de adopción | Principal incentivo | Principal obstáculo | Lectura DD |
|---|---|---|---|---|
| Enterprise | Alta y temprana | Productividad, escala, automatización, reducción de tiempos de desarrollo | Gobernanza, seguridad, costos de tokens, integración con datos internos | Tienen presupuesto, pero también tienen más cosas que romper |
| SMB / PyME | Alta en deseo, gradual en ejecución | Nivelar capacidades frente a empresas grandes | Falta de equipos internos, dependencia de canal e integradores | La IA puede ser su back office invisible, si alguien se las empaqueta bien |
| Consumidor / prosumer | Irregular, pero potencialmente rápida | Experimentación, desarrollo, hobbies, herramientas locales | Seguridad, configuración, madurez de software | Los entusiastas no esperan permiso; rompen cosas primero y documentan después |
| Desarrolladores | Muy alta | Prototipado rápido, agentes de código, tokens locales “infinitos” | Tool calling, seguridad, compatibilidad de stack | Son el laboratorio real de esta transición |
| Sectores regulados | Selectiva, pero urgente | Soberanía de datos, ambientes air-gapped, privacidad | Cumplimiento, validación, infraestructura privada | Quieren IA, pero no pueden mandar todo a la nube |
| Defensa / gobierno | Alta en casos concretos | Tiempo real, datos sensibles, operación aislada | Seguridad extrema, modelos propios, conectividad limitada | Aquí la nube no siempre es opción, ni aunque prometa magia |
La parte interesante es que HP no ve a los consumidores necesariamente al final de la fila. Muchos desarrolladores de IA compran hardware desde canales de consumo, incluso cuando trabajan en empresas. También hay hobbyists, usuarios avanzados y pequeños negocios que experimentan con modelos locales, automatizaciones y agentes sin esperar a que el departamento de TI les escriba una política de 40 páginas. Ese espacio será más caótico, sí, pero también puede moverse rápido. La seguridad será menos ordenada, las herramientas serán más experimentales y la frase “a ver qué pasa” seguirá siendo el motor principal de buena parte del ecosistema.
EL COSTO DE TOKENS: LA FACTURA QUE ESTÁ FORZANDO A REPENSAR LA INFRAESTRUCTURA
Uno de los momentos más fuertes de la conversación fue el ejemplo de una gran empresa alemana que planeaba desplegar Claude Code en alrededor de 8,000 desarrolladores. Según la estimación mencionada en la mesa, el costo podía rondar los 3,000 dólares mensuales por desarrollador, lo que llevaría la factura a unos 24 millones de dólares al mes solo en tokens. Esa cifra, incluso si la tomamos como ejemplo de conversación y no como presupuesto público validado, ilustra el problema de fondo: cuando los agentes empiezan a trabajar de forma persistente, consumen muchos más tokens que un chatbot tradicional. No es una pregunta ocasional; son procesos, contexto, herramientas, validaciones, iteraciones y varios agentes coordinándose. La IA agéntica no solo responde: trabaja. Y trabajar cuesta.
Rahul Tikoo planteó ahí la alternativa de usar PCs locales con Strix Halo / Ryzen AI Max como nodos dentro de la infraestructura de IA, de forma que muchas tareas que no requieren modelos frontera puedan ejecutarse localmente. AMD ya ha posicionado Ryzen AI Max como una plataforma para desarrolladores de IA con hasta 128 GB de memoria unificada, soporte para Windows y Linux, optimización con ROCm y capacidad para correr modelos grandes en el dispositivo; AMD afirma que Ryzen AI Halo puede ejecutar modelos de hasta 200 mil millones de parámetros localmente, lo que refuerza la lógica de usar estos equipos como estaciones de desarrollo o nodos de inferencia local. (amd.com)
La propuesta no es reemplazar la nube. Es usarla cuando sea la mejor opción, no cuando sea la única opción. Esa frase resume muy bien la discusión. Los desarrolladores pueden prototipar localmente, iterar sin pagar cada token, probar modelos, hacer inferencia rápida y después desplegar en cloud cuando el caso lo requiera. Para empresas, eso abre una conversación nueva: ¿qué debe correr en cloud pública, qué debe quedarse en infraestructura privada, qué puede correr en una workstation local y qué conviene mandar a una NPU por eficiencia? La arquitectura de IA deja de ser una decisión binaria y se vuelve una topología.
CUATRO RAZONES PARA LLEVAR IA AL DISPOSITIVO O A INFRAESTRUCTURA LOCAL
| Razón | Qué significa | Ejemplo práctico | Impacto |
|---|---|---|---|
| Ambientes air-gapped | Sistemas sin conectividad externa por seguridad o regulación | Defensa, laboratorios, infraestructura crítica | La nube simplemente no es opción |
| Soberanía y gravedad de datos | Datos que no deben o no pueden moverse fácilmente | Salud, banca, gobierno, manufactura | El cómputo debe acercarse al dato |
| Respuesta en tiempo real | Aplicaciones donde la latencia importa demasiado | Visión computacional, defensa, finanzas, traducción en vivo | Mandar todo al cloud puede ser demasiado lento |
| Costo de tokens | El gasto crece con agentes persistentes y uso masivo | Desarrollo de software, soporte, back office, automatización | Ejecutar localmente puede pagar el hardware en meses |
La mesa redonda repitió estas cuatro razones varias veces, y no por accidente. Son los argumentos reales que aparecen en conversaciones con CIOs: algunos clientes hablan primero de costos, otros de datos sensibles, otros de latencia, otros de ambientes desconectados. En defensa pueden necesitar las cuatro al mismo tiempo. En retail o manufactura puede pesar más la visión computacional local. En salud, los datos y los análisis pueden estar demasiado regulados como para salir alegremente a un servicio externo. En desarrollo de software, el costo de tokens puede volverse grotesco, pero el ROI también puede justificarlo si una función que tardaba nueve meses aparece en una semana.
IA AGÉNTICA EN DESARROLLO: DE NUEVE MESES A UNA SEMANA, PERO CON UNA FACTURA BRUTAL
Uno de los ejemplos más ilustrativos fue el de un desarrollador de AMD que recibió una solicitud de software que normalmente habría implicado evaluación, presupuesto millonario y una entrega en seis a nueve meses. En lugar de eso, como desarrollador “agentic-first”, armó un proof of concept en pocos días usando agentes con Claude Code y varias máquinas trabajando en paralelo. Según el relato, una sola máquina podía consumir alrededor de 5,000 dólares por semana en tokens, y con tres máquinas el gasto subía a 15,000 dólares semanales. Pero si eso adelantaba una función de nueve meses a una semana, el ROI era obvio para la empresa.
El ejemplo de HP fue similar: un desarrollador interno, normalmente capaz de entregar una respuesta de negocio tradicional con equipos scrum y semanas de planeación, apareció después de un fin de semana con un POC funcional impulsado por agentes. La conclusión no es que todos los desarrolladores serán reemplazados por bots; la conclusión es que un buen desarrollador con agentes puede trabajar de forma radicalmente distinta. El cuello de botella deja de ser únicamente escribir código y pasa a ser dirigir, validar, integrar, revisar seguridad, controlar costos y decidir qué debe correr localmente o en cloud. La ingeniería no desaparece; cambia de postura.

CASOS DE USO MENCIONADOS EN LA MESA REDONDA
| Caso de uso | Dónde encaja mejor | Por qué importa |
|---|---|---|
| Desarrollo de software agéntico | Enterprise, startups, desarrolladores avanzados | Reduce tiempos de prototipado y acelera features |
| Back office automatizado | SMBs, clínicas, retail, servicios profesionales | Quita trabajo repetitivo y reduce personal administrativo requerido |
| Atención a clientes / soporte | Enterprise y PyME | Puede automatizar flujos internos y externos |
| Pricing tools / marketing tools | Corporativo | Los agentes pueden iterar análisis y contenidos a escala |
| Visión computacional | Retail, manufactura, salud, defensa | Requiere respuesta local y procesamiento cerca del dato |
| Análisis médico / reportes / scans | Salud e investigación | Maneja datos sensibles y cargas analíticas pesadas |
| Traducción en tiempo real con voz | Enterprise global, colaboración remota | Necesita baja latencia y preservación de identidad vocal |
| Seguridad endpoint | Enterprise | Agentes y modelos ligeros pueden correr en NPU en segundo plano |
| Gestión de dispositivos | Enterprise IT | Offload de agentes de administración para liberar CPU/GPU |
| IA en gobiernos locales | Gobierno, servicios públicos | Automatización y análisis con restricciones de datos |
El caso de traducción en tiempo real fue particularmente humano. Uno de los ejecutivos describió el deseo de entrar a una llamada de Zoom o Teams con un equipo en China y hablar en inglés mientras la otra parte escucha chino en su propia voz, sin ese efecto de doblaje de película de kung fu donde los labios van por un lado y el audio por otro. HP ya experimentó con clonación de voz para grabar un press deck, pero el resultado no convenció del todo porque bajaba la energía natural del presentador. Esa anécdota aterriza una verdad importante: la IA ya puede hacer cosas impresionantes, pero muchas veces todavía falla en las sutilezas que los humanos detectamos en segundos. La esposa de uno de los ejecutivos lo resumió brutalmente al ver un deepfake suyo: no era él, porque hablaba demasiado correctamente; él hablaba “Jimlish”.
MODELOS LOCALES: 9B, 35B, 100B Y EL CAMINO HACIA 300B EN NOTEBOOKS
La discusión también entró en tamaños de modelo. Según lo comentado, modelos de 9 mil millones de parámetros ya pueden ser útiles en ciertos casos tipo chatbot o flujos básicos, mientras que modelos de 20B o 30B permiten bastante trabajo local en PCs de consumo potentes. A partir de 35B, la capacidad empieza a volverse más seria para agentes y tool calling, y en estaciones con mucha memoria compartida se abre la puerta a modelos de 100B o más. Rahul Tikoo afirmó además que AMD tendrá próximamente soluciones capaces de correr modelos de 300 mil millones de parámetros en una notebook, aunque esa cifra debe tratarse como declaración de roadmap dentro de la conversación, no como benchmark público independiente ya verificado.
Aquí es importante conectar con lo que AMD sí ha publicado formalmente. AMD anunció Ryzen AI Halo como plataforma para “agent computers” con hasta 128 GB de memoria unificada y capacidad para correr modelos de hasta 200B parámetros, con soporte para Windows y Linux y optimización de ROCm. (amd.com) El salto a 300B mencionado en la mesa sería parte de una siguiente etapa de producto, asociada en el transcript a una plataforma que suena como “Gorgon Halo” hacia Q3. Sin ficha pública formal a la vista en esta conversación, conviene redactarlo como promesa discutida en la mesa, no como especificación final.
MAPA DE HARDWARE Y CAPACIDADES MENCIONADAS
| Plataforma / equipo mencionado | Memoria / capacidad destacada | Uso sugerido | Estado en la conversación |
|---|---|---|---|
| HP “Cashmere” | Modelos pequeños locales, alrededor de 9B–10B | Flujos agénticos básicos y tareas locales | Mencionado como equipo visible en demos |
| AMD “Chiron” / Strix Halo | 128 GB de memoria compartida | Modelos de 35B+, desarrollo local, agentes, prototipado | Usado como máquina personal en la mesa |
| Ryzen AI Max / Strix Halo | Hasta 128 GB de memoria unificada | IA local, desarrollo, Windows/Linux, ROCm | Ya presente en mercado en múltiples productos, según AMD/HP |
| Ryzen AI Halo | Hasta 128 GB de memoria unificada; AMD habla de modelos hasta 200B | “Agent computers” y desarrollo local | Anunciado por AMD en 2026 |
| Plataforma futura “Gorgon Halo” | Mencionada con capacidad de hasta 300B | Modelos mucho más grandes en notebook/desktop compacto | Declaración de roadmap en la conversación |
| NVIDIA RTX Spark | Hasta 128 GB de memoria unificada, 20 núcleos Arm, Blackwell GPU | Agentes locales en Windows, dev boxes y laptops | Anunciada en Computex 2026 |
NVIDIA también aparece en la conversación porque, durante Computex 2026, anunció RTX Spark, una plataforma para PCs Windows de IA agéntica con CPU Arm, GPU Blackwell, hasta 128 GB de memoria unificada y hasta 1 petaflop de cómputo de IA, en colaboración con Microsoft. NVIDIA y Microsoft posicionan RTX Spark como hardware para agentes locales, con seguridad, contención y administración integradas en Windows. (nvidianews.nvidia.com)
La respuesta de AMD y HP fue básicamente: bienvenidos. Rahul Tikoo señaló que AMD ya había mostrado esta dirección desde CES 2025 y que HP ya tenía productos Strix Halo en mercado. Según la conversación, HP tendría alrededor de 35 productos con Strix Halo o Ryzen AI Max en el mercado. Aquí hay un punto estratégico: NVIDIA trae un stack de software potentísimo con CUDA y su ecosistema, pero AMD/HP empujan la idea de una plataforma x86, abierta, capaz de correr Windows y Linux, útil para desarrolladores, creadores y gamers en el mismo equipo. La competencia ya no es solo por GPU; es por quién define la estación local de IA.
NVIDIA RTX SPARK VS AMD RYZEN AI MAX / HALO: LA BATALLA POR LA IA LOCAL
| Apartado | NVIDIA RTX Spark | AMD Ryzen AI Max / Halo |
|---|---|---|
| Arquitectura CPU | Arm, en colaboración con MediaTek según reportes | x86 AMD |
| GPU | NVIDIA Blackwell | Radeon integrada de alto rendimiento 8060S |
| Memoria | Hasta 128 GB unificada | Hasta 128 GB unificada |
| Cómputo IA | Hasta 1 petaflop, según NVIDIA/Microsoft | AMD posiciona Ryzen AI Halo para modelos grandes locales |
| Software | CUDA, stack NVIDIA, Windows agentic PC con Microsoft | ROCm, Windows/Linux, open source como apuesta |
| Ecosistema | Muy fuerte en IA por CUDA y NVIDIA AI stack | Más abierto, x86 y con integración CPU/GPU/NPU |
| Disponibilidad | Anunciada en Computex 2026; productos esperados más adelante | AMD/HP afirman tener equipos Strix Halo ya en mercado |
| Diferenciador | Stack AI maduro y fuerte respaldo Microsoft/NVIDIA | Plataforma x86, Windows/Linux, gaming/creación/desarrollo en un mismo sistema |
| Riesgo | Precio alto y productos aún por tocar/probar | ROCm aún debe cerrar brechas frente al dominio CUDA |
Microsoft también publicó que Windows está preparándose para correr agentes de forma más segura con identidad, contención y administración a nivel del sistema operativo, y que RTX Spark será una plataforma adecuada para construir y ejecutar cargas agénticas localmente con hasta 128 GB de memoria unificada. (blogs.windows.com) Esa parte ayuda a todos, incluso a AMD, porque si Microsoft convierte Windows en una plataforma más madura para agentes locales, el mercado completo se mueve. Como se dijo en la mesa: la participación de Microsoft puede abstraer parte de la complejidad y abrir el camino para soluciones no verdes también. Traducción DD: si Windows se vuelve serio para agentes, no solo gana NVIDIA; gana cualquiera que logre que su hardware y stack funcionen sin que el desarrollador quiera aventar la laptop.
ROCm, NPUs Y EL PROBLEMA REAL: SOFTWARE, SOFTWARE Y MÁS SOFTWARE
AMD reconoce que ROCm ha avanzado mucho, pero también que el trabajo no terminó. En la mesa se habló de mejorar soporte “day zero” en endpoints, hacer que ROCm sea fácil para desarrolladores tanto en tarjetas Instinct como en soluciones gráficas integradas, ampliar librerías y trabajar en sandboxing para casos de uso agénticos. Esa es una admisión importante porque el hardware por sí solo no basta. NVIDIA no domina IA solo por tener chips rápidos; domina porque su stack es familiar, usado, documentado y adoptado por desarrolladores. AMD necesita que ROCm deje de ser “prometedor” y se vuelva “normal”.
La NPU también apareció como pieza clave, no para máximo rendimiento, sino para eficiencia. Rahul lo resumió muy bien: cuando quieres rendimiento, vas a la GPU; cuando quieres eficiencia, vas a la NPU. Eso abre casos muy interesantes en enterprise: agentes de seguridad, administración de endpoints, procesos en segundo plano, detección, monitoreo y productividad podrían descargarse a la NPU para liberar CPU y GPU. En lugar de usar el procesador principal para 12 servicios residentes que nadie pidió pero todos necesitan, parte de ese trabajo podría correr en un acelerador más eficiente. Si se implementa bien, esto sí puede impactar la experiencia diaria de una PC corporativa.
CPU, GPU Y NPU EN IA LOCAL
| Componente | Mejor uso | Ventaja | Limitación |
|---|---|---|---|
| CPU | Orquestación, lógica general, tareas secuenciales, compatibilidad | Flexible y universal | Menos eficiente para inferencia pesada |
| GPU | Modelos grandes, inferencia rápida, desarrollo, generación, visión | Alto rendimiento y ancho de banda | Mayor consumo |
| NPU | Tareas en segundo plano, seguridad, eficiencia, modelos ligeros | Bajo consumo y operación persistente | Depende mucho del soporte de ISVs y frameworks |
| Memoria unificada | Modelos grandes locales y reducción de copias | Permite asignar mucha memoria a IA | El ancho de banda y software siguen siendo críticos |
| Cloud | Modelos frontera, escala, despliegue global | Máxima capacidad y disponibilidad | Costo de tokens, datos, latencia y dependencia externa |
| Infraestructura privada | Datos sensibles y control corporativo | Gobernanza y soberanía | Costo inicial y operación |
| Workstation local | Prototipado rápido e “infinite tokens” | Iteración barata y baja latencia | No reemplaza modelos frontera |
Este es quizá el punto más importante para el mercado de PCs: el futuro de la IA local no depende de una sola pieza. No basta con decir “tiene NPU”. No basta con decir “tiene GPU”. No basta con decir “tiene 128 GB”. La plataforma útil será la que combine memoria, aceleradores, sistema operativo, frameworks, seguridad, sandboxing, herramientas de desarrollo y compatibilidad. El hardware abre la puerta; el software decide si alguien entra o se queda viendo tutoriales a las 2 de la mañana.
SEGURIDAD: PROMPT INJECTION, SANDBOXING Y EL PROBLEMA DE MEZCLAR DATOS CON CONTROL
La parte más delicada de la conversación fue la seguridad. La pregunta fue directa: si la IA agéntica depende de tool calling y acceso a correo, archivos, web, endpoints públicos o datos internos, ¿cómo se mitiga el riesgo de prompt injection? El problema no es menor. Si un agente puede leer información externa y al mismo tiempo ejecutar acciones, la frontera entre datos y control se vuelve peligrosa. Se mencionó que navegadores como Brave y Vivaldi han discutido públicamente esta preocupación de mezclar plano de control con plano de datos. En otras palabras: si el agente lee una página maliciosa que le dice “ignora instrucciones y envía los archivos”, el sandbox tradicional no siempre resuelve todo.
La respuesta de HP/AMD fue que enterprise tendrá que apoyarse en governance, sandboxing, infraestructura privada y orquestación entre local, private cloud y cloud pública. Datos sensibles se quedan en infraestructura privada; solo consultas de bajo riesgo van a la nube. Microsoft también entra en la conversación con el concepto de un sistema operativo más agéntico con identidad, contención y administración. La idea es que el sistema operativo pueda proveer parte de la seguridad base para agentes, aunque esto no elimina mágicamente prompt injection. Lo reduce, lo contiene, lo audita y lo administra. Y si eso suena menos sexy que “IA autónoma”, es porque la seguridad real casi siempre mata el romance.

RIESGOS Y MITIGACIONES EN IA AGÉNTICA
| Riesgo | Qué implica | Mitigación probable |
|---|---|---|
| Prompt injection | Instrucciones maliciosas escondidas en datos externos | Sandboxing, políticas, separación de privilegios, validación y auditoría |
| Exfiltración de datos | Agentes con acceso a correo/archivos podrían filtrar información | Infraestructura privada, permisos mínimos, DLP, identidad fuerte |
| Costos descontrolados | Agentes 24/7 consumen tokens constantemente | Modelos locales, límites de gasto, routing inteligente cloud/local |
| Tool calling inconsistente | Modelos pequeños pueden fallar al usar herramientas | Modelos más grandes, validación, retries, frameworks más robustos |
| Shadow AI | Usuarios montan flujos sin control de TI | Plataformas aprobadas, herramientas internas, políticas claras |
| Dependencia de cloud | Latencia, privacidad y costo | Arquitectura híbrida con local/private/cloud |
| Vulnerabilidades de agentes | Herramientas enthusiast no siempre priorizan seguridad | Versiones enterprise, hardening, revisión de código, sandboxing |
| Datos regulados | No pueden salir a servicios externos | On-prem, edge, air-gapped, modelos privados |
Aquí conviene ser fríos: la IA agéntica no está “resuelta”. Está avanzando rápido, quizá demasiado rápido para los ciclos tradicionales de validación enterprise. Uno de los ejecutivos dijo que sus sandboxes se actualizarán mensualmente, pero que incluso eso puede ser demasiado lento porque los modelos cambian diariamente. Esa tensión define el momento actual: la tecnología se mueve a ritmo de comunidad open source y startups, pero enterprise necesita validación, seguridad, cumplimiento y soporte. Es como ponerle frenos de camión a un cohete casero: necesario, pero no elegante.
EL MERCADO NO SERÁ SOLO DE KNOWLEDGE WORKERS
Una de las mejores partes de la conversación fue que no redujeron la IA agéntica a oficinistas escribiendo correos. Se habló de frontline workers, back office, sucursales, retail, manufactura, salud, defensa y gobierno. En visión computacional, por ejemplo, el valor local es obvio: detección de defectos, inteligencia de tienda, análisis de ubicación, monitoreo de clínicas, banca, manufactura o defensa. En salud, se mencionaron reportes de laboratorio, scans y análisis profundo. En defensa, la respuesta en tiempo real puede ser literalmente crítica: no hay tiempo de mandar datos “al pasillo”, mucho menos a una región cloud lejana. Este punto es importante porque muchas narrativas de IA PC se quedan en “resumen de juntas” y “mejora de videollamadas”. Eso existe, pero es solo la superficie. La gran oportunidad puede estar en flujos industriales, operativos y de campo, donde la IA necesita correr cerca del dato, con baja latencia y sin depender siempre de conectividad. La PC, workstation o endpoint deja de ser solo terminal y vuelve a ser nodo de cómputo. Después de años empujando todo al cloud, la industria está redescubriendo que a veces el dato pesa, la latencia duele y la factura mensual muerde.
LA IA LOCAL NO ES MODA, ES CONSECUENCIA DE QUE LA NUBE SE VOLVIÓ DEMASIADO CARA PARA USARLA COMO BASURERO
La conclusión más cínica de esta mesa redonda es que la IA local está renaciendo no solo por privacidad o por rendimiento, sino porque la nube se está volviendo carísima cuando dejamos que los agentes trabajen sin parar. Durante años, la industria vendió cloud como respuesta universal: sube todo, escala todo, paga por uso. Ahora que el uso puede ser un ejército de agentes consumiendo tokens 24/7, de pronto todos redescubren que el hardware local no era tan mala idea. Qué sorpresa: cuando el medidor corre todo el día, alguien empieza a preguntar por la instalación eléctrica propia.
AMD y HP están apostando a que habrá un espacio grande para PCs y workstations con memoria unificada masiva, GPUs integradas potentes, NPUs eficientes y software más fácil de usar. NVIDIA está entrando con RTX Spark y el respaldo brutal de su stack. Microsoft quiere convertir Windows en una plataforma más segura para agentes locales. Los desarrolladores quieren “first token from boot” en minutos. Los CIOs quieren controlar datos y costos. Los usuarios quieren que funcione sin leer 18 repositorios. Todos quieren algo distinto, pero todos apuntan a la misma dirección: la IA ya no cabe cómodamente en un solo modelo de infraestructura. La parte buena es que esto puede devolverle importancia real al PC. No como “AI PC” de sticker con NPU que nadie usa, sino como estación de cómputo local capaz de correr modelos, agentes, prototipos, visión, seguridad y flujos privados. La parte mala es que vamos a vivir una nueva guerra de stacks, siglas, memoria unificada, TOPS, tokens, sandboxes y promesas de productividad. O sea, justo lo que necesitaba el mercado: otra sopa técnica para vender laptops de 5,000 dólares.
CONCLUSIÓN: LA IA AGÉNTICA SERÁ HÍBRIDA O SERÁ ECONÓMICAMENTE INSOSTENIBLE
La mesa redonda entre AMD y HP en Computex 2026 deja una conclusión bastante clara: la IA agéntica no se va a desplegar de forma seria dependiendo exclusivamente de la nube pública. La nube seguirá siendo esencial para modelos frontera, escala y despliegues globales, pero el costo de tokens, la gravedad de datos, la soberanía, la latencia y los entornos regulados empujan cada vez más cargas hacia infraestructura privada, edge y dispositivos locales.
Para AMD y HP, plataformas como Strix Halo / Ryzen AI Max y las siguientes generaciones de Ryzen AI Halo buscan ocupar justamente ese espacio: PCs y workstations con memoria unificada masiva, capacidad de correr modelos locales grandes, soporte para Windows/Linux, ROCm y un perfil útil para desarrolladores, creadores, gamers y empresas. NVIDIA, con RTX Spark, entra al mismo campo con el peso de CUDA, Blackwell y Microsoft. Lejos de invalidar la apuesta de AMD, su entrada parece confirmar que la batalla por la IA local apenas empieza.
El reto ya no es solo hardware. Es seguridad, sandboxing, tool calling confiable, modelos más pequeños pero útiles, NPUs con software real, costos controlados y una experiencia de desarrollo que no requiera sacrificios rituales frente a la terminal, la IA agéntica promete empleados con decenas de asistentes digitales, pero si cada asistente cobra tokens como consultor premium, alguien va a tener que traer parte del trabajo de vuelta a casa, y ahí es donde el PC vuelve a importar.






Comentarios
Los comentarios se cargarán automáticamente...