Sparkle pierde la cabeza: 768GB VRAM en un solo server con GPUs Intel Arc B60 - DrogaDigital

En el creciente campo de la inteligencia artificial, la capacidad de memoria de video (VRAM) se ha vuelto fundamental, y Sparkle lo sabe, es por eso que están anunciando tremendos productos con cantidades de memoria absurdas: Hasta 768GB de memoria VRAM

SPARKLE e Intel: Potenciando la Inteligencia Artificial con Soluciones de Servidor y VRAM de Alta Capacidad

SPARKLE, en colaboración con Intel, presenta una robusta gama de soluciones de hardware diseñadas específicamente para satisfacer las exigentes demandas de las cargas de trabajo de IA, desde la inferencia local hasta las aplicaciones empresariales a gran escala. La propuesta se centra en ofrecer sistemas multi-GPU con una VRAM masiva, posicionándose como una alternativa costo-eficiente para tareas como el fine-tuning de modelos de lenguaje (LLMs) y la creación de aplicaciones de RAG (Generación Aumentada por Recuperación) multimodales.

Está impulsado por procesadores duales Intel Xeon Scalable de 4ta o 5ta generación y cuenta con 32 ranuras de memoria DDR5, lo que garantiza un rendimiento excepcional para las tareas más intensivas. La arquitectura está optimizada para la comunicación directa entre CPU y GPU a través de tecnologías como PCIe Direct Drive y tarjetas de extensión PCIe 5.0, minimizando la latencia y maximizando el ancho de banda, un factor crucial para el entrenamiento y la inferencia de grandes modelos.

El producto estrella de esta línea es el servidor C741-6U-Dual 16P, una potente máquina diseñada para alcanzar una capacidad máxima de 768GB de VRAM. Este servidor, montado en un chasis de 6U, logra esta impresionante cifra al integrar hasta dieciséis tarjetas gráficas SPARKLE Intel® Arc™ Pro B60 Duo de 48GB.

¿Cómo funciona el Switch? Esta tarjeta toma un gran número de carriles PCIe que vienen del procesador (en el diagrama, "Upstream 32 Lanes") y utiliza un chip especializado llamado "Microchip Switch IC" para gestionar y multiplicar esos carriles hacia las GPUs (en el diagrama, "Downstream 64 Lanes").

¿Cómo Funciona un Switch PCIe?

Imagina que la CPU es el director de orquesta y las 16 GPUs son los músicos. El director no puede hablar con cada músico a la vez; necesita un sistema para distribuir las partituras (los datos) de forma eficiente. Aquí es donde entra el switch.

Recibe Datos: El switch recibe un gran "paquete" de datos desde la CPU a través de una conexión de alta velocidad (los carriles o "lanes" PCIe de entrada).
Lee la Dirección: Cada paquete de datos tiene una "dirección de destino", que le dice a qué GPU específica debe ir. El switch lee esta dirección a una velocidad vertiginosa.
Conmutación (Switching): De forma inteligente, el chip crea una ruta temporal y directa para enviar ese paquete de datos exclusivamente a la GPU correcta, sin que los demás se enteren. Esto es similar a cómo un conmutador de red envía datos solo al ordenador que los solicitó, y no a todos los de la red.
Manejo de Múltiples Peticiones: Su verdadera magia es que puede hacer esto para múltiples GPUs simultáneamente. Gestiona el tráfico para evitar colisiones y cuellos de botella, asegurando que el flujo de datos sea constante y eficiente.

Recordemos que en cargas de trabajo enfocadas a la Inteligencia Artificial, es mucho más facil cargar y distribuir un modelo a través de múltiples GPUs, debido a que la latencia es substancialmente menos crucial que en otras aplicaciones, como por ejemplo: El gaming, donde recordemos que tiene mucho tiempo que no vemos configuraciones con múltiples núcleos en una misma tarjeta.

Galería de imágenes

20250918101902483.jpg

20250918101858497.jpg

20250918101855696.jpg

20250918101832310.jpg

Etiquetas

#Intel#Inteligencia Artificial#Arc

Artículos relacionados

Gemini 3 ya está aqui 😱el nuevo modelo de IA de Google es GENIAL

Inteligencia Artificial

DESTACADO

Gemini 3 ya está aqui 😱el nuevo modelo de IA de Google es GENIAL

Google ha lanzado Gemini 3, posicionándolo no solo como su modelo más inteligente hasta la fecha, sino como el motor central que impulsa una nueva era de funcionalidad en sus productos. Este lanzamiento es una declaración estratégica que busca redefinir la utilidad práctica de la inteligencia artificial, moviéndose más allá de la simple generación de contenido hacia la resolución compleja de problemas y una agentic AI más autónoma.

Ben Stolen•3 min

Inteligencia Artificial

OpenAI Declara la Guerra a Google con el Lanzamiento de 'ChatGPT Atlas', su Nuevo Navegador Web Impulsado por IA

OpenAI acaba de lanzar su propio navegador web, llamado ChatGPT Atlas, un movimiento que la comunidad tecnológica ya califica como una "declaración de guerra" directa contra Google y su hegemonía en el mercado de Chrome.

Ben Stolen•2 min

Inteligencia Artificial

Intel ARC B60: 48GB VRAM y 2 núcleos de GPU en la misma tarjeta

Maxsun nos muestra lo que andan cocinando: Una auténtica BESTIA para IA que tiene 2 núcleos BMG-G21 (correspondientes a una Arc B580) y la friolera cantidad de 48GB de memoria VRAM.

Ben Stolen•1 min

Ver más artículos

Comentarios

Los comentarios se cargarán automáticamente...