miércoles, octubre 9, 2024

IBM revela innovaciones en procesador para acelerar la IA en sistemas mainframe IBM Z de próxima generación

IBM presenta el procesador IBM Telum II y el acelerador IBM Spyre, que prometen transformar el procesamiento de IA a escala empresarial. Estas innovaciones avanzadas facilitan la integración de modelos de lenguaje de gran tamaño e IA generativa, optimizando el rendimiento y la eficiencia en centros de datos.

IBM reveló detalles de la arquitectura del próximo procesador IBM Telum II y el acelerador IBM Spyre en Hot Chips 2024. Las nuevas tecnologías están diseñadas para aumentar considerablemente la capacidad de procesamiento en los sistemas mainframe IBM Z de próxima generación, facilitando el uso de modelos de IA tradicionales y grandes modelos de lenguaje de inteligencia artificial.

Con el aumento de la demanda de soluciones energéticamente eficientes, seguras y escalables para proyectos de IA generativa, que están pasando de la prueba de concepto a la producción, IBM se enfrenta a un desafío creciente. Una investigación de Morgan Stanley publicada en agosto estima que las demandas de energía para la IA generativa aumentarán un 75% anualmente en los próximos años, alcanzando en 2026 el consumo de energía equivalente al de España en 2022. Los clientes de IBM indican que es crucial tomar decisiones arquitectónicas para apoyar modelos base de tamaño adecuado y enfoques híbridos para cargas de trabajo de IA.

Procesador IBM Telum II y acelerador IBM Spyre.

Innovaciones Clave Presentadas

Procesador IBM Telum II:

El nuevo chip IBM Telum II ofrece una mayor frecuencia y capacidad de memoria, diseñado para impulsar los sistemas IBM Z de próxima generación. Presenta un crecimiento del 40% en la caché y un núcleo acelerador de IA integrado, además de una unidad de procesamiento de datos (DPU) conectada coherentemente en comparación con el chip Telum I. Se espera que el Telum II soporte soluciones informáticas empresariales para grandes modelos de lenguaje (LLM) y satisfaga las complejas necesidades transaccionales del sector.

Unidad de Aceleración IO:

La nueva DPU en el chip Telum II está diseñada para acelerar los protocolos de E/S complejos para redes y almacenamiento en el mainframe. Esta unidad simplifica las operaciones del sistema y puede mejorar el rendimiento de los componentes clave con una densidad de E/S aumentada en un 50%.

Acelerador IBM Spyre:

Este acelerador proporciona capacidad adicional de procesamiento de IA para complementar al procesador Telum II. Juntos, forman una arquitectura escalable que soporta métodos conjuntos de modelado de IA, combinando múltiples modelos para proporcionar resultados más precisos y sólidos. El acelerador IBM Spyre se entrega como una opción complementaria, conectado a través de un adaptador PCIe de 75 vatios y basado en tecnología desarrollada en colaboración con el IBM Research AI Hardware Center. Es escalable para adaptarse a las necesidades del cliente.

Nuestra sólida hoja de ruta multigeneracional nos posiciona a la vanguardia de las tendencias tecnológicas, incluidas las crecientes demandas de IA,” afirmó Tina Tarquinio, VP de Gestión de Productos IBM Z y LinuxONE.

El procesador Telum II y el acelerador Spyre están diseñados para ofrecer soluciones informáticas empresariales de alto rendimiento, seguras y con mayor eficiencia energética“, argegó.

El procesador Telum II y el acelerador IBM Spyre, fabricados por Samsung Foundry en un nodo de proceso de 5 nm, están diseñados para soportar una variedad de casos de uso avanzados impulsados por IA. Juntos, facilitan la detección de fraudes, la prevención del lavado de dinero y la implementación de asistentes de inteligencia artificial, ofreciendo resultados más rápidos y precisos.

Especificaciones y Métricas de Rendimiento

Procesador Telum II:

  • Ocho núcleos de alto rendimiento a 5.5 GHz
  • 36 MB de caché L2 por núcleo
  • Aumento del 40% en la capacidad de caché, totalizando 360 MB
  • Caché de nivel 4 virtual de 2.88 GB por cajón de procesador
  • Acelerador de IA integrado para inferencia de alto rendimiento y baja latencia
  • Aumento de cuatro veces en la capacidad de cómputo por chip en comparación con la generación anterior

Acelerador Spyre:

  • Capacidad escalable con hasta 1 TB de memoria
  • Compatible con ocho tarjetas de un cajón IO normal
  • Diseñado para no consumir más de 75 W por tarjeta
  • 32 núcleos de cómputo
  • Admite tipos de datos int8, fp8 y fp16 para aplicaciones de IA de baja latencia y alto rendimiento
Redacción ebizLatam
Redacción ebizLatamhttp://www.ebizlatam.com
Desde la redacción de ebizLatam gestionamos todos los contenidos del portal pionero sobre tecnología y negocios América Latina.
ARTÍCULOS RELACIONADOS

DEJA UNA RESPUESTA

Por favor ingrese su comentario!
Por favor ingrese su nombre aquí

mas leídas