La nueva arquitectura gráfica NVIDIA Maxwell

La nueva arquitectura gráfica NVIDIA Maxwell

por

NVIDIA se supera a si misma estrenando una nueva arquitectura que duplica el rendimiento por watt de Kepler.

Han pasado casi 23 meses desde el lanzamiento de los primeros GPUs Nvidia basados en la arquitectura gráfica Kepler, la primera arquitectura gráfica de Nvidia enfocada en cubrir tanto el segmento de las PC como el de los dispositivos móviles; por lo que cumpliendo con su calendario de lanzamientos bianual, hoy Nvidia presenta oficialmente su nueva arquitectura gráfica Maxwell.

De Kepler a Maxwell

Kepler es una arquitectura gráfica diseñada para cubrir casi todos los segmentos del mercado, desde dispositivos móviles hasta supercomputadores, por lo que a fin de cubrir tantos segmentos cuenta con un alto grado de modularidad, pudiendo ser adaptada y personalizada según requerimientos, dando nacimiento a 2 líneas de productos que aunque basadas en la misma arquitectura, cuentan con significativas diferencias:

  • Little Kepler: Variante enfocada a tareas gráficas conformada por unidades de cómputo optimizadas para operaciones de punto flotante de 32 (FP32) y 16 bits (FP16). – GPUs Little Kepler: GK104, GK106, GK107, GK208.
  • Big Kepler: Variante enfocada tanto a tareas gráficas como a aplicaciones aceleradas por GPU y conformada tanto por unidades de cómputo FP32 y FP16; así como unidades de cómputo FP64 (punto flotante de 64 bits) para aplicaciones intensivas y demandantes. – GPUs Big Keler: GK110 y GK110B.

Maxwell pretende llegar a un mayor número de segmentos que Kepler, por lo que Nvidia ha trabajado muy duro en mejorar la eficiencia y el rendimiento por watt de Maxwell, a fin de que esta nueva arquitectura sirva como el caballo de batalla de Nvidia que permitirá que ofrezcan una amplia variedad de productos con un mayor grado de diferenciación que el que fue posible con Kepler.

La nueva arquitectura gráfica ha sido diseñada con el fin de ofrecer productos gamer en todo tipo de factores de forma, permitiendo que Nvidia pueda adaptarse a los constantes cambios en las preferencias de los usuarios, muchos de los cuales prefieren los equipos de formato reducido pero sin escatimar en potencia gráfica, así como también Maxwell está listo para complacer al creciente segmento de los dispositivos móviles gamer y mini-consolas ¡sí que es difícil poder complacer a todos!

Los componentes de Maxwell

Al igual que las recientes arquitecturas gráficas lanzadas por Nvidia, Maxwell es una arquitectura modular, la que está conformada por los siguientes componentes:

  • Host Interface: Unidad encargada de leer los comandos gráficos enviados desde el CPU.
  • GigaThread Engine: Unidad encargada de encontrar los datos requeridos desde la memoria del sistema, para posteriormente copiarlos al framebuffer (vía controlador de memoria VRAM) y crear bloques de instrucciones que envía a cada GPC que conforma al GPU.
  • GPC (Graphics Processing Cluster): Unidad encargada de procesar los datos enviados desde la unidad GigaThread Engine y dividirlos en mini-bloques de 32 hilos de procesamiento, los que son enviados a la unidad SMM.
  • SMM (Maxwell Streaming Multiprocessor): Unidad paralela encargada de la ejecución de las instrucciones (vertex/pixel/geometría/cómputo) enviadas por la unidad GPC. Está conformada por 4 Shader Blocks.
  • Shader Block: Unidad básica de cómputo conformada por 32 ALUs (Shader Processors) administrados por una unidad de control dedicada.
  • Warp Scheduler: Unidad encargada de asignar tareas tanto gráficas como de cómputo acelerado por GPU a los ALUs (Shader Processors) que conforman el SMM.
  • Polymorph Engine: Unidad encargada de los cálculos geométricos/teselado.
  • ROP (Render OutPut): Unidad encargada de ejecutar cálculos concernientes a tareas pixel blending, alisado y operaciones atómicas de memoria.

Maxwell: ¿Qué mejoras ofrece por sobre Kepler?

Como toda nueva arquitectura gráfica, Maxwell ofrece una coherente mezcla entre nuevas características y otras que se mantienen sin cambios por sobre Kepler. Una de las cosas que se mantiene sin cambios es la decisión de Nvidia de no darle apoyo a las sub-versiones de DirectX: Maxwell continúa siendo un GPU DirectX 11.0, el cual no es compatible por hardware con DirectX 11.1 ni DirectX 11.2; aunque al igual que Kepler, es capaz de soportar algunas funciones de DirectX 11.2 vía software (DirectX 11.2 Tier 0).

Entre otras unidades y tecnologías que se mantienen sin cambios podemos mencionar a la unidad de teselado (Polymorph Engine 2.0) y a la tecnología GPU Boost 2.0 (importada de los GPUs Kepler de segunda y tercera generación).

En cuanto a los cambios, el primero a mencionar es la profunda reorganización que ha sufrido la unidad GPC (Graphics Processing Cluster), la que ha sido robustecida, ofreciendo un rendimiento bruto cercano al 130% superior al de los GPC de Kepler; gracias a su capacidad de poder controlar un mayor número de Streaming Multiprocessors (ahora denominadas Maxwell Streaming Multiprocessor “SMM”): hasta 5 SMM por GPC en Little Maxwell y hasta 8 o más en Big Maxwell.

Los SMM (Maxwell Streaming Multiprocessor) han recibido también significativos cambios, cambiando el viejo y complejo sistema de lógica compartida por hasta 192 shader processors por shader block, por un más eficiente y organizado esquema de 4 shader blocks, cada uno con su propio Warp Scheduler dedicado a sacarle el máximo provecho a los 32 ALUs y 2 unidades de textura que conforman a cada shader block… esto nos da un total de 128 shader processors por SMM (en Kepler teníamos 192 shaders por SMX).

Maxwell: Persiguiendo un mayor rendimiento por watt

Los principales autores del elevado rendimiento por watt de Maxwell son sus unidades SMM, las que ofrecen un rendimiento cercano al 90% del que ofrecen los SMX de Kepler, a la vez que ofrecen un consumo cerca de la mitad y ocupan un menor área de die.

Cada shader processor ha sido optimizado para tareas gráficas, ofreciendo un rendimiento 35% superior que el de los shader processor de Kepler.

Maxwell: Un mayor aprovechamiento de los recursos

Cada uno de los 4 shader block que conforman las unidades SMM, posee sus propias unidades de control y scheduling completamente independientes una de las otras, ello permite incrementar el paralelismo, a la vez que se simplifica el diseño del chip y se aprovechan mejor los recursos disponibles tanto en el GPU (rendimiento gráfico más cercano al máximo teórico gracias al menor número de shaders a controlar) como en el CPU (procesamiento más simple y con mayor paralelismo en la decodificación de instrucciones hacia el scheduler).

Nvidia ha mejorado también el subsistema de memoria caché de primer nivel (L1) en el SMX, el cual está conformado por 64KB de memoria de baja latencia, la cual está compartida entre todos los shader blocks, ofreciendo una gran flexibilidad (más recursos en tareas livianas y un rendimiento mayor en tareas intensivas).

Otra de las áreas en las que Nvidia ha mejorado es el subsistema de memoria caché de segundo nivel (L2), la cual ha reducido su latencia e incrementado considerablemente su capacidad (hasta 8 veces), consiguiendo convertirse en un arma para incrementar el ancho de banda del subsistema de memoria VRAM (Video RAM) principal, a la vez que reduce el consumo.

Las nuevas capacidades de video de Maxwell

Los GPUs basados en la arquitectura gráfica Maxwell incorporan también la nueva unidad de decodificación/codificación de video por harware NVENC 2.0, la que representa un salto significativo por sobre NVENC original (NVENC 1.0) introducido con la arquitectura gráfica Kepler.

La nueva unidad ENVENC 2.0 ofrece un rendimiento entre 50 y 100% superior (dependiendo del códec de video) al codificar video HD 1080P en formato H.264 y un rendimiento que duplica al de Kepler en la decodificación de video, además de brindar soporte a videos 3D en resolución 4K y soportar el nuevo modo de ahorro de energía GC5, especialmente diseñado para la reproducción de videos.

Menor consumo en configuraciones multi-monitor

Nvidia ha trabajado muy duro en los perfiles de energía presentes en sus GPUs basados en la arquitectura gráfica Maxwell, con el fin de reducir el consumo. Por ejemplo es común que los GPUs Maxwell dupliquen su consumo en modo 2D al conectárseles un segundo monitor, cifra que puede crecer al incrementar el número de monitores.

Los GPUs basados en Maxwell toman partido de nuevos perfiles y estados de energía diseñados expresamente para configuraciones multi-monitor (Nvidia Surround), por lo que su consumo sólo se incrementa en apenas cerca de un 50% en comparación con Kepler al conectar monitores adicionales.

Maxwell VS Kepler

Habiendo descrito las mejoras que ofrece la nueva arquitectura gráfica Maxwell por sobre Kepler, trataremos de trasladar todo lo expuesto a frías cifras en la siguiente tabla que hemos elaborado:

Conclusiones

Nvidia nos presenta una nueva arquitectura gráfica que permitirá toda una nueva serie de productos mucho más atractivos que los actuales basados en la desde este momento vieja (pero aún efectiva) arquitectura gráfica Kepler.

Maxwell de primera generación (GM10x Series) llega inicialmente dirigido a cubrir las exigencias de mercado para la gama baja (GM107 y GM108) de la serie de GPUs GeForce 700 Series; pues la empresa cree que una arquitectura gráfica no tiene por qué estar atada a una serie de productos en especial.

Posteriormente Nvidia promete lanzar futuros productos de gama media (¿GM206 y GM204?) y alta (¿GM200?) basados en una segunda generación de la arquitectura gráfica Maxwell, los que deben llegar entre julio y diciembre de este año.

La nueva arquitectura Maxwell promete mucho y el primer GPU Nvidia basada en esta nueva arquitectura “GM107” (lo detallaremos en otro artículo), es tan sólo un pequeño adelanto de lo que ofrecerá la futura arquitectura gráfica Maxwell de segunda generación dentro de algunos meses.

 

Fuente: NVIDIA Maxwell Whitepaper.

 

También pueden comentar en nuestro foro.