Primeros detalles de la arquitectura gráfica Maxwell de NVIDIA (Actualizado)

Primeros detalles de la arquitectura gráfica Maxwell de NVIDIA (Actualizado)

por

NVIDIA apuesta por una nueva y mejorada arquitectura gráfica que cubra todos los segmentos del mercado.

Desde hace varias semanas se reporta que la próxima semana (18 de febrero) llegarán los nuevos GPUs Nvidia GeForce GTX 750 Ti y GeForce GTX 750, los primeros productos de la empresa basados en el núcleo gráfico Maxwell GM107 (arquitectura gráfica Maxwell).

La arquitectura gráfica Maxwell

Con su arquitectura gráfica Kepler, Nvidia introdujo significativos cambios por sobre su anterior arquitectura Fermi, cambios que le permitieron construir un GPU mucho más eficiente y listo para cubrir diversos segmentos del mercado, incluso el de los dispositivos móviles (el SoC Tegra K1 cuenta con un GPU Kepler), pero lamentablemente fracasó en este último segmento.

Nvidia no es de las empresas que se rinden ante sus fracasos, por lo que desde hace algún tiempo iniciaron el desarrollo de su nueva arquitectura gráfica Maxwell, la que ha sido diseñada con el fin de ofrecer una mucho mayor eficiencia energética que Kepler, haciendo posible su masificación en el segmento de los dispositivos móviles (segmento en el que Kepler fracasó), así como ofreciendo un mejor producto que Kepler en los segmentos GPUs para PCs de escritorio, portátiles/notebooks/ultrabooks/ultrathins; así como los segmentos estaciones de trabajo y servidores.

Las renovadas unidades SMM de Maxwell

Maxwell ha sufrido profundos cambios, desechando la organización interna basada en unidades SMX (neXt generation Streaming Multiprocessor) de Kepler, remplazándolas por las nuevas unidades SMM (Maxwell Streaming Multiprocessor); unidades que han sido re-organizadas a fin de responder a las cada vez mayores necesidades de poder de cálculo gráfico y menor consumo que exigen los usuarios, por lo que han sido optimizados a fin de incrementar su eficiencia en los tipos de tareas más comunes (cálculos de punto flotante de precisión media “FP16” y precisión simple “FP32”).

Kepler cuenta con SMX conformados por 192 shader processors, 16 unidades de textura (TMUs), una unidad de teselado (Polymorph Engine 2.0), memoria caché de primer nivel (L1) y un scheduler basado en host (software), configuración que le permite escalar su nivel de rendimiento, dependiendo la potencia del CPU instalado (aunque puede jugarle en contra si se acompaña un GPU Kepler potente con un CPU no muy poderoso).

Con Maxwell Nvidia persigue minimizar las deficiencias de Kepler a la vez que consigue incrementar su eficiencia energética, por lo que las nuevas unidades SMM de Maxwell cuentan con tan sólo 128 shader processors, 8 unidades de textura (TMUs), una unidad de teselado (Polymorph Engine 3.0), memoria caché de primer nivel (L1) y un scheduler por software (aunque mejorado en comparación con el de Kepler), el que logra una mayor eficiencia al tener menos datos que procesar y a la mayor eficiencia de cada shader processor.

Los shader processors estándar (FP16/FP32) de Maxwell han sufrido profundos cambios, los que le permiten ofrecer compatibilidad con el API gráfico Microsoft DirectX 11.2, gracias al que podrán realizar un uso más eficiente de los recursos, ahorrando ancho de banda a la vez que ofrece un mayor rendimiento y mayor eficiencia (se rumorea que estos nuevos shader processors son algo menos capaces que los de Kepler al momento de procesar cálculos de punto flotante de 64 bits en conjunto con los shader processors FP64 de Maxwell).

Las unidades GPC (Graphic Processing Cluster) de Maxwell

Los GPC de Maxwell se han robustecido, soportando hasta 5 SMMs (los GPC de Kepler estan conformados por entre 1 y 2 SMX), los que están conectados a una unidad de rasterizado (Raster Engine), encargada de gestionar las cargas gráficas. Cada GPC cuenta con una interfaz de comunicación directa con la unidad GigaThread Engine (encargada de gestionar los cálculos de cómputo acelerado por GPU, así como la carga gráfica que entregan cada uno de los GPCs que conforman al GPU y además cuentan con una interfaz que le permite comunicarse con el controlador de memoria del CPU para ofrecer direccionamiento de memoria unificado), 2MB memoria caché de segundo nivel (L2) y el controlador de memoria.

El controlador de memoria de Maxwell

El controlador de memoria de Maxwell es muy similar al de Kepler, pero ha recibido algunas mejoras enfocadas en reducir su latencia, proporcionando un rendimiento mayor que el de su antecesor.

Maxwell cuenta con múltiples controladores de memoria de doble canal, cada uno de ellos conformado por 2 controladores de memoria GDDR5 de 32 bits (2×32 bits = 64 bits), 8 unidades de renderizado (ROPs) y memoria caché de segundo nivel (L2, aún se desconoce la cifra exacta).

El controlador PCI Express 3.0 de Maxwell

Al igual que su antecesor, Maxwell cuenta con un controlador PCI Express 3.0 (PCIe 3.0), el que incorpora algunas mejoras enfocadas a ofrecer una inteligente gestión del tráfico (interesante para el direccionamiento de memoria unificado).

Que más ofrece Maxwell

Maxwell cuenta también con otras tecnologías sobre las que de momento no tenemos detalles, entre las que podemos mencionar:

  • GPU Boost 3.0 (ajuste de frecuencia dinámico).
  • VP7 (reproducción de video 4K acelerado por hardware).
  • NVENC 2.0 (encoding de video por hardware).
  • CUDA 5.0 (API de cómputo acelerado por GPU con mayor facilidad de programación).
  • Nuevos filtros y efectos gráficos.

El proceso de manufactura usado en la fabricación de Maxwell

Dados los continuos retrasos de TSMC con su proceso de manufactura a 20nm (se esperaba esté listo el año pasado), Nvidia ha optimizado su nueva arquitectura gráfica Maxwell de primera generación hacia el proceso de manufactura a 28nm de TSMC, proceso que actualmente cuenta con un muy alto grado de madurez.

Dada la amplia experiencia acumulada por Nvidia con este proceso, los GPUs Maxwell a 28nm ofrecerán un mayor rendimiento por Watt que Kepler, aunque ambos productos estén fabricados con el mismo proceso de manufactura a 28nm de TSMC.

Se espera que a fines de este año o a principios del próximo Nvidia lance una nueva generación de productos Maxwell fabricados a 20nm.

Maxwell GM107

El núcleo gráfico Maxwell GM107 será el primer GPU Nvidia basada en la nueva arquitectura Maxwell y conformará la nueva línea de productos Nvidia GeForce GTX 750 Series (GeForce GTX 750 Ti y GeForce GTX 750), productos que aunque se rumoreaba que contarán con 960 y 768 shader processors respectivamente; con los datos expuestos sobre la arquitectura Maxwell podemos afirmar que son incorrectos.

El error puede deberse a que las versiones actuales de la utilidad GPU-Z reportan incorrectamente 960 y 768 shader processors basándose en el número de SMM con los que cuentan los nuevos GPUs, pero tomando cada SMM como si se tratase de un SMX de Kepler (SMX = 192 shader processors) en vez de la de Maxwell (SMM = 128 shader processors). Aclarado lo anterior, la configuración de GK107 es:

  • 1 GPC (conformado por 5 SMM).
  • 640 shader processors (5 x 128).
  • 40 unidades de textura (5 x 8).
  • 2 controladores de memoria de doble canal (2 x 64 bits = 128 bits).
  • 16 unidades de renderizado (8 por controlador de doble canal 8 x 2 = 16).

Con estos datos tenemos que GeForce GTX 750 Ti tendrá 640 shader processors (5×128) y GeForce GTX 750 tendrá 512 shader processors (4 x 128).

Conclusiones

Aunque aún no tenemos las especificaciones completas sobre la nueva arquitectura gráfica Maxwell de Nvidia, los primeros datos sobre ella lucen prometedores, por lo que podemos esperar mucho de GM107, así como de los siguientes GPUs basados en Maxwell que lanzará Nvidia en los siguientes meses (se espera también a GM108, el que quizá esté conformado por 256 shader processors).

Maxwell ofrecerá lo último en tecnologías gráficas así como características que rivalizan ante las ofrecidas por Graphics Core Next 1.1 y 2.0 (Sea Islands y Volcanic Islands) de su rival AMD (como direccionamiento de memoria unificado y posiblemente una versión nativa PCIe de la tecnología SLI), factores que sin dudas beneficia a los usuarios, los que podrán tener mejores productos a precios competitivos.

De momento poco se puede decir sobre el rendimiento de Maxwell, salvo que sin dudas superará al de los GPUs Kepler que remplazarán ¿Por cuánto? Eso lo sabremos la próxima semana.

Links:

También pueden comentar en nuestro foro.