Arquitectura Kepler: Lo que debes saber de la nueva NVIDIA GeForce GTX 680 y sus derivados

Hoy NVIDIA nos presenta su nuevo GPU GeForce GTX 680, el primer GPU basado en su nueva arquitectura Kepler, la cual remplazará a su actual arquitectura Fermi usada en sus populares GPUs GeForce 400 y 500 Series, y que nos trae muchas nuevas características enfocadas a incrementar su rendimiento en todos los apartados tanto gráficos como de cómputo, pero trayéndonos según la propia NVIDIA la mejor relación rendimiento por watt del mercado, constituyéndose en el GPU más potente fabricado hasta la fecha.

La arquitectura Kepler

Kepler es el nombre código de la nueva arquitectura de NVIDIA, la cual ha sido profundamente rediseñada desde sus cimientos a fin de ofrecer un gran poder de cálculo en geometría, teselado, y texturas; pero Kepler no ha sido diseñado únicamente para ofrecer un gran rendimiento, el consumo energético es otra de las áreas en la que Nvidia ha puesto gran énfasis, y a fin de conseguir el mejor balance entre ellas ha decidido realizar varios cambios, los que describiremos a continuación:

¡Adiós HotClock! ¡Hola GPU Boost!

HotClock es una tecnología estrenada en la arquitectura Tesla (Geforce 8000/9000/100/200/300) y también usada en la arquitectura Fermi (Geforce 400/500), y que permite a los shader processors (o CUDA Cores como los denomina Nvidia) funcionar al doble de la frecuencia del núcleo gráfico, pero el implementarla tenía un costo muy grande, pues se incrementaba considerablemente el consumo (2X), además de requerir duplicar las etapas del pipeline en muchas áreas del chip.

Kepler prioriza el rendimiento por watt, por lo que introduce un mayor número de procesadores (shader processors) junto a nuevas optimizaciones que en conjunto hacen innecesario a HotClock; es decir, en Kepler tanto el núcleo gráfico como los shader processors funcionan a la misma frecuencia, la que ahora varía dinámicamente gracias a la nueva tecnología GPU Boost, la cual gracias al uso de complejos algoritmos incrementa la frecuencia de funcionamiento del chip en un 5% o más dependiendo de la carga gráfica, ofreciendo un muy buen balance entre rendimiento y consumo.

¡Adiós SM! ¡Hola SMX!

Kepler, al igual que Fermi, es una arquitectura modular, cuya base son los Next Generation Streaming Multiprocessors (SMX), los que están conformados por un total de 192 shader processors cada uno, cifra muy superior a los 32 (GF110/100) y 48 (GF114/104/116/106/108/118/119) de los ahora “viejos” Streaming Multiprocessors (SM) de Fermi, pero las novedades no terminan allí, cada SMX posee una unidad PolyMorph Engine 2.0, la cual se encarga de procesar la geometría y teselado, ofreciendo un rendimiento que duplica al de las unidades PolyMorph Engine de Fermi. Por último y no por ello menos importante, cada SMX posee un total de 16 nuevas unidades de textura (los SM de Fermi poseen entre 4 y 8 unidades de textura por SM), las que poseen un modelo bindless, pudiendo acceder a más de 128 texturas simultáneas, y además realizan un menor uso del CPU.

GPCs reorganizados

En Fermi cada GPC está conformado por 4 SMs y una unidad de rasterizado; en Kepler, los GPC (Graphic Processing Cluster) sufren una nueva reorganización, ahora agrupan 2 SMX (Next Generation Streaming Multiprocessor) junto a una unidad de rasterizado; cada GPC realiza las principales funciones gráficas del chip; un GPU Kepler está conformado por 1 o más GPC, los que comparten el cache L2 y están gobernados por la unidad GigaThread Engine.

El nuevo controlador de memoria

Una de las tareas pendientes de Nvidia ha sido su controlador de memoria, el cual no soportaba altas frecuencias de funcionamiento; por lo que Nvidia ha trabajado muy duro para solventar este problema con su completamente nuevo controlador de memoria GDDR5 de Kepler, el cual fácilmente alcanza frecuencias superiores a 1.5GHz (6GHz efectivos), fuera de ello no hay muchos cambios, Kepler posee un controlador de memoria de doble canal (64 bits o 32+32 bits), donde cada controlador posee 8 ROPs y 128KB de L2, los que son de uso compartido por todas las unidades del chip.

Soporte multi-monitor

Por años los GPUs de Nvidia han estado limitados al uso de 2 monitores por GPU, Kepler resuelve ello, soportando un máximo de 3+1 monitores. pero ¿porque 3+1 y no 4? la respuesta a ello, es que un GPU Kepler soporta un máximo de 3 monitores bajo aplicaciones 3D o juegos; y además soporta un monitor adicional para su uso en escritorio de Windows (u otro sistema operativo soportado).

Nuevo motor de video acelerado por hardware

Kepler viene con el motor de video acelerado por hardware al que extra-oficialmente podríamos denominarlo VP6 (los GPUs Fermi poseen el motor VP4, con excepción de la Geforce GT 520 que posee el motor VP5); VP6 soporta resoluciones 4K y pantallas HDMI de 3GHz, además soporta audio surround multi-stream.

Unidad de transcoding por hardware NVENC

NVENC es la nueva unidad de encoding de video por hardware de Nvidia, la que pretende rivalizar con Quick Sync de Intel y VCE (Video Codec Engine) de AMD; a diferencia de Fermi donde el elcoding de video por hardware se realizaba usando el poder de cómputo de los shader processors usando el API propietario CUDA, Kepler usará su nueva unidad dedicada NVENC, la cual posee un rendimiento 4 veces superior y un consumo muy inferior.

PCI Express 3.0

Nvidia adopta el nuevo estándar PCI Express 3.0 (PCIe 3.0), el cual posee un ancho de banda teórico que duplica al del bus PCIe 2.0.

DirectX 11

Kepler mantiene el uso del API DirectX 11, a diferencia de su competidor AMD, Nvidia aún no ve necesaria la implementación de DirectX 11.1; aunque no se descarta que futuros GPUs de Nvidia (Geforce 700 Series) soporten dicha API, tal como ocurrió en los tiempos de los GPUs DirectX 10 (arquitectura Nvidia Tesla), cuyos exponentes fabricados a 40nm soportaron el API DirectX 10.1, inicialmente no soportado por sus primeros exponentes a 90 y 80nm.

Nuevos filtros y tecnologías

El nuevo motor gráfico de Kepler permite a Nvidia añadir nuevas características y filtros gráficos entre los que tenemos:

Adaptive VSync: Persigue eliminar el stuttering al desactivar automáticamente VSync si el rango de cuadros por segundo cae por debajo de los 60 FPS, activándolo únicamente cuando la tasa de cuadros por segundo supera los 60 FPS.
FXAA: Filtro de post-proceso que persigue conseguir una calidad de alisado similar a MSAA 4X, pero consumiendo menos recursos. Ahora oficialmente integrados al Panel de Control de los controladores Geforce/ION.
TXAA: Nuevo filtro de post-proceso que persigue conseguir la calidad de alisado de MSAA 8X (TXAA 1) y superarla (TXAA 2), pero consumiendo la cuarta parte de recursos.

El GPU Nvidia Geforce GTX 680

Luego de la extensa descripción de la arquitectura Kepler, nos enfocaremos en el primer GPU para escritorio fabricado a 28nm (TSMC) y basado en la arquitectura Kepler de Nvidia: Geforce GTX 680, el cual está basado en el núcleo GK104, chip conformado por un total de 1536 shader processors (4 GPCs, 8 SMXs) funcionando a 1006MHz (a 1058MHz gracias a su tecnología GPU Boost, y a 1100MHz en el modo GPU Boost Max), 8 motores de teselado, 128 unidades de textura, 32 ROPs, 2048MB de memoria GDDR5 con bus de 256 bits funcionando a 1502MHz (6008MHz efectivos). Hemos elaborado una tabla con sus especificaciones:

Con esto ya deberían estar interiorizados en la nueva arquitectura de NIVIDA, por lo que si les surgen dudas tan solo deben leer nuestro artículo. Ahora revisen nuestro análisis y prontamente el de la GTX 680, el que realizamos en colaboración con un sitio amigo.

También pueden comentar en nuestro foro.