AMD: Arquitectura de los GPUs Radeon HD 7000 Series – Parte 3

AMD: Arquitectura de los GPUs Radeon HD 7000 Series – Parte 3

por

diseño y comparación con la arquitectura de otros GPUs y CGPUs actuales

En los 2 primeros artículos tratamos primero la introducción y luego una breve exploración de la nueva arquitectura usada en los próximos GPUs AMD Southern Islands (Graphics Core Next o GCN), los que posiblemente salgan a la venta con el nombre comercial de AMD Radeon HD 7000 Series. Aunque había comentado que la 2º parte daba por concluida la seria de artículos sobre la Southern Islands, la aparición de nueva información me hizo replantear dicha decisión así que sin más preámbulo da inicio la tercera parte, en la que trataremos sobre el diseño del chip.

Diseño de los GPUs AMD híbridos SIMD-VLIW

La vieja arquitectura híbrida SIMD/VLIW tenia 2 partes muy diferenciadas: el núcleo gráfico y las unidades Stream; donde el núcleo gráfico estaba conformado por el motor gráfico, el cual a su vez contenia las unidades de rasterizado, tesselado, geometria y vertex; las unidades Stream estan conformadas por los motores SIMD, los que a su vez agrupan 16 procesadores cada uno conformado por 5 unidades de cálculo VLIW (VLIW-5D) o 4 unidades de cálculo (VLIW-4D) con los que tenemos que cada motor SIMD contiene 80 procesadores (VLIW-5D) o 64 procesadores (VLIW-4D), junto a los procesadores Stream tenemos a las unidades de textura (4 por cada motor SIMD).

Diseño de los GPUs Southern Islands (híbridos MIMD-SIMD)

Los nuevos GPUs AMD Southern Islands están conformados por el núcleo gráfico (el que integra el motor gráfico y varias unidades descritas en la 2º parte de este artículo), y las unidades escalares vectoriales, compuestas por 1 o más bloques denominados Compute Units Arrays (CUA), donde cada CUA está conformado por 4 Compute Units (CU), donde cada CU posee un procesador escalar, un procesador Filter (el que suple a los TMUs), unidades Cadence, de cálculo de direcciones y 4 unidades SIMD vectoriales, donde cada unidad escalar está a su vez compuesta por 16 procesadores ALU (16-Wide), cada uno de estos procesadores incorpora la tecnología Simultaneous Multi-Threading (SMT) y es capaz de ejecutar 10 hilos (threads) de procesamiento (una especie de HyperThreading de 10 vias) lo que AMD llama procesar hasta 40 wavefronts (grupo de 16 instrucciones) por CU; además estas unidades SIMD escalares pueden a su ves procesar tanto instrucciones SIMD y MIMD.

Motor SIMD 16-Wide en Southern Islands

Compute Unit (CU)

Núcleo Southern Islands FSA

Similitudes entre Southern Islands – Northern Islands VLIW-4D – Fermi – Larrabee

Una vez visto el esquema de Southern Islands no podemos dejar de pensar en lo similar que luce en muchos aspectos y características a los chips de sus competidores Nvidia (Fermi) e Intel (Larrabee), donde un CUA (Compute Unit Array) luce muy similar a un GPC (Graphic Processing Cluster) de Fermi (aunque sin las partes del motor gráfico), un CU (Compute Unit) luce muy similar a un Streaming Multiprocessor (SM) de Fermi (pero sin la unidad de Tesselado), y los SIMD escalares muy similares a la unidad ALU 16-Wide vectorial de Larrabee de Intel, la que coincidentemente también usa tecnología SMT (aunque de 4 vias); aunque a su vez aún mantiene el front-end con cierta independencia del back-end y el uso de 2 unidades de tesselado, lo que nos recuerda en algo a Northern Islands VLIW-4D (Cayman), aunque la similitud se termina allí, pues el nuevo motor gráfico contine una nueva serie de unidades de cálculo independiente y motores de cómputo asíncronos.

núcleo Nvidia fermi GF110

Unidad vectorial 16-Wide de Intel larrabee

GPU AMD Northern Islands (Cayman)

Continúa en la y última parte dentro de algunos minutos.

Fuente: EVOLUTION OF AMD GRAPHICS (AMD)

Fuente: AMD’s Graphics Core Next Preview: AMD’s New GPU, Architected For Compute (Anandtech)

Fuente: AMDが技術カンファレンスで新GPUのベールを剥ぐ (PC Watch Impress)