Todo lo que sabemos de Intel Nehalem

Todo lo que sabemos de Intel Nehalem

por

Intel renueva su oferta en dos pasos: un año cambia arquitectura, al año siguiente la reduce. Ya que el Penryn fue reducción del Conroe, el cambio siguiente, Nehalem, será cambio de arquitectura. En este artículo, intentaremos condensar los cambios más importantes que traerá esta renovación.

Intel Nehalem

Nehalem será el primer cambio importante de arquitectura desde que Intel se renovó a sí mismo con el lanzamiento de Core en el 2006, y a pesar de que no estamos frente a un cambio tan drástico como fue la partida de Netburst, Nehalem trae consigo muchas sorpresas que incluyen la resurrección del Hyper-threading y el fin del sistema de FSB junto con el modelo de Northbridge / Southbridge al que nos tenía acostumbrado la compañía.

Estos cambios merecen algunas explicaciones antes de que nos veamos saturados de información a medida que se acerque el lanzamiento oficial de esta nueva arquitectura, y en este artículo discutimos todo lo conocido y rumoreado en torno a Nehalem.

 

El tick-tock de un Intel que no se cansa

Desde el 2005 que Intel viene ejerciendo su campaña de renovación “Tick tock”, un reloj imaginario que avanza año a año, y en el que cada “Tick” representa una reducción y optimización en el proceso de manufactura de sus procesadores y cada “Tock” la introducción de una familia completamente nueva.

El pasado 2007 fue un año “Tick” con la entrada de Penyn y su proceso de 45 nm junto con la producción de transistores con high-k y metal gate además de las nuevas instrucciones SSE4.1, mejoras interesantes pero que no marcaban ningún cambio especialmente revolucionario. El 2008 será un año “Tock”, el que nos interesa en este artículo y que define la entrada de nuestro protagonista, Nehalem.

 

Adelantándonos a los resultados netos, Nehalem promete entre un 20 y un 100% de mejora de rendimiento sobre Penryn en ambientes de múltiples hilos (threads), mientras que el beneficio en programas lineales estaría en el rango de 10 – 25%. El consumo de energía de la nueva arquitectura sería aproximadamente 30% inferior a Penryn a una potencia de cálculo fija.

Un dato notable es la reincorporación de SMT (Simultaneous multithreading) en un procesador de Intel, esta tecnología, más conocida por el nombre comercial de una de sus implementaciones en la época del Pentium 4, el Hyper-threading, le permite al procesador mezclar dos threads en el pipeline (cortados “a pedazos”) para aprovechar la latencia de acceso a RAM y aumentar la eficiencia del sistema. La implementación de SMT de Nehalem aún es desconocida, pero se sabe que mantendrá el límite de dos hilos simultáneos por la complejidad electrónica que implica aumentar este número. Considerando que Nehalem llegará hasta los 8 cores, se presume que podrá procesar hasta 16 hilos a la vez con la ayuda de SMT.

La última mejora a grandes rasgos de Nehalem es la introducción de las instrucciones SSE4.2, diseñadas para optimizar la transmisión de información y acelerar las operaciones sobre bases de datos.

 

 

Esta nueva familia sigue trabajando sobre la microarquitectura Core, pero con fuertes cambios que incluyen un controlador de memoria integrado, un nuevo sistema de comunicación al estilo HyperTransport que viene a reemplazar al FSB y bautizado como QuickPath Interconnect (QPI) y, a largo plazo, la inclusión de una GPU en el mismo chip que el procesador, plataforma que eventualmente competirá con Fusion de AMD.

Estos cambios son radicales desde un punto de vista arquitectónico, e implementarlos todos de una vez resulta imposible, o por lo menos poco recomendable dada la poca experiencia que tiene Intel con estos temas, así que veremos una entrada “por partes”, reflejada a grandes rasgos en este calendario para los próximos dos años.

 

En la tabla podemos ver como estará la situación hacia el tercer trimestre del 2008, con Penryn en sus sabores dual core Wolfdale y quad core Yorkfield plenamente masificados. A partir de este punto veremos primero la entrada del procesador de gama alta Bloomfield sobre la plataforma Tylersburg, luego tenemos la introducción de Lynnfield a comienzos del 2009 destinado a mercados algo menos exigentes para terminar con Havendale a mediados del mismo año, siendo ésta la primera ocasión en la que veremos un IGP integrado en el procesador por parte de Intel.

La presencia de dos socket distintos, el misterioso chip “Ibexpeak” y el controlador gráfico integrado confunden a primera vista, pero a medida que cubramos cada segmento la evolución de Intel será más intuitiva, pero antes que eso ocurra tenemos que hacer una escala en la tecnología QPI.

 

QuickPath Interconnect, sucesor del FSB

 

El sistema de comunicación actual utilizado por Intel y conocido como FSB, que ata a los núcleos del procesador entre sí y con el Northbridge, está quedando obsoleto ante la creciente necesidad de comunicación rápida e instantánea entre núcleos como también en el acceso a la RAM, algo que como consumidores finales aún no notamos prácticamente pero que no se hará esperar con la eventual introducción de los procesadores de ocho núcleos, hambrientos por ancho de banda.

La actualización al modelo de FSB vendrá de la mano de Nehalem y recibirá el nombre de QuickPath Interconnect (también conocido como Common System Interface, CSI), y ofrecerá interconexiones punto a punto entre procesadores y chips de alta importancia además de incorporar un controlador de memoria integrado al estilo del HTT de AMD. QPI estará especialmente enfocado en servidores de múltiples procesadores, hasta ahora ahogados por las limitaciones del FSB, y podrá conectar hasta cuatro procesadores de 2, 4 u 8 núcleos, lo que se puede ver en el dibujo que encabeza la sección.

Para usuarios convencionales y requerimientos más terrenales, QPI se encargará personalmente del ac
ceso a la RAM e incluso de los puertos PCI-Express destinados a tarjetas gráficas. La entrada de QuickPath Interconnect prácticamente elimina la necesidad de un Northbridge, y el nuevo modelo propuesto por Intel para soportar a Nehalem (y que veremos en un par de párrafos) refleja esto.

Bloomfield, el primer paso de Nehalem en la gama alta

 

La primera aparición oficial de Nehalem será el cuarto trimestre del 2008 a manos del núcleo Bloomfield sobre la plataforma Tylersburg, equipada con un chipset del mismo nombre. Bloomfield es un procesador quad-core monolítico con un TDP de 130 Watts y con sólo 8 MB de caché L2, una caída de los 12 MB del actual Yorkfield, pero que tendrá un menor índice de errores de lectura / escritura que este último (o sea, un mayor “hit rate”). Otro motivo que explica esta diferencia es que Bloomfield es un procesador quad-core monolítico, por lo que cada núcleo puede acceder directamente a los 8 MB totales mientras que en el caso de Yorkfield cada "bloque" de dos cores sólo dispone de 6 MB y tiene que accesar los otros 6 vía FSB.

Cada núcleo puede procesar dos threads a la vez gracias a SMT, por lo que Bloomfield debiera ser detectado como un procesador octa-core. La incorporación del SMT también obedece a otras razones, la más importante es que Bloomfield tendría un pipeline más largo que Conroe / Penryn, esto para disponer de un espacio más amplio para aumentar las frecuencias a futuro. El problema con esta solución es que en el caso de que ocurra un error de predicción en alguna de las etapas del pipeline se produce una penalización en tiempo al tener que esperar a que toda la cola se "desocupe", y mientras más largo el pipeline mayor es la espera. SMT permitiría tener por lo menos el pipeline parcialmente lleno y no tener que desperdiciar todo el ciclo. En resumen, SMT reduciría los tiempos "muertos", aumentaría la paralelización del código y permitiría aumentar frecuencias amortiguando el impacto colateral en rendimiento.

El modelo de Tylersburg es muy distinto a lo que propusimos con QPI, vemos que existe un NB común y corriente manejando cuatro puentes PCIe 8x (habilitando Quad-Crossfire) además de debutar un controlar de memoria DDR3 triple-channel capaz de manejar hasta 24 GB de RAM DDR3-1600. Sin IMC (Integrated Memory Controller) y sin controladores PCIe incorporados, la única aparición de QPI es en la conexión procesador – chipset.

Esta decisión por parte de los ingenieros de Intel busca disminuir los riesgos de producción y aumentar los yields, pero obliga a la utilización de un zócalo especial para Bloomfield, el Socket B, de tipo LGA y de 1366 pines.

Lynnfield, la entrada real de QuickPath Inteconnect

 

Sólo a comienzos del 2009 veremos la nueva plataforma detrás de Nehalem a toda su capacidad (incluyendo QPI) a manos de Lynnfield, procesador de cuatro núcleos capaz de procesar 8 threads simultáneamente gracias a SMT, con un TDP de 95 Watts y con los mismos 8 MB de caché L2 que Bloomfield.

El diagrama de la plataforma Lynnfield es mucho más acorde a lo que esperábamos inicialmente. Tenemos al procesador con un IMC DDR3 con soporte para dual-channel y conexión directa con un par de puertos PCIe 8x (o configurando sólo uno a 16x) destinado a tarjetas de video individuales o en CrossFire. Naturalmente, Lynnfield es incompatible con Bloomfield, por lo que un nuevo zócalo para desktop se hace presente, el Socket 1160.

Un poco más abajo del procesador nos encontramos con un chip bajo el nombre de Ibexpeak, que cumple las funciones del SB de otrora, pero en conexión directa con el procesador vía un lento enlace DMI (Direct Media Interface) con una velocidad de sólo 2 GT/s, pero es más que suficiente para las tareas de poca prioridad que tiene a cargo (puertos SATA, USB, PCIe de baja velocidad, etc.). Ibexpeak es el primero de una generación de nuevos chips con el nombre de Platform Controller Hub (PCH), dedicados al tipo de tareas recién discutidas.


Havendale, presentación oficial del chip gráfico integrado de Intel

 

Acercándonos a la mitad del 2009 nos encontraremos por fin con Havendale, la plataforma de Intel que inaugurará su entrada a los gráficos integrados en el procesador. Havendale -basado en el Socket LGA1160- tendrá sólo dos cores (que procesan hasta 4 threads gracias a SMP), un TDP de 75 Watts, soporte para memorias DDR3 en configuración dual channel y un controlador PCIe 16x para una tarjeta gráfica discreta.

La adición más notable de Havendale es su procesador gráfico integrado, que convivirá con los núcleos en una configuración SOC (System on a chip) y que tendrá soporte para DirectX10, Shader Model 4.0 y OpenGL 2.1, además de poseer una arquitectura de shaders unificados. Será capaz de decodificar los códecs AVC (H.264), VC-1 y MPEG2 a nivel de hardware gracias a la adición de un motor CABAC (Context-adaptive binary arithmetic coding) y, finalmente, sabemos que podrá reproducir contenido de alta definición proveniente de HD-DVD o Blu-ray a una velocidad de 40 Mb/s.

El chip gráfico enviará sus datos al mismo PCH Ibexpeak de Lynnfield vía un enlace Display Link, desde donde la imagen puede ser exportada vía medios análogos (VGA) o digitales (HDMI, Display Port, DVI, SDVO), esto último con soporte completo para HDCP.

Se presume que el PCH utilizado por los fabricantes en sus placas Lynnfield será totalmente compatible con los gráficos integrados de Havendale, pero existe la posibilidad de que esto no ocurra complicando ligeramente el panorama de la compatibilidad entre placa y procesador.


En resumidas cuentas…

Las tres “fases” de Nehalem que hemos visto se pueden condensar cómodamente en una tabla que resume las principales características de cada una.

 


Turbo mode, la guinda de la torta

Casi como nota al margen en el resumen de Nehalem aparece el "Turbo Mode", cualidad que le permite al procesador apagar parcialmente uno o varios de sus núcleos para realizar una suerte de Overclock  temporal en otro para acelerar el trabajo en operaciones de un sólo hilo sin romper el límite del TDP. Esta funcionalidad ya la vemos en los notebooks equipados con procesadores Merom generación "Santa Rosa" y en los Penryn de escritorio, pero al parecer ahora sería más avanzado y veríamos mayores aumentos de frecuencia.


Nehalem Mobile, el futuro de los procesadores para notebook

El panorama para los procesadores móviles de Intel no va a tener mayores remezones desde el lanzamiento de Penryn Mobile (en un par de días) hasta mediados del 2009, cuando Nehalem haga su aparición en este mercado bajo los nombres de Clarksfield y Auburndale, ambos utilizando una variante móvil de Ibexpeak.

 

Palabras al Cierre

En un par de años, Intel pasó de ser un anquilosado dinosaurio, preso de su propio invento Netburst y su vástago el Pentium 4, a ser el creador de un producto tan dinámico, rendidor y popular como el Core 2 Duo. Sin embargo, así como retomó el liderazo y las prefeencias de los usuarios, está obligado a mantenerse innovando y presentando mejoras, y nunca volver a dormirse en los laureles. Como hemos visto hoy, aunque la información en papel dista mucho de mostrar la incidencia real de los cambios venideros, en cuanto a innovación Intel no tiene intenciones de quedarse.

Esperamos que esta lectura les haya resultado interesante y que hayamos contribuido a aclarar el panorama de lo que se viene para Intel durante los próximos meses.

 
Atte, [VJ]

 

 

Fuente (y diapositivas): HKEPC

Comente este artículo