AMD Bulldozer: Estimaciones de rendimiento

AMD Bulldozer: Estimaciones de rendimiento

por

cuál será el IPC que nos ofrecerá el próximo CPU de AMD

Hace 2 días desde Anandtech nos llegó el primer review sobre Sandy Bridge, revelando un gran desempeño, el cual muestra un IPC 10% superior que el de la actual arquitectura Nehalem, un incremento al performance que vendría a solidificar la supremacía de Intel. Hace casi un mes, John Fruehe, el director de marketing de productos para servidores y worsktation de AMD, nos reveló algunas cifras de rendimiento, afirmando que Bulldozer de 8 módulos (16 núcleos) tendría un rendimiento 50% superior que un Magny Cours de 12 núcleos a la misma frecuencia. Cifra que en un principio, no nos pareció impresionante. Ayer John Fruehe en un nuevo artículo nos brindó algunos detalles más sobre Bulldozer, los que nos servirán para hacer nuevas estimaciones.

Con los datos previos estimamos un IPC 12.5% superior que el de los actuales Deneb (K10.5), pero posteriormente a ello, AMD reveló detalles más profundos sobre Bulldozer; y con base a ello los de Citavia hicieron una nueva estimación de rendimiento con la cual situaban el IPC de Bulldozer en un 126% superior, una cifra demasiado optimista a mi parecer.

El nuevo artículo de John Fruehe, si bien trata de responder algunos aspectos pertinentes a dudas sobre lo que Bulldozer ofrecerá al sector servidores y workstations, reveló algunos datos más, al responder una pregunta sobre la superioridad de su ejecución multihilo por módulos (1 módulo=2 núcleos de enteros y 1 FPU compartido), comparada ante su ejecución multihilo al usar un único núcleo por cada módulo:

Sin ser demasiado específico sobre el real escalado a través de los núcleos en el procesador, permítanme compartir con ustedes lo expusimos en el evento Hot Chips. En comparación con CMP (Chip Multi Procesamiento  – en términos simplistas chip multi-núcleo donde cada núcleo tiene sus propios recursos) los dos núcleos de enteros en un módulo Bulldozer aportaría aproximadamente el 80% de dicho rendimiento. Pero, debido a que tienen recursos compartidos, brindan rendimiento a baja potencia y menor costo. El uso de CMP tiene algunos inconvenientes, entre ellos mayor generación de calor y mayor superficie de die. El calor puede limitar el rendimiento, además de consumir más energía. Háganse la pregunta, ¿preferirías tener un motor de cuatro cilindros que entrega 300 caballos de fuerza o un motor de seis cilindros que entrega 360 caballos de fuerza y consume menos combustible? La relación entre cilindro y caballo de fuerza para el motor de 4 cilindros es obviamente superior (75HP/cilindro vs 60HP/cilindro V6), lo que significa que cada cilindro proporcionará un mayor rendimiento. Sin embargo, apreciando al motor en general, usted está consiguiendo una menor producción total, y obtendrá una producción inferior a un costo mayor (mayor consumo de combustible).

Es decir, en un módulo Bulldozer, el rendimiento multihilo (2 hilos) corresponde al 80% del rendimiento monohilo (1 núcleo haciendo uso de todos los recursos compartidos del módulo para sí mismo), en otras palabras el rendimiento monohilo de un núcleo Bulldozer es 25% superior que el rendimiento que brinda cuando ambos núcleos comparten sus recursos. Si consideramos el cálculo anterior, donde el rendimiento de cada núcleo Bulldozer en multihilo era un 12.5% superior; tendríamos que Bulldozer tendría un IPC 40% superior que el de los actuales Deneb.

Otro detalle del artículo de John Fruehe, es que accidentalmente reveló que Bulldozer en sus versiones para servidores y workstations, vendría con 2MB de cache L2 dedicado para cada núcleo de enteros, dato que eliminó a los pocos minutos de publicar el artículo, pero que aún se pudo encontrar algunos minutos después de eliminado en el cache del buscador:

Link: A quick round of links (Citavia)

Link: “Bulldozer” 20 Questions, Round One y “Bulldozer” 20 Questions – Part 2 (AMD)