El visionario

El visionario

por

Hace un par de meses, Tbon escribió que el futuro del Opteron bien podrí­­a llamarse Dual Cachete.

Un interesante artí­­culo de hoy le da la razón: los procesadores dual core son un culo!


Amaneciste inspirado hoy

A decir verdad, amanecí­­ cagado de sueño y el problema persiste. Sin embargo, me resultó obvia la comparación cuando recordé el apodo de “dual cachete” ideado por Tbon.

El punto es que de aquí­­ al próximo invierno tendremos entre nosotros la verdad de la milanesa con respecto a los procesadores multi-core, empezando por los siamesí­­simos dual-core.

La importancia de estos dual core no es un tema que se pueda explicar en dos patadas. De hechoincluso contando a las personas que me caen mal, no creo que nadie pueda entender a patadas, pero la expresión se entiende verdad? A mi modo de ver, esto del dual core le abre la puerta a la masificación de las estructuras SMP -serial multi processing- ya no a nivel de estaciones de trabajo, clusters y bichos raros, sino al servidor de cualquier empresa mediana. Aunque no espero que a nivel de supercomputadoras se termine el negocio de los multiprocesadores, sino más bien que se enriquezca (pensemos en 16-way opteron para empezar), sí­­ creo que la llegada del SMP a un mercado más amplio terminará con ideas chantas como el HyperThreading. También pienso que la palabra “Enriquecerse” podrí­­a interpretarse como “Volverse parecido a Enrique”.

Las dos caras del traseros: el caso AMD

Sucede que el negocio de crear procesadores dual core no es para nada sencillo, por diversas razones.

Por un lado, la circuiterí­­a no está preparada para manejar dos procesadores… o al menos no tendrí­­a porqué estarlo. Aaaah, he ahí­­ la razón de que AMD tenga desde hace dos años un diseño de Hypertransport que permite una conexión extra. Nunca se usó, nunca se entendió, hasta que AMD dejó entrever, no sin una mueca burlona, que su cambio a dual-core le permitirí­­a usar, si es que no las mismas placas, al menos algo muy parecido y a costo marginal.

El problema, y esto no es menor, es que por mucho que el Hyper Transport soporte desde ya un segundo procesador, el controlador de memoria sigue siendo uno sólo. Finalmente esos dos núcleos compartiran un mismo canal de 128 bits. Ahora, cuánto influye eso? Así­­ al ojí­­metro, serí­­a razonable que la diferencia de performance entre un caso y el otro fuera comparable al aumento de performance que hay entre un Athlon 64 socket 754 y uno socket 939 a la misma velocidad, puesto que el segundo tiene dual-channel, lo cual equivale actualmente a unos 200 PR. Esto es, cabrí­­a esperar que, por ejemplo, un Athlon 64 3700+ dual core rindiera como dos 3500+ single core.

Esta equivalencia se basa tan sólo en un aspecto que no considera sinergias positivas ni negativas, y a la larga habrá que ver cuánto provecho le sacan los fabricantes de software. Esto equivale a decir que, si bien el lí­­mite teórico de dual core 3700+ = 2 X 3500+ es prometedoramente casi el doble, la amarga realidad es que veremos rendimientos menores, pero igualmente sabrosos.

Pese al inconveniente derivado de la interfaz de programación más compleja, y al cuello de botella del controlador de memoria, sí­­ cabe esperar que en tareas que impliquen la interacción entre ambos chips el rendimiento de un dual core sea muy superior a los sistemas duales tradicionales. Esto tiene mucho sentido porque de partida el camino es más corto y, aunque sea la explicación más infantil que se le pueda dar al asunto: sí­­, efectivamente la distancia hace que la conexión empeore, por mucho Hypertransport y PCI-X que se invente. La conexión entre los dos cores será tan rápida que se rumorea que sólo Shaka de Virgo será capaz de verla, pero eso es porque él domina el octavo sentido y si llega a abrir los ojos nos saca la cresta a todos. Vaya un saludo para Shaka de Virgo que se sacrificó tan dignamente para regalarnos una de las mochas que siempre soñamos ver.

El lado oscuro del intestino: El caso Intel

Cuando el mandamás de Intel -que no, no es Eduardo Intel, como cabrí­­a suponer- supo que AMD habí­­a adelantado trabajo en la idea del dual core a través de sus conexiones redundantes de Hyper Transport, se atragantó con el café, gritó obscenidades, se fue de hocico y durante la caí­­da intentó afirmarse de la secretaria, con tan mala suerte que le rajó el vestido corporativo revelando primero que la muchacha no llevaba ropa interior, y segundo que no era ninguna señorita sino un macho recio y peludo. Así­­ fue que la dulce muchachita que todos conocí­­an como Aimee resultó llamarse Jaime, un chileno oriundo de la calle San Camilo que hasta ese momento se consideraba afortunado y capaz de engañar a todo el mundo.

Una vez recompuesto el ambiente, intel decidió contra atacar y anunciar su propia versión de dual-core. Nota al márgen, en qué momento nos acostumbramos a ver a Intel como una firma reactiva frente a AMD? En fin. La respuesta de Intel tiene dos caras, como todo trasero.

Antes de analizar estas dos caras, permí­­taseme indicar un punto. A diferencia de AMD, intel todaví­­a utiliza un bus compartido para controlar la memoria. En el caso de AMD la conexión es punto a punto, mientras que en el caso de Intel es compartida. ¿Qué significa esto? Sin olvidar que para AMD el acceso a la memoria es, sin duda, un cuello de botella, la existencia de controladores de memoria propios de cada core alivia un poco la situación. En el caso de Intel, un dual core competirí­­a por el acceso a la memoria, de manera que aparte del cuello de botella, los cores se perjudicarí­­an entre sí­­ para tratar de destacar… o al menos esa es la ilustración que se me viene a la cabeza.

Dejando de lado la malsana competencia entre cores, el bus también representa un problema, puesto que al tener sobre sus hombros una carga mayor, se vuelve más complejo, por un lado, y tiene otros requerimientos energéticos, tanto así­­ que en el estado actual no podrí­­a mantener la frecuencia. Si no es así­­, entonces porqué si existen P4 a FSB 800, los Xeon duales no corren a más de 533 Mhz, y los Quad -Xeon a no más de 400 Mhz? Es porque un bus más atribulado no puede correr a la misma frecuencia que otro que entre comillas, se las tira todo el dí­­a.

Hasta ahora, el problema del cuello de botella de la memoria ha podido subsanarse agregando más caché a los chips. Al crear procesadores dual-core, desde ya crece el tamaño fí­­sico del CPU. El acceso a la memoria implicará aumentar el caché de cada uno, y vamos agrandando el chip. Al final empiezo a pensar que estos Xeon dual core serán como del porte de una coliza… y como estamos hablando de que este cambio es un culo, las colizas vienen de perillas.

Pero dijimos que Intel tuvo dos respuestas para la movida de AMD. Una mala y rápida, otra buena y lenta.

La rápida es el Paxville, simplemente dos Xeon pegados con cola frí­­a… bueno no, nunca tanto, pero básicamente eso, un CPU con dos cores equivalentes a los actuales. Esto, como dijimos, conlleva la pelea entre CPUs, el aumento de caché, etc. El lado bueno es que como el bus de Intel es desde ya compartido, un dual core debiera rendir en forma similar a un dual CPU. Esto habla bien de la escalabilidad y equivale a decir que si tienes una placa Xeon dual, y le chantas dos Paxville, el rendimiento esperable equivaldrí­­a al de 4 Xeon de los actuales…

La otra respuesta es algo más seria pero a todas luces era imposible hacerla madurar a tiempo como par
a contrarrestar a AMD. Esa respuesta se llamará Dempsey, que no se limita a chantar un segundo core sino que agregará la tecnologí­­a Core Arbitration Logic. Los cores no se pelean entre sí­­, sino que le piden información al Core Arbitration Logic, el cual intercede por ellos ante la memoria. De esta manera, la memoria sólo tiene que tratar con una petición a la vez, y por lo mismo no necesita rebajar el bus para poder atenderlos a todos.

El Dempsey, en teorí­­a, permitirá disfrutar el lado bueno de AMD y el Paxville al mismo tiempo. Por un lado, se podrá tener un sistema de, por ejemplo, 8 cpus dual core con el bus de un sistema de 4 no-duales, y el rendimiento de un sistema de 8 no-duales. Lo mejor de los dos mundos. Esto no quita que la memoria seguirá siendo cuello de botella por lo que no serí­­a raro ver latencias mayores a las óptimas para estas configuraciones.

Les quedó claro el tema? Al menos yo tendré que pegarle otra leí­­da.

Fuente: The Inquirer