Presentación NVIDIA Parte 3 y final

Presentación NVIDIA Parte 3 y final

por

Nuestro RRPP, Metro concluye la tercera entrega (y final) del periplo de CHW en Brasil. Como único medio online chileno con presencia en el lugar, NVIDIA nos confió la tarea de transmitir lo que vimos, lo que aprendimos y lo que consideramos como la parte más importante de las 3 entregas.

Por si alguien estuvo en la legión extranjera y se lo perdió, aprovechen de leer también la primera y la segunda parte.

Presentación Sudamericana de G80, 680a y 680i.

Esta fue la última presentación del lanzamiento de los productos de NVIDIA, la más esperada, fue bastante larga ya que presentaron 4 productos en total. Nick Stam fue el encargado de hacer la charla su cargo en NVIDIA es Director de Marketing técnico.


NVIDIA Nforce 680a SLI

El primer producto presentado fue el Nforce 680a SLI para AMD Quad FX, esta plataforma fue presentada de una manera bastante especial, ya que como muchos habrán podido ver no es algo mainstream o para los entusiastas habituales enfocados en overclock y juegos.

Sin duda lo mas impresionante de esta plataforma son las especificaciones, esta placa madre soporta 4 GPUs alimentando a 4 pantallas, 12 puertos SATA para 4 volúmenes de RAID, SLI y Quad Ethernet o sea trae 4 tarjetas de red integradas.

Por ultimo un slide donde NVIDIA deja claro para quien esta enfocado esta plataforma, esta enfocada para el Entusiasta de multimedia, o sea la persona que necesita usar el PC para muchas operaciones simultaneas y que el rendimiento no baje, como editar videos, navegar por Internet, jugar etc.… En EE.UU. se usa mas tener un PC servidor que de ahí se reparte a varios otros PCs o artículos de electrónica, esta plataforma es ideal para ellos.

Arriba podemos observar una imagen de cómo se vera una placa Nforce 680a SLI, además de aparecer mas detalladamente las especificaciones, es la primera placa que soportara el socket L1 para los CPUs Quad FX de AMD, otras especificaciones impresionantes son las cantidad de puertos USB (10), los puertos PCI express soportan 2x16x mas 2x8x y además trae un PCI express 1x y un PCI normal 1x.


NVIDIA 680i SLI

Sin lugar a dudas la presentacion de Nforce 680i SLI fue la presentación mas agresiva, ya que como muchos sabemos la plataforma ideal para el entusiasta incluye sin lugar a dudas un procesador Intel Core 2 Duo, además si tomamos en cuenta que NVIDIA salio mucho antes que su competencia ATI, esta sin lugar a dudas es la plataforma mas poderosa del mercado hasta por lo menos la aparición de R600.

Pueden ver la diferencia con el slide de Nforce 680a SLI, en esta se puede apreciar claramente el enfoque de máximo rendimiento, se promociona: una plataforma para Intel de alto rendimiento, overclock extremo, el máximo rendimiento en juegos y una plataforma llena de características enfocadas para el entusiasta.

Luego vino una comparación entre Nforce 590 y Nforce 680i SLI, en la que sin lugar a dudas gana Nforce 680i SLI. De hecho NVIDIA llega a mostrar números bastantes elevados como un 2.7x de rendimiento cuando nos enfocamos en lo que a FSB se refiere, esto nos parece algo exagerado ya que seria un FSB de 2878MHz desde el default de 1066MHz, pero si se puede decir con bastante confianza que todas las Nforce 680i SLI pasan de 2000MHz de FSB. El cuadro anexo nos muestra que con esta placa madre podemos llevar a un Core 2 Duo 6300 a velocidades aun mas allá que el Core 2 Duo mas rápido del mercado actual.

Las características que NVIDIA dice harán a esta placa la preferida de los gamers y overclockeros son:

TCP/IP aceleration: Esta funcion sirve para quitarle carga al procesador así liberando valiosos recursos.

SLI EPP memory: Esta función sirve para que podamos sacarle todo el jugo a las memorias siempre que estas soporten EPP, esto va programado en el SPD de las memorias y básicamente incorpora más información en cuanto a timings para que la memoria funcione sin problemas a grandes velocidades.

NVIDIA link Boost: Esta función aumenta la velocidad de los puertos PCI express cuando estamos usando SLI lo que nos entrega aun mayor ancho de banda.

NVIDIA First Package: Esta funcion permite crear colas con los paquetes tcp. a los cuales por hardware algunos tendran prioridad, sobre otros. la idea principal de esto es darle prioridad a los juegos sobre a las descargas en general, asi no se perdera en rendimiento online en estos. tal cual como QoS. ahora esto sera hecho directamente por hardware seguramente configurable en los drivers

Dual Net Teaming: nos permite asociar dos conexiones independientes a banda ancha para obtener mayores velocidades de transferencia

Media Shield con RAID 5: esto nos permite obtener el mayor rendimiento y seguridad posible para nuestros discos duros.

SLI: nos permite poner 2 o mas tarjetas de video a trabajar en conjunto.


G80 el monstruo

El ultimo gran lanzamiento de este año, quizas algo adelantada a su epoca debido a que su maximo potencial solo podra ser descubierto una vez tengamos Windows Vista y su nuevo API Directx 10 disponible. Nick Stam estaba realmente emocionado por contarnos sobre este nuevo producto de NVIDIA, quizás sea porque G70 tenia aproximadamente 300 millones de transistores mientras G80 tiene aproximadamente 681 millones de transistores, esto es raro en gente que anda contando el mismo discurso por todo el mundo. Este artículo será más técnico ya que G80 fue cubierto en nuestro review sobre la 8800GTS de MSI.

*foto real de G80


Arquitectura Unificada

Si aun no te queda claro esto, si piensas que es un truco de Microsoft para vender Vista o si
es solo un truco del marketing, debes leer esto.

Primero que nada comenzaremos con una pequeña reseña de cómo se hacían las cosas antes.

Nosotros necesitamos renderear objetos tridimensionales, por lo tanto comenzamos con construir algún tipo de estructura que tenga superficie, la estructura usada es el triangulo ya que es rápido y fácil de computar. Cada triangulo se procesa, o sea, se transforma según su posición relativa y orientación al observador, cada cara del triangulo es computada para cumplir esto. El próximo paso es darle luz al triangulo, para esto se toman las caras transformadas y se les calcula luz dependiendo de la luz definida en la escena. Por ultimo ese triangulo debe ser proyectado en la pantalla para ser pasterizado. En el pasterizado al triangulo se le aplicaran efectos de shader y texturas.

El gran pero de esto es que un programador no tenia control directo sobre la transformación, iluminación y rendereo de píxeles debido a que todos los modelos de cálculo eran fijos en el chip, acá recién aparecen los Shaders. Existen píxel y vertex Shaders, estos le permiten al desarrollador programar cálculos de transformaciones, iluminación y funcionalidades de color en los píxeles. Cada Shader es “solo” un pequeño programa (código programable) que se ejecuta en el GPU que permite controlar el procesamiento de Vértices o Píxeles

El gran cambio de DirectX 10 y que trajo el cambio a arquitectura unificada es que los programadores ahora tendrán libertad para programar como quiera y no estarán limitados por un número fijo independiente de Shaders de píxeles o vértices. Además con esta nueva arquitectura se incorporo un nuevo Shader que es el de geometría, este es otra característica que entregara un gran salto en rendimiento, este nuevo Shader permite hacer operaciones primitivas en grupos de vértices con forma de triángulos, líneas y puntos que han salido del shader de vértices. El Shader de geometría puede hacer copias de las formas entregadas por el shader de vértices, por lo que puede crear nuevos vértices.

Ademas de poseer estos 3 tipos de shaders, los procesadores de stream le permite a G80 hacer cualquier tipo de calculo como si fuera un procesador multi uso, para esto NVIDIA ha desarrollado un compilador llamado CUDA que permite programar en C sobre el GPU.

En el slide que vemos arriba se muestra un esquema de la arquitectura unificada de NVIDIA, cada uno de los cuadros que se ven sobre el cache L1 es un procesador de Shader, si cuentan hay 16 (8×2) x 8 lo que nos da los 128 Shaders que trae la 8800GTX,similar al de ATI, en el sentido de que se pueden procesar varios threads o fragmentos por pipe, acá Nick Stam dijo algo clave estos packs de Shaders son escalables o sea G81 podría tener mas Shaders que “solo” 128 a su vez las hermanas menores todas serán basadas en un mismo núcleo solo que con menos packs de Shaders, luego hay una flecha verde que tiene el nombre Thread processor esto es bastante importante ya que permite hacer mas cálculos a los vértices dentro del pipeline del GPU.

Podemos apreciar que los shaders están compuestos por 8 bloques con 16 procesadores cada uno, además tienen cache L1 compartida, un bloque esta formado de 2 procesadores de shaders (cada uno consiste en 8 procesadores de stream) cada uno de los 8 bloques tiene acceso a cualquiera de las 6 caches L2 y a cualquiera de los 6 arreglos de registros de propósito general. Lo que nos lleva a que datos procesados por un procesador de shaders pueden ser usados por cualquier otro procesador de shader.

Cada TMU contiene una unidad de Sampling y dos de filtrado. La velocidad del filtro anisotropico bi-linear y 2x es de 32 píxeles por ciclo para cada tipo de filtrado. El filtrado Bi-linear de texturas FP16 es llevado a cabo a la misma velocidad, si se usa FP16 2:1 baja a 16 píxeles por ciclo. El filrate máximo de la 8800GTX es de 18,4 Gigatexels por segundo cuando se usan ambos filtros.

El subsistema de ROPs soporta todo tipo de antialiasing: multisampling, super-sampling y antialiasing de transparencia. Además de los estándares FSAA, el nuevo GPU ofrece 8x, 8xQ, 16X y 16xQ. El antialiasing de texturas en FP16 y FP32 es soportado completamente, por lo que los problemas que tenían las series Geforce 6 y Geforce 7 que no podían usar FSAA y FP HDR se han solucionado en la serie Geforce 8


Mejoras en la calidad de imagen

Por ultimo algunos podrían decir, todo esto solo trae mejoras en el rendimiento, pero la calidad de imagen de NVIDIA es inferior o no me satisface, bueno NVIDIA también hizo grandes mejoras en este aspecto, por ejemplo en Anisotropic Filtering hay un benchmark que mide que tan bien aplicado esto se encuentra, y da un mapeo de las desviaciones, a continuación una muestra comparativa entre la 7900GTX, X1900XTX y 8800GTX

Mientras los circulos de colores sean mas perfectos hay mejor aplicacion de los filtros anisotrópicos, podemos ver que la diferencia entre 7900GTX es gigante incluso siendo que la 8800GTX solo estaba en calidad de imagen default, mientras la 7900GTX estaba en alta, comparándola con la X1900XTX también hay una mejora siendo que nuevamente la 8800GTX estaba con calidad default y la X1900XTX en alta.

Comente este artículo