Review da ATI Radeon HD4870, da PowerColor

Publicado em 21/09/2008, 00h13 por Abel Alves
Modificado pela última vez em 20/09/2008, 18h08.

Arquitetura RV770

A arquitetura da série 4800 da ATI/AMD sofreu uma série de modificações em relação aos projetos anteriores. Vamos detalhar os componentes principais da arquitetura, batizada pela ATI/AMD de RV770. Começamos pelo diagrama completo:

Figura 1

Figura 1

Na parte mais à esquerda do diagrama podemos ver 10 grupos. Esses grupos são chamados de “SIMD cores”, ou seja, é como se fossem 10 processadores gráficos trabalhando em paralelo e manipulando várias informações com apenas uma instrução (SIMD é a sigla de Single Instruction Multiple Data).

Cada “SIMD core” é composto por 16 grupos de 5 unidades. Cada um desses grupos de 5 unidades é chamado de “Streaming processor”. E cada unidade do grupo de 5 é chamada de “Streaming processor Unit - SPU” ou unidades para processamento gráfico. Assim sendo, temos 80 SPUs para cada “SIMD core”. São as SPUs que manipulam os dados gráficos propriamente ditos. A figura 2 a seguir mostra um grupo de 5 SPUs de forma mais detalhada (notem que são 16 grupos de 5 SPUs por SIMD core).

Figura 2

Figura 2

Voltando à figura 1, vemos que cada SIMD core tem acesso:

  • a uma área de memória local compartilhada (Local Data Share - LDS)
  • a uma unidade de textura (Texture Unit)
  • a uma área de memória cache L1 para texturas (L1 TC)

Essas escolhas fizeram com que o processamento ficasse bem mais rápido, pois não se gasta muito tempo escrevendo/lendo dados na memória de vídeo principal. As informações gráficas mais utilizadas são armazenadas em uma das quatro áreas de memória disponíveis dentro da GPU: LDS, L1 TC, Vertex Cache (VC) ou ainda o Global Data Share (GDS).

Vamos examinar agora as Unidades de Textura (figura 3). cada uma dela possui quatro unidades de endereçamento e quatro unidades de filtros de textura. Essa relação um para um evita problemas com latência da memória cache. Cada “Streaming processor - SP” (grupo de 5 SPUs) pode fazer uma busca na memória pode ciclo de clock. Como temos 160 SPs podemos fazer 160 buscas na memória a cada clock. Impressionante!

Figura 3

Figura 3

As Unidades de Textura são ligadas a uma área de memória cache L1 para texturas (L1 TC) por um canal com 480 Gbps de banda (figura 4). É bom lembrar que cada L1 TC está ligado a uma Unidade de textura e a um SIMD core.

Figura 4

Figura 4

Os caches nível 2 (L2) são ligados aos caches nível 1 (l1) através de uma “crossbar” com banda de 384 Gbps. A ATI dividiu os caches L2 em quatro “partições” de memória para melhorar a sua eficiência. Cada partição está ligada a um controlador de memória (MC). (figura 5)

Figura 5

Figura 5

Com a arquitetura RV770 a ATI/AMD abandonou o antigo padrão de barramento em anel (”ring bus”) para adotar um novo barramento de comunicação entre a GPU e o exterior chamado de barramento “chaveado”(”switched bus”). Isso permitiu uma melhor distrinuição física dos componentes da GPU e um melhor aproveitamento do mesmo. Através de um “Hub” (concentrador) cada um dos componentes pode usar todos o barramento de uma só vez, maximizando o desempenho. A figura 6 mostra uma comparação entre a nova arquitetura RV770 e o antiga RV670.

Figura 6

Figura 6

Falaremos agora sobre o consumo da nova arquitetura (RV770). Através do uso de uma técnica chamada de “clock gating” onde partes do processador são “desligadas” quando não estão sendo usadas, a ATI/AMD conseguiu reduzir bastante o consumo da sua GPU. Na verdade o desempenho por watt, ou seja, a relação entre consumo e desempenho da placa quase quadriplicou em relação à arquitetura anterior. Mesmo assim a placa HD 4850 consome cerca de 110W e a HD 4870 chega a 160W. Haja fonte de alimentação! A figura 7 mostra a melhoria de consumo quando se usa o clock gating.

Figura 7

Figura 7

O processo de fabricação usado pela ATI/AMD para as GPUs da série 4800 é de 55 nm (nanômetros) isso faz com que o consumo também seja menor. A GPU da ATI/AMD tem 956 milhões de transistores que ocupam 260 mm2 enquanto que a GPU da série GTX 200 da NVidia tem 1,4 bilhões de transistores ocupando 576 mm2. Essa diferença é significativa, pois a série 4800 ATI/AMD consegue desempenho equivalente à série GTX 200 da NVidia. E como ocupa menos espaço, dá para fazer mais chips por wafer fabricando. E isso leva a um preço menor, que é o grande trunfo da ATI/AMD na briga por mercado.

A placa HD 4870 da ATI/AMD introduziu uma nova tecnologia para as memórias de vídeo. Como a arquitetura RV770 foi feita para trabalhar com uma grande largura de banda de memória a ATI/AMD lançou mão da tecnologia GDDR5, que permite a transferência de 4 dados a cada ciclo de clock. Assim, uma memória GDDR5 funcionando a 900 MHz tem o desempenho de uma funcionando a incríveis 3600 MHz. Faça a conta: 256 bits (32 bytes) x 4 x 900000000 = 115,2 Gigabytes/segundo de largura de banda! Além disso a GPU é capaz de executar 1 trilhão de operações em ponto flutuante (1 TeraFLOP). Em 1997 eram necessários quase 10000 processadores Pentium II para conseguir 1 TeraFLOP de capacidade!

Páginas: 1 2 3 4 5 6

Sobre o autor

Abel Alves. Sou natural do Rio de Janeiro, residindo atualmente em Maringá, no Paraná. Formei-me em Engenharia Eletrônica pelo Instituto Militar de Engenharia (IME) em 1988. Em 1992 obtive o título de Mestre em Ciências pela mesma instituição. “Emendei” um Doutorado na PUC-RJ, mas abri uma empresa de informática em 1996 e não tive mais tempo para o curso. De 1992 até 1996 fui professor do IME e também da PUC-RJ. Já em 1994 comecei a escrever uma coluna chamada Solucionática no Jornal do Brasil. Depois disso não parei mais de escrever em tudo quanto é publicação: revistas, outros Jornais, etc. Trabalhei também em TV como consultor e comentarista do programa Hipermídia (GNT-Net) e também no site de Tecnologia de Informação TCInet da Editora Abril. Em Maringá, além de dedicar mais tempo à minha família, sou professor do Centro Universitário de Maringá (CESUMAR) onde leciono cadeiras ligadas à Informática e Engenharia e estou terminando o Doutorado em Engenharia na UEM.

Comentários

12 comentários para “Review da ATI Radeon HD4870, da PowerColor”
  1. Gun'ss  Add rating 0  Subtract rating 0  

    só acho que poderia ter testado em mais jogos!
    ja que não tem, poderia ter convertido alguns filme em H.264!

    foi mal ai mas a HD2600XT não chega nem a 20% da performace da HD4870!

    realmente a ATI acerteu nessa geração! parabens!

  2. Abel Alves Time Guia do PC Time Guia do PC  Add rating 0  Subtract rating 0  

    Não pude ficar muito tempo com a placa. Testei o que pude aqui em casa. Ficamos devendo uma análise melhor nos jogos, mas pelo menos fizemos os teste sintéticos mais importantes.
    Como eu não jogo a 2600XT dá e sobra pra mim!

    []

    Abel

  3. Matheus Bonela  Add rating 0  Subtract rating 0  

    Caramba, isso sim é um sonho de consumo! Essa placa deve ser MUUUUUUITO cara, mas o desempenho é estrondoso. Além disso, ela provavelmente é mais barata que uma equivalente da NVidia. Muito boa placa!

    Parabéns pela review, Abel!

    []’s!

    • Abel Alves Time Guia do PC Time Guia do PC  Add rating 0  Subtract rating 0  

      A 4850, com tecnologia semelhante, custa U$ 170,00 e a 4870 sai por U$ 260,00. Tudo isso nos EUA. Até que não é tão caro…

      []’s

      Abel

  4. Arthur Astaroth  Add rating 0  Subtract rating 0  

    Abel e suas ótimas reviews como sempre!

    Com certeza a placa é um sonho de consumo de cada um, como o Matheus já disse, o preço é salgadinho, salgadinho…

    Não hesitaria em trocar ela pela minha R9550 :D

    []’s

  5. Gun'ss  Add rating 0  Subtract rating 0  

    HD4850 ja encontra-se por 500 reais

    HD4870 ja encontra-se por 750~800 reais

    • Arthur Astaroth  Add rating 0  Subtract rating 0  

      Isso só a placa, no meu caso, tenho que trocar todo o sistema. =/

  6. rod.stuchi  Add rating 0  Subtract rating 0  

    Alguém saberia dizer se esses 160W de consumo é operando no máximo FULL, me disseram que ela consome 35W em IDLE, alguém sabe dizer até onde isso é verdade?

    • Abel Alves Time Guia do PC Time Guia do PC  Add rating 0  Subtract rating 0  

      160W é em full. Em idle não chega a 50W.

      []’s

      Abel

  7. Herculles  Add rating 0  Subtract rating 0  

    Gostei muito do review sobre essa HD 4870, parece ter um desempenho muito bom e também conta com uma tecnologia interessante! Parabéns… Bem, não tenho muito que falar a respeito! Abraço.

  8. Davi  Add rating 0  Subtract rating 0  

    Nossa… eu tenho uma identica e no 3dmark 2006 deu 15280… nao vi o artigo completo mas qual o pc q foi testado? Houve “gargalo” no processador talvez? Deu praticamente o dobro aqui em casa :S

  9. Fernando  Add rating 0  Subtract rating 0  

    Eu comprei essa placa mas ela nao está sendo reconhecida. O que que pode estar acontecendo?

Escreva um comentário

Pronto para dar sua opinião? Caso queira uma foto para exibir no seu comentário, envie uma imagem de sua preferência para o serviço Gravatar.

XHTML: Você pode utilizar as seguintes tags XHTML para formatar seu comentário: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>