Conforme publicado pela Forbes na última segunda-feira (18), durante o Supercomputing 2024, a NVIDIA anunciou a disponibilidade de sua nova GPU H200 NVL PCIe, que chega para consolidar ainda mais a liderança da marca no campo da computação de alto desempenho (HPC) e inteligência artificial (IA).
Baseada na arquitetura Hopper, a placa é otimizada para cargas de trabalho muito intensas, como modelos de IA generativa e inferências em larga escala, destacando-se pelo uso de memória HBM3e ultrarrápida e uma largura de banda impressionante de 4,8 terabytes por segundo (TB/s).
- Apple M4 Max supera RTX 4070 e RTX 3080 Ti no Blender
- NVIDIA App chega para substituir o GeForce Experience, saiba mais
O H200 NVL é projetado para ser instalado em racks corporativos resfriados a ar, oferecendo flexibilidade para data centers que buscam eficiência energética. A solução utiliza ainda a tecnologia NVLink de última geração, permitindo comunicações GPU-GPU até sete vezes mais rápidas do que a interconexão PCIe de quinta geração, o que melhora o desempenho em tarefas como o ajuste fino de grandes modelos linguísticos e inferências complexas.
Além disso, a GPU é fornecida com uma assinatura de cinco anos para o NVIDIA AI Enterprise, um conjunto de ferramentas que acelera a implantação de modelos de IA em ambientes corporativos.
No mais, o H200 NVL apresenta um consumo energético reduzido, com um TDP máximo de 600 watts, sendo uma solução mais eficiente em relação ao modelo SXM, que exige refrigeração líquida.
Impacto no setor de IA e HPC
Por fim, o lançamento da GPU H200 NVL PCIe deixa bem clara a intenção da NVIDIA em seguir fornecendo hardware de ponta para IA e HPC, o que consequentemente continua deixando a marca cada vez mais em evidência no setor.
Com a capacidade de memória ainda maior e desempenho aprimorado, o chip atende às demandas de empresas que dependem de simulações avançadas e modelos de aprendizado profundo. A inovação chega num momento muito importante e que parece ter sido muito bem calculado pela verdinha, visto que se alinha à uma necessidade cada vez maior de eficiência e potência em soluções de computação para ciência, finanças e tecnologia.