Nesta segunda-feira, a NVIDIA apresentou ao público seu supercomputador de última geração, o DGX GH200. Esse equipamento é voltado para aprimorar aplicações ligadas à Inteligência Artificial (IA), incluindo linguagem generativa, sistemas de recomendação e análises de grandes conjuntos de dados.
O poder dos superchips GH200
O DGX GH200 conta com a inovação dos superchips GH200 Grace Hopper da NVIDIA. Utilizando o sistema NVLink Switch, 256 desses superchips são unificados para atuar como uma GPU única.
Com capacidade de processamento de 1 exaflop e 144 terabytes de memória compartilhada, o DGX GH200 ultrapassa em quase 500 vezes a memória de sua versão anterior, a DGX A100 de 2020. Além disso, a nova arquitetura do GH200 oferece 48 vezes mais largura de banda NVLink.
A revolução da interconexão GPU-CPU
Os superchips GH200 proporcionam um avanço significativo na interconexão entre GPU e CPU, eliminando a necessidade da tradicional conexão via PCIe. Em vez disso, eles combinam uma CPU NVIDIA Grace baseada em Arm com uma GPU NVIDIA H100 Tensor Core no mesmo pacote, conectadas através da NVIDIA NVLink-C2C.
Primeiros beneficiários do DGX GH200
Empresas de tecnologia de peso como Google Cloud, Meta e Microsoft estão entre as primeiras que terão acesso ao novo supercomputador da NVIDIA. Além disso, a empresa planeja fornecer o design do DGX GH200 como um modelo para provedores de serviços em nuvem e outros hiperescaladores.
Em um movimento ousado, a NVIDIA anunciou a construção de seu próprio supercomputador IA baseado no DGX GH200 para dar suporte ao trabalho de sua equipe de desenvolvimento. Batizado de NVIDIA Helios, o supercomputador contará com quatro sistemas DGX GH200, e a previsão é que esteja online até o final deste ano.