De acordo com uma publicação do TechPowerUp desta sexta-feira (30), a Microsoft revelou novos detalhes sobre o Maia 100, seu novo chip personalizado para inteligência artificial (IA), durante o evento Hot Chips 2024. A novidade é projetada especificamente para cargas de trabalho de IA em larga escala, e promete um grande avanço na infraestrutura de nuvem da corporação, oferecendo uma combinação de alto desempenho, eficiência energética e suporte a modelos de IA complexos em serviços como o Azure OpenAI.
O Maia 100 é construído utilizando o processo N5 da TSMC, com tecnologia de interposer COWOS-S, e é um dos maiores processadores já fabricados na arquitetura de 5 nm. O modelo é projetado para suportar uma variedade de cargas de trabalho de IA na nuvem, com foco na otimização da utilização de dados e eficiência energética.
- Microsoft É Acusada De Violar Lei E Pode Levar Multa Pesada Da União Europeia
- Microsoft E Reddit Não Chegam A Acordo, E Gigante Não Utilizará Dados Do Fórum Em IA
O processador integra uma SRAM (memória estática de acesso aleatório) de grande capacidade no chip e utiliza quatro módulos de HBM2E, proporcionando um total de 1,8 terabytes por segundo de largura de banda e 64 gigabytes de capacidade para atender às demandas de manipulação de dados em escala de IA.
Uma das principais inovações do Maia 100 é sua capacidade de suportar uma ampla gama de tipos de dados e fornecer alta velocidade de processamento para tarefas de treinamento e inferência de IA. O chip inclui uma unidade tensor de alta velocidade para processamento rápido de redes neurais, suportando tipos de dados de baixa precisão, como o formato MX, introduzido pela Microsoft.
Além disso, o lançamento possui um processador vetorial acoplado a um mecanismo DMA (Direct Memory Access) para suportar diferentes esquemas de sharding de tensores, permitindo maior eficiência no manejo de dados.
A corporação revelou também que a novidade utiliza interconexões baseadas em Ethernet, permitindo escalabilidade e flexibilidade em modelos de IA em larga escala, com suporte a criptografia AES-GCM para garantir segurança no processamento de dados.