Ethernet suporta taxas de transferência de dados de 10 Mbps até 800 Gbps (Gigabit por segundo), com 1.6 Tbps (Terabits por segundo) chegando em breve. Essas velocidades são cruciais para lidar com os conjuntos de dados massivos que a IA normalmente utiliza.
- Capacidade de resposta em tempo real: Baixa latência é essencial para sistemas de IA. Ethernet minimiza atrasos, garantindo interações oportunas entre componentes como GPUs, CPUs e dispositivos de armazenamento.
- Tomada de decisões em tempo real: Ethernet permite tomada de decisão orientada por IA em tempo real. Sua alta largura de banda garante comunicação eficiente entre nós de IA.
- Rede sem perdas: A Ethernet tradicional pode perder pacotes durante o congestionamento, afetando a precisão do modelo de IA. No entanto, tecnologias emergentes prometem transmissão “sem perdas”, garantindo a integridade dos dados mesmo sob cargas pesadas.
- Global: À medida que os modelos de IA crescem em complexidade, a infraestrutura escalável se torna vital. A Ethernet permite expansão contínua conectando servidores e dispositivos adicionais. A Ethernet acomoda seu crescimento exponencial, garantindo conectividade e troca de dados eficientes.
- Interoperabilidade baseada em padrões: Garantir baixa latência e desempenho sem perdas é essencial para aplicações de IA que desejam maximizar os benefícios do Ethernet de terabit. A Teledyne LeCroy, portanto, oferece suporte a ambos os aspectos. Especificação do Consórcio Ultra Ethernet (UEC) e normas IEEE.
- Trilha de Soluções de IA e Experiência do Usuário:
Conjunto dedicado de funcionalidades licenciadas que oferece os recursos de teste mais avançados para verificar o uso do Ultra Ethernet em aplicações de IA.
(Saber mais)
O Ultra Ethernet foi projetado para atender às necessidades específicas de ambientes de IA e HPC, incluindo rajadas de tráfego sincronizadas, latência ultrabaixa, recuperação rápida de perdas e desempenho previsível em velocidades de até 1.6 Tbps (usando SerDes de 224G) e 3.2 Tbps (usando SerDes de 448G).
O Ultra Ethernet aprimora a arquitetura do Ethernet padrão com iniciativas como repetição na camada de enlace, gerenciamento avançado de congestionamento e comportamento de transporte otimizado por IA, para garantir um desempenho mais determinístico em condições reais de tráfego de IA.
A validação de redes de UE exige testes profundos e com reconhecimento de protocolo nos níveis de quadro, símbolo e estrutura. Desde a descoberta de capacidades usando extensões LLDP específicas de UE até a recuperação de perdas localizadas e o controle de fluxo inteligente, os testes Ultra Ethernet se concentram em garantir que os dispositivos interoperem de forma correta e consistente em implantações exigentes e de grande escala de IA e HPC.
A Teledyne LeCroy oferece soluções avançadas de hardware e software para testar o Ultra Ethernet usado em redes que executam aplicações de IA.
Isso inclui os geradores de tráfego Z800 Freya e Z1608 Edun, que podem gerar tráfego a velocidades de até 800 Gbps e 1.6 Tbps usando SerDes de 112G e 224G, e o SierraNet Analisador de protocolo M1288 para captura em taxa de linha completa e recursos avançados de interferência de até 800 Gbps.
Além dos recursos de teste abrangentes fornecidos como padrão com esses dispositivos, há também o Xena AI & UE Solution Track, que adiciona comportamentos de camada de enlace específicos do UE necessários para validar switches e xPUs habilitados para UEC. Isso inclui:
-
Tentativa de Reajuste da Camada de Enlace (LLR)
-
Controle de Fluxo Baseado em Crédito (CBFC)
-
Negociação da Camada de Enlace (LLDP para extensões de UE)
-
Controle de protocolo de UE com estado e troca de mensagens
-
Injeção de erros do UE, inspeção de mensagens e captura
Para saber mais sobre as diferenças entre as arquiteturas Ethernet de escalabilidade vertical e horizontal, a importância do Ultra Ethernet e o que é necessário para testar redes de IA de próxima geração com confiança, consulte
https://xenanetworks.com/ultra-ethernet-testing/
As arquiteturas de data center para cargas de trabalho de IA geralmente adotam uma estrutura spine-and-leaf, conectando milhares de aceleradores de IA e soluções de armazenamento por meio de infraestrutura de rede L2/L3 de baixa latência com velocidades de porta de 400 a 800 Gbps. RDMA sobre Ethernet Convergida (RoCE) é uma opção promissora para protocolos de transporte de dados de armazenamento.
- Ponte de data center (DCB): facilitar o transporte de pacotes RDMA de alto rendimento, baixa latência e perda zero (tráfego sem perdas) juntamente com o tráfego regular de melhor esforço (tráfego com perdas).
- Controle de Fluxo Prioritário (PFC): para evitar a perda de pacotes, solicitando que o remetente pause temporariamente o envio de pacotes quando um buffer fica cheio além de um certo limite.
- Notificação de Congestionamento (CN): RoCEv1 e RoCEv2 implementam uma sinalização entre dispositivos de rede que congestionam e que pode ser usada para reduzir a propagação de congestionamento em redes sem perdas, bem como diminuir a latência e melhorar a tolerância a surtos.
- Seleção de Tráfego Aprimorada (ETS): permitindo a alocação de uma largura de banda mínima garantida para cada Classe de Serviço (CoS).