Por que usar Blocos de capacidade do EC2 para ML?
Com os blocos de capacidade do Amazon Elastic Compute Cloud (Amazon EC2) para ML, você pode facilmente reservar instâncias com computação acelerada para uma data de início futura. Os blocos de capacidade oferecem suporte a instâncias P5en, P5e, P5 e P4d do Amazon EC2, com tecnologia das mais recentes GPUs NVIDIA P4d Tensor Core, NVIDIA H200 Tensor Core e NVIDIA H100 Tensor Core, respectivamente, bem como a instâncias A100 fornecidas pelo AWS Trainium. Os Blocos de capacidade do EC2 são colocados em Amazon EC2 UltraClusters projetados para workloads de machine learning (ML) de alta performance. Você pode reservar instâncias com computação acelerada por até seis meses em clusters que medem de uma a 64 instâncias (512 GPUs ou 1024 chips Trainium), proporcionando flexibilidade para executar uma ampla variedade de workloads de ML. Os blocos de capacidade do EC2 podem ser reservados com até oito semanas de antecedência.
Benefícios
Casos de uso
-
NVIDIA
-
Arcee
-
Amplify Partners
-
Canva
-
Dashtoon
-
Leonardo.Ai
-
OctoAI
-
Snorkel